从2022年下半年到现在,我一共做了两个5G核心网切片项目,分别是面向电力和医疗行业的专网部署。之前虽然在4G核心网这块也有一些经验,比如PGW扩容、MME参数优化、CSFB接通率提升之类的,但真正开始接触5G核心网的时候,还是有点不太适应,尤其是切片相关的流程。
在实际部署过程中,我感触最深的有这么几点,拿出来写写,也算是一次梳理。
第一,“切片不是参数配置那么简单”。刚开始做第一个项目时,我们按照方案把S-NSSAI、DNN、SD等配置好,PDU session也能起来,以为就搞定了。但真正到业务验证环节,客户打来电话说“终端连上5G了,但业务访问不了”,我们查了半天才发现是UPF那边没有匹配到对应的routing rule,导致业务无法下发。
这个问题后来通过重配QoS rule解决了,但让我意识到一个问题:5G切片涉及的模块非常多,控制面(AMF/SMF)配置是一层,用户面(UPF)、策略面(PCF)、甚至DN网关的接入策略也必须配合起来,否则就是“看上去部署了,但不能用”。
第二,切片需要运营侧和业务方配合,不是运维一个人能搞定的。医疗行业那个项目,医院要用的业务IP段是一个特殊的私有网段,我们最开始是按公网配置的UPF出口,结果所有业务都出不去,还以为是NAT配置错了。后来才知道他们那个业务终端还要接第三方的影像服务器,必须内网互通。
最后是和业务方、网络侧、IT维护人员三方开会,一起确认了整个数据流路径,从终端打到gNB、走N3上UPF,再从UPF到企业出口网关,然后通过GRE隧道打回医院总部。在这个过程中,SMF和UPF的配合、PDU session的地址分配方式,以及策略下发的逻辑一定要非常清晰,否则会反复踩坑。
第三,有一次项目中我们遇到了PDU session失败率很高的问题,而且只出现在早上9点到11点。这种时段性问题很棘手,一开始怀疑是RAN侧拥塞,后来查RAN没问题,UE也能发起request,甚至NAS消息都正常。
我们抓了SMF日志,才发现有一批PDU session建立过程中,SMF拿不到PCF的policy,导致返回Reject。原因是PCF侧那时候在跑策略更新,响应慢,SMF端触发了timer。这个问题如果不是运营商的核心网工程师帮忙远程调试,我们真不太好排查。
从这个事情我深刻体会到,5G核心网的问题,很多是“跨模块协作问题”,靠单一日志是很难排查的,必须学会看系统间联动逻辑,特别是NAS + SBI +内部N接口要协同分析。
最后一个体会,是关于终端测试的。我们当时使用了几个常见的5G测试终端(比如某型号模组、安卓手机带专用APN),发现它们对于切片支持并不一致。比如同样配置S-NSSAI,有些UE要手动设置才能启用,有些自动读取网络下发的信息。终端对S-NSSAI的处理差异,直接影响你能否顺利建立session,甚至影响你部署的“切片是不是起了作用”。
后来我们统一要求测试终端升级固件、显式支持Network Slicing,才解决了“网络配置没问题但UE无法接入”的问题。建议在做切片类项目时,一定要准备几种不同品牌、不同模组的UE来交叉验证,别光看后台日志“session成功”就以为完事了。
总结一下,这两个项目下来,我最大的收获是:
切片是多维度协同的事情,不能只关注SMF;
网络资源策略要与实际业务路径结合考虑;
问题排查别只看一层,要追到UPF和PCF;
测试终端选型必须重视,甚至优先考虑。
如果你刚开始接触5G核心网部署,尤其是含切片的项目,我建议你一定要先在实验网自己完整跑一遍流程,把AMF到UPF之间的几个关键点都搞清楚。别等项目上线了才现场调试,那就被动了。
这些就是我目前对5G核心网切片部署的一些浅见,写出来和大家交流,如果你也遇到类似问题,欢迎留言探讨。
您即将访问的地址是其它网站的内容,MSCBSC将不再对其安全性和可靠性负责,请自行判断是否继续前往
继续访问 取消访问,关闭