深度解析 3GPP TR 21.917:17 Signalling optimisations (5G网络的“神经系统”调优)
本文技术原理深度参考了3GPP TR 21.917 V17.0.1 (2023-01) Release 17规范中,关于“17 Signalling optimisations (信令优化)”的核心章节。本章如同一位技艺精湛的“神经外科医生”,对5G网络的控制面——这个庞大而复杂的“神经系统”——进行了一系列精密的“微创手术”,旨在提升网络的效率、鲁棒性和智能化水平。
1. “亚健康”的困扰:一位O&M总工的“隐形战争”
在“滨海智慧新区”的网络运营中心(NOC),总工程师欧阳慧正面临着一场“隐形的战争”。智慧城市的5G网络已经全面投入运营,用户体验速率、时延等主要KPI都堪称完美。然而,在NOC后台的深度监控仪表盘上,一系列“亚健康”的指标,却让她夜不能寐。
-
“漫游信令风暴”:每逢国际贸易展,成千上万的海外商务人士涌入新区。NOC后台监测到,这些漫游用户的控制面信令开销异常之高,仿佛每个人都在与网络进行着一场“喋喋不休”的对话,占用了宝贵的核心网资源。
-
“微秒级的迟缓”:一次核心网UPF设备的例行软件重启,本应是“无感”操作,却总会导致周边区域数千名用户的业务出现零点几秒的瞬时抖动。每一次重启,都像是在网络平稳的心电图上,划出了一道刺眼的“毛刺”。
-
“糊涂账”的烦恼:财务部门抱怨,与漫游合作伙伴之间的计费数据,总存在着难以解释的微小差异,积少成多,每月都造成不小的商业摩擦。
-
“死板”的策略:城市的应用开发者们反馈,他们无法让网络根据应用的实时状态,动态地调整用户的策略。例如,当一个游戏App启动时,他们希望网络能立刻为该用户开启“低时延模式”,但现有的机制却响应迟缓。
“我们的网络,就像一个外表强壮、但神经系统却有些紊乱的运动员。”欧阳慧对她的团队说,“肌肉(用户面)很发达,但控制信号(控制面信令)的传递不够高效、不够精准、不够智能。这场战争没有硝烟,但它决定了我们网络的运营成本、稳定性和未来的智能化潜力。”
这场“隐形战争”的“兵法”,就写在3GPP Rel-17的第17章——“信令优化”。这一章,没有引入任何惊天动地的新功能,但它所做的每一处“调优”,都直击5G网络运营的“神经末梢”。
2. 漫游者的“优雅转身”:连接态漫游控制 (17.1)
欧阳慧的第一个战场,是“漫游信令风暴”。问题的根源,在于传统的漫游控制(SOR, Steering of Roaming)机制有些“一根筋”。
传统SOR的困境:运营商A(HPLMN)为了节省网间结算成本,希望将在其网络中漫游的、来自运营商B的用户,引导到与其有更优惠协议的运营商C的网络去。传统的做法是,运营商A通过后台信令,将一份“优选网络列表”发送给用户UE。但UE只有在进入IDLE(空闲) 状态时,才会去根据这个列表,重新进行网络选择。
The UEs in 5G may stay in connected mode for a rather long time, whole day or longer, without going to idle mode.
【深度解读】
问题来了:5G时代,用户(尤其是物联网设备)可能长时间处于CONNECTED(连接) 状态。一个漫游而来的高管,可能整个上午都在进行一场跨洋视频会议。网络总不能为了让他切换网络,就粗暴地中断他的会议吧?这就导致SOR的策略,迟迟无法执行。
17.1 Enhancement for the 5G Control Plane Steering of Roaming for UE in Connected mode
This feature introduces means to send additional steering of roaming information, called steering of roaming connected mode control information (SOR-CMCI) that enables the HPLMN to control the timing of a UE in connected mode to move to idle mode to perform the steering of roaming.
【深度解读】
Rel-17为此引入了一套更“绅士”、更“智能”的机制——SOR-CMCI(连接态漫游控制信息)。
-
“带条件的指令”:HPLMN(通过其SOR-AF)现在可以向处于连接态的UE,下发一个更智能的SOR-CMCI指令。这个指令不再是简单的“你去C网络”,而是可以附带条件和时机。
-
场景还原:
-
一位漫游高管正在进行低优先级的后台文件同步(CONNECTED状态)。
-
他的HPLMN向他发送了一条SOR-CMCI,内容是:“请在当前数据传输完成后,立即进入IDLE状态,并尝试注册到PLMN C。”
-
UE的NAS层在收到这个指令后,会“心领神会”,在文件同步结束后,主动请求RRC释放连接,然后启动向PLMN C的网络选择。
-
-
业务区分:
The UE’s type of ongoing communication / session(s) should be taken into consideration. The high priority services and emergency services are exempted from being interrupted…
【深度解读】 这个机制是智能的。如果UE上正在进行的业务是高优先级的(如VoNR通话、IMS紧急呼叫),那么UE会忽略这个SOR-CMCI指令,保障业务不被中断。
SOR-CMCI,如同给了网络一个“有礼貌地请用户换个地方”的能力。它在运营商的商业需求和用户的体验之间,找到了一个精巧的平衡点,让漫游控制从“粗暴干预”走向了“优雅协商”。
3. “同心同德”的策略大脑:统一PCF选择 (17.2)
在5G网络中,PCF(策略控制功能)是策略的“大脑”。但这个“大脑”存在一个潜在的“精神分裂”风险:管理UE移动性策略的AMF,和管理UE会话策略的SMF,它们在选择PCF时,可能选到了两个不同的PCF实例。
Binding the Access and Mobility Management (AM) and the Session Management (SM) policies provides several benefits… A simple way to achieve such binding is to select the same Policy Control Function (PCF) for the AMF and the SMF.
【深度解读】
-
“双脑”的弊端:如果AMF-PCF和SMF-PCF不是同一个,会导致策略的不一致和管理的复杂性。例如,当一个用户的数据流量超出了套餐限额,SMF-PCF决定对其进行限速,但AMF-PCF对此一无所知,可能依然在移动性管理上,为他选择高速率的5G小区,造成策略冲突。
-
Rel-17的“统一思想”:
This Rel 17 work item specifies a mechanism to achieve the same PCF selection for AMF and SMF in the EPS to 5GS mobility scenario… subscription data is expanded to assist the same PCF selection…
【深度解读】 Rel-17通过扩展用户签约数据,解决了这个问题。现在,运营商可以在UDM中,为特定的业务(如某个DNN或S-NSSAI),预先配置一个优选的PCF ID。
当AMF需要为UE选择PCF时,它会从UDM获取这份签约数据,并“遵从”这个指示,选择那个被指定的PCF。随后,当SMF需要为同一个UE的PDU会话选择PCF时,AMF会将这个已经选定的PCF ID传递给SMF,确保SMF也选择了同一个PCF实例。
这个看似简单的改变,确保了UE的移动性策略和会话策略,始终由一个“大脑”统一决策,实现了“同心同德”。
4. 网络的“自愈术”:GTP-U重启与UDR恢复 (17.4 & 17.9)
欧阳慧的“微秒级迟缓”难题,源于网络部件重启时的“蝴蝶效应”。
4.1 GTP-U实体的“心跳复苏” (17.4)
A remote GTP-U restart will lead massive amount of signalling in the network… To avoid that, this work item specifies following enhancements:
- procedures to detect and report the peer GTP-U entity restart;
- protocol support in GTP-U to enable to detect peer GTP-U entity restart;
- protocol support in PFCP to enable User Plane function to report the peer GTP-U entity restart to the Control Plane function.
【深度解读】
-
风暴之源:GTP-U是用户面数据传输的隧道协议。当一个UPF(用户面功能)重启时,它上面承载的成千上万条GTP-U隧道就失效了。在过去,是每一个SMF(控制面)通过心跳超时,逐一地、被动地发现自己的隧道断了,然后再逐一地通过N4接口(PFCP协议)去尝试重建,这引发了巨大的信令风暴。
-
Rel-17的“主动宣告”:Rel-17引入了GTP-U路径管理的增强。现在,一个重启完成的UPF,会主动地向所有与它相关的SMF,发送一个高效的GTP-U Echo Request/Response消息,如同一次“心跳复苏宣告”:“我回来了!”。同时,它也会通过PFCP协议,向SMF报告自己的重启状态。
-
效果:SMF在收到这个“主动宣告”后,就可以有条不紊地、批量地恢复它在该UPF上的所有会话,避免了“恐慌性”的信令风暴,将业务抖动时间缩短到了几乎无法感知的程度。
4.2 UDR的“记忆恢复” (17.9)
This Work Item enables restoration of profiles between UDR and related NF consumers, to maintain the status up to date as much as possible even in case data stored in UDR is lost or corrupted.
【深度解读】
UDR(统一数据仓库)是存储用户动态数据(如位置信息、策略上下文)的“记忆中枢”。如果UDR发生故障导致数据丢失,依赖这些数据的NF(如PCF)就会“失忆”。Rel-17为此定义了一套数据同步和恢复流程。当UDR恢复后,它会通知相关的NF“我失忆了”,NF消费者随后会主动地与UDR重新同步数据,或从其他数据源(如UDM)重建数据,确保了网络“记忆”的快速恢复。
5. “精打细算”的智慧:计费与策略的轻量化 (17.7 & 17.5)
“糊涂账”和“死板”的策略,是运营效率的“慢性病”。
5.1 SPOCUP:为漫游计费装上“秒表” (17.7)
17.7 Start of Pause of Charging via User Plane (SPOCUP)
The work item defines a User Plane (GTP-U) based solution to start pause of charging… to reduce the Charging Data Record discrepancies… caused by the control plane signalling latency… a new GTP-U message “Tunnel Status” is introduced…
【深度解读】
-
“糊涂账”的根源:当一个漫游用户停止上网时,这个“停止”的指令,需要通过漫长的控制面信令,从拜访地网络(V-SMF)传递到归属地网络(H-SMF/CHF),这个过程有延迟。这就导致归属地的“计费时钟”,比用户实际停止使用的时间,晚停了那么零点几秒。
-
SPOCUP的“用户面直通车”:Rel-17的SPOCUP方案,绕开了缓慢的控制面。现在,当用户停止上网时,拜访地的V-UPF可以直接在用户面隧道(GTP-U)中,向归属地的H-UPF(通常是计费策略执行点)发送一个新增的**“Tunnel Status”消息**,内容就是“立即暂停计费!”。这个过程几乎是瞬时的。
SPOCUP,用一条用户面的“捷径”,解决了控制面“绕远路”带来的计费不准问题。
5.2 PFD管理的“推拉之间” (17.5)
PFD(Packet Flow Description)是AF用来告知网络(PCF)“哪种数据流属于我的应用”的“规则集”。
An optimize solution to reduce the load of signalling for pull mode in EPS and 5GS is defined. A notification push solution for push mode in 5GS is defined.
【深度解读】
Rel-17对PFD的管理进行了优化,减少了不必要的信令交互,让策略更新更轻量、更高效。
6. 动态的“遥控器”:更灵活的事件与策略管理 (17.11 & 17.12)
最后,是为应用开发者们提供的、更强大的网络“遥控器”。
17.11 Dynamic management of group-based event monitoring
…specify that event configuration can be updated with event cancellation/adding can be sent from AS/AF for individual UE or a sub-set of the UEs in a group…
【深度解读】
过去,要修改一个监控群组的配置(例如,增加或删除一个成员),需要重新下发整个群组的订阅。Rel-17允许AF可以增量地、只针对单个或部分成员进行更新,大大提升了群组管理的灵活性和效率。
17.12 Dynamically Changing AM Policies in the 5GC
This Work Item provides the capability for an Application Function (AF) to request for a UE either service area coverage or the indication that high throughput is desired or both.
【深度解读】
这是赋予应用“实时影响网络”的强大能力。游戏App的AF,可以在用户进入一局对战时,通过NEF向PCF发送一个请求:“请立即为该用户开启‘高吞吐/低时延’的移动性策略(AM Policy)!” PCF收到后,会更新UE的RFSP(RAT/Frequency Selection Priority),引导UE优先驻留在能提供最佳游戏体验的网络上。
7. 总结:信令优化,5G从“可用”到“卓越”的必由之路
欧阳慧的“亚健康”难题,在Rel-17的“神经系统调优”方案下,被一一化解。TR 21.917的第17章,虽然没有华丽的新名词,但它所做的每一项增强,都如同一次精准的“针灸”,疏通了5G网络控制面的“经络”。
-
它让漫游管理更“智能”,实现了商业目标与用户体验的平衡。
-
它让策略控制更“统一”,消除了4G/5G互通中的“精神分裂”。
-
它让网络更“坚韧”,具备了面对局部故障时的快速“自愈”能力。
-
它让计费更“精准”,用用户面的捷径解决了控制面的延迟。
-
它让应用与网络的“互动”更“动态”,赋予了开发者前所未有的实时控制权。
这些“看不见”的优化,共同构筑了一个更高效、更稳定、更智能、更具商业价值的5G网络。它标志着5G的演进,已经深入到了追求“卓越运营”的深水区,这也是5G-Advanced走向大规模商业成功的必由之路。
FAQ
Q1:什么是SOR-CMCI?它解决了传统漫游控制的什么痛点?
A1:SOR-CMCI是“连接态漫游控制信息”。它解决了传统漫游控制(SOR)只能在UE进入IDLE(空闲) 状态时才生效的痛点。对于长时间处于CONNECTED(连接) 状态的5G用户,传统SOR策略无法及时执行。SOR-CMCI允许归属网络向处于连接态的UE下发一个带条件的、智能的引导指令,例如“在你当前业务结束后再切换网络”,并能区分业务优先级(如不中断语音通话),从而实现了更灵活、更用户友好的漫游引导。
Q2:为什么AMF和SMF选择同一个PCF很重要?
A2:因为AMF负责的移动性策略和SMF负责的会话策略是紧密关联的。例如,一个用户的会话策略是“视频业务需要低时延”,那么他的移动性策略就应该是“优先驻留在低时延的5G小区”。如果这两个策略由两个独立的PCF(“大脑”)来决策,就可能出现不一致,导致体验下降。选择同一个PCF,确保了对一个用户的所有策略都由一个统一的大脑进行决策,保证了策略的一致性和协同性。
Q3:SPOCUP(通过用户面暂停计费)相比传统方式,优势在哪里?
A3:优势在于速度和准确性。传统方式下,暂停计费的信令需要通过控制面,在拜访地核心网和归属地核心网之间进行多跳转发,这个过程有延迟,导致归属地的计费“秒表”停得慢了,造成计费误差。SPOCUP则开辟了一条“用户面捷径”,拜访地的UPF可以直接通过GTP-U隧道,向归属地的UPF(计费点)发送“暂停”指令,这个过程几乎是瞬时的,从而极大地提升了漫游计费的准确性。
Q4:Rel-17的“动态改变AM策略”功能,对我们普通用户有什么好处?
A4:好处是你的网络体验将与你的应用行为更“合拍”。例如,当你启动一款云游戏App时,这个App的后台(AF)可以通知网络“这位玩家要开始了!”。网络(PCF)收到通知后,可以立刻为你调整移动性策略(AM Policy),让你优先接入和驻留在低时延、高带宽的5G小区上。当你退出游戏,开始刷新闻时,网络又可以将你的策略调整回“普通”模式。这使得网络资源能够根据应用的实时需求,进行更智能、更动态的分配。
Q5:这些信令优化,是否都需要更换手机才能体验到?
A5:大部分需要。例如,SOR-CMCI、UE请求统一PCF、动态改变AM策略的UE侧配合等,都需要UE的NAS层协议栈进行升级才能支持。而像GTP-U重启优化、UDR恢复等纯网络侧的增强,则与终端无关。总的来说,要完整地享受到Rel-17信令优化带来的好处,拥有一个支持Rel-17协议栈的新款终端是必要的。