深度解析 3GPP TR 21.916:5.1 Enhancement of URLLC support in the 5G Core network (5G核心网URLLC支持增强)
本文技术原理深度参考了3GPP TR 21.916 V16.2.0 (2022-06) Release 16规范中,关于“5.1 Enhancement of URLLC support in the 5G Core network”的核心章节,旨在为读者提供一个5G核心网如何为超可靠低时延通信(URLLC)提供工业级支持的全景视图。
引言:从理论到实践,为工业互联网打造“确定性”网络
在上一篇的宏观概览中,我们描绘了Rel-16如何引领5G从“能用”迈向“好用”,特别是其赋能千行百业的雄心。从本文开始,我们将深入到规范的每个技术细节中,逐一拆解构成这幅宏大蓝图的精密零件。我们的第一站,便是5G三大场景中技术挑战最高、也是工业互联网最为渴求的能力——超可靠低时延通信(URLLC)。
如果说Rel-15对URLLC的定义还停留在基础框架和概念层面,那么Rel-16则是一次彻底的“实战化”升级。它聚焦于解决URLLC在实际部署,尤其是工业、交通等严苛场景中遇到的核心痛点,致力于将5G网络从“尽力而为”的消费级服务,锻造成一个“使命必达”的工业级确定性网络。
为了让这些抽象的技术概念变得鲜活,让我们隆重介绍本系列文章的主角——工程师亚历克斯。他是一家名为“智造先锋”的未来工厂的网络技术负责人。他的核心任务,是利用5G技术将工厂打造成一个全无线、高度自动化和柔性化的智能制造典范。亚历克斯当前面临的最大挑战,是如何确保控制产线上数百个高速运转的机器人手臂和自主移动小车(AGV)的无线网络,能够达到甚至超越传统工业有线网络的可靠性和实时性。
本章,我们将跟随亚历克斯的视角,看看3GPP Rel-16在5G核心网侧,为他提供了哪些强大的工具,来解决URLLC的落地难题。
This Feature enhances 5G core network to support ultra-high reliability and low-latency communications (URLLC). The main functionalities introduced here are the support of redundant transmission, QoS monitoring, dynamic division of the Packet Delay Budget, and enhancements of the session continuity mechanism.
正如规范所言,Rel-16核心网对URLLC的增强主要围绕四大核心功能展开:冗余传输、QoS监测、动态数据包延迟预算分配,以及会话连续性增强。接下来,我们将一一深入解读。
1. 冗余传输:为关键任务构筑“永不中断”的数据通路
在亚历克斯的工厂里,一条指令的丢失或延迟,可能意味着价值百万的精密部件报废,甚至生产线停摆。他需要一种机制,来对抗无线环境中不可避免的信号干扰和瞬时中断。Rel-16给出的首要答案就是——冗余传输。
其核心思想简单而强大:将一份关键数据复制成多份,通过物理上或逻辑上相互独立的路径同时发送。只要有一份数据能够准时、完好地到达,通信就不会中断。这就像为关键货物运输同时派出了两辆卡车,走两条不同的高速公路,极大地提升了任务成功的概率。
Some URLLC services request very high reliability that hardly can be supported in an economical way by a single transport path. To support such services, a redundant transmission mechanism is specified. User packets are duplicated and simultaneously transferred to the receiver via two disjoint user plane paths. The redundant packets are then eliminated at the receiver side.
Rel-16定义了在不同网络层面实现这种“双路径”冗余的多种方案,以适应不同成本和可靠性等级的需求。规范在5.1章节中通过三张图展示了主要的实现方式。
1.1 方案一:基于双连接的端到端冗余
这是可靠性最高的方案,也常被称为“终极保险”。
Dual-connectivity-based end-to-end redundant user plane paths: two redundant PDU Sessions with independent user plane paths are established between UE and DN. Packet replication and elimination are performed by the upper layer of UE and DN, which are not specified in 3GPP.
规范原文中的“Figure 1: redundant User Plane paths using Dual Connectivity”清晰地展示了这种架构。让我们跟随亚历克斯的思路来理解它:
-
场景需求: 工厂中最核心的一台六轴高精度焊接机器人,其运动控制指令的可靠性要求达到了99.9999%,不容任何闪失。
-
网络行为:
-
双PDU会话建立: 机器人终端(UE)会同时发起建立两个完全独立的PDU会话。这两个PDU会话可以被网络(AMF/SMF)路由到不同的核心网UPF(用户面功能)和基站(gNB)。
-
双连接: 机器人终端通过无线双连接技术(Dual Connectivity),同时连接到两个基站(一个主站Master NG-RAN,一个辅站Secondary NG-RAN)。这两条无线路径可以是不同频段(如Sub-6GHz + 毫米波),甚至是不同物理站点的基站,以最大化路径独立性。
-
端到端复制与消除: 数据包的复制和消除工作,由通信链路的两端——即机器人控制器(UE的上层应用)和工厂的边缘计算服务器(DN的上层应用)来完成。3GPP网络本身只负责透明地传输这两路独立的PDU会话数据。
-
解读:
这个方案的优点是提供了最高级别的端到端可靠性,因为从UE应用层到DN应用层的整条链路都是双备份的,网络中的任何单点故障(基站、UPF、传输链路)都不会影响业务。但其缺点也很明显:资源开销大(需要两个PDU会話,占用双倍的核心网和无线资源),且需要终端和服务器的应用层进行改造来支持复制和去重。对于亚历克斯来说,这套方案完美适用于他那台“绝对不能停”的核心机器人。
1.2 方案二:N3/N9接口冗余
相比方案一的“豪华配置”,方案二提供了一种更通用、对终端更友好的网络侧冗余方案。
Support of redundant transmission on N3/N9 interfaces: for a PDU Session used for URLLC services, two redundant N3/N9 tunnels with independent user plane paths are established between UPF and NG-RAN to transfer the duplicated user packets. Packet replication and elimination are performed by NG-RAN and User Plan Function (UPF).
规范原文中的“Figure 2: redundant transmission using two N3 and N9 tunnels between NG-RAN and PSA UPF”对此进行了描绘。
-
场景需求: 工厂里的AGV小车群,需要高可靠的路径规划和调度指令,但其关键性稍低于焊接机器人。亚历克斯希望能在不改造AGV固件的情况下,提升其通信可靠性。
-
网络行为:
-
单PDU会话: AGV(UE)只建立一个普通的URLLC PDU会话。
-
网络侧复制与消除: 冗余的核心发生改变。对于下行数据,核心网的锚点UPF(PSA UPF)会将数据包复制一份,通过两条独立的N3/N9隧道发送给基站(NG-RAN)。基站收到后,选择首先到达的数据包通过无线接口发送给AGV,并丢弃另一份。对于上行数据,过程则相反:AGV只发送一份数据,基站收到后复制并发往两条N3隧道,由PSA UPF负责消除冗余。
-
透明性: 整个冗余过程对AGV是完全透明的,它感知不到网络内部的复制和消除动作。
-
解读:
这个方案的巧妙之处在于,它将冗余的复杂性从终端侧转移到了网络侧(RAN和UPF)。这使得大量的普通URLLC终端无需任何改造,就能享受到路径冗余带来的高可靠性。资源开销也比方案一小,因为它只涉及N3/N9接口的冗余,而非整个PDU会话。对于亚历克斯来说,这个方案是AGV车队通信保障的理想选择。
1.3 方案三:传输层冗余
这是三种方案中最“轻量级”的一种,它依赖于底层承载网络的能力。
Support of redundant transmission at transport layer: this approach assumes that the backhaul provides two disjoint transport paths between UPF and RAN. The redundancy functionality within NG-RAN and UPF makes use of the independent paths at transport layer, which is not specified in 3GPP.
规范原文中的“Figure 3: Redundant transmission using two N3 tunnels between the PSA UPF and the NG-RAN node”虽然看起来和图2相似,但其核心内涵完全不同。
-
场景需求: 工厂内部分散的生产环境传感器,数据量不大,但需要稳定的周期性上报。亚历克斯希望以最低的成本保障这些连接的稳定性。
-
网络行为:
-
物理路径多样性: 这个方案的前提是,连接基站和UPF的物理传输网络(如光纤、微波)本身就存在两条或多条独立的路径。
-
网络功能利用: 基站(NG-RAN)和UPF能够感知到底层传输网的多路径特性,并在发送数据时(例如,通过不同的IP路由)主动利用这些路径来形成冗余。
-
3GPP不指定: 3GPP规范本身并不定义传输层冗余的具体实现方式,这部分留给了设备商和运营商在网络建设时自行实现。3GPP只是定义了RAN和UPF可以使用这种能力的框架。
-
解读:
此方案将冗余能力进一步下沉到IP传输层,对3GPP网络功能的改动最小,成本也最低。它的可靠性水平依赖于底层物理网络的健壮性。对于那些可靠性要求不是极端严苛,但又希望优于单路径传输的业务,这是一个经济高效的选择。
2. QoS监测:让网络性能“看得见、摸得着”
为URLLC业务提供了冗余通路后,亚历克斯面临一个新的问题:如何验证网络是否真的达到了承诺的毫秒级时延和超高可靠性?口说无凭,数据为证。Rel-16核心网增强引入了QoS监测机制,让网络性能变得透明可量化。
QoS Monitoring is defined in this release for the measurement of packet delay between UE and PSA UPF. The NG-RAN is required to provide the QoS Monitoring of UL/DL packet delay at the Uu interface. The QoS Monitoring of UL/DL packet delay between NG-RAN and PSA UPF can be performed at different levels of granularities, i.e. per QoS flow level, or per GTP-U path level.
场景与解读:
亚历克斯需要向工厂管理层提交一份网络性能报告,证明5G专网满足了与供应商签订的SLA(服务等级协议)。
QoS监测功能允许网络精确测量数据包在关键路径段上的延迟:
-
空口(Uu)延迟: 基站可以监测数据包在AGV和基站之间无线传输所花费的时间。
-
核心网传输(N3)延迟: 基站和UPF之间可以协同测量数据包在两者之间传输的延迟。
这些测量结果可以非常精细,支持**按QoS流(per QoS flow)或按GTP-U隧道(per GTP-U path)**进行统计。这意味着亚历克斯可以获得针对“机器人控制流”或“AGV调度流”的专属延迟报告,而不是一个笼统的网络平均值。这些精确的数据,就是他证明网络性能达标、优化网络参数、定位潜在问题的有力武器。
3. 动态数据包延迟预算(PDB):智能化的“时间管理大师”
URLLC业务的端到端时延预算(PDB)通常是固定的,比如5毫秒。在Rel-15中,这个总预算被粗略地静态分配给无线网和核心网,例如,空口3毫秒,核心网2毫秒。但无线环境是动态变化的,这种固定的分配方式显然不够智能。
The Packet Delay Budget (PDB) of URLLC services is typically more stringent than for traditional services. To obtain a more accurate delay budget for NG-RAN, SA WG2 decided to allow a dynamic value for the core network PDB (CN PDB), so that the SMF or NG-RAN can dynamically calculate delay budget of NG-RAN based on the CN PDB.
场景与解读:
亚历克斯发现,有些AGV离基站很近,信号极好,空口传输可能只需要0.5毫秒;而另一些AGV在信号边缘,空口可能需要2.5毫秒。
Rel-16引入的动态PDB分配机制,就像一个智能的时间管理大师。它允许核心网(SMF)或基站(NG-RAN)不再固守静态的分配比例。当基站发现某个AGV的无线信道质量非常好时,它可以向SMF请求一个更小的无线网延迟预算(例如,从3ms降到1ms)。这样,核心网的可用延迟预算就从2ms增加到了4ms。这部分富余的时间可以用来选择一条更稳定但稍远的路由,或者为网络抖动提供更大的缓冲空间,从而提升整个链路的确定性。这种动态、实时的预算调整,使得网络资源利用更加高效,整体可靠性也得到了增强。
4. 会话连续性增强:移动中的“无影切换”
工厂里的AGV和移动机器人总是在不停地移动,频繁地在不同基站的覆盖范围之间切换。对于URLLC业务,任何切换过程中的中断都是不可接受的。Rel-16针对会话连续性进行了多项关键增强,旨在实现“零丢包”的无缝切换。
When a UE moves, the user plane path of low latency services need to be optimized to reduce the latency and to guarantee session continuity. Several related mechanisms are developed or enhanced in this WI.
4.1 以太网PDU会话的锚点重定位
许多工业设备使用以太网协议进行通信。在5G中,这对应于“Ethernet”类型的PDU会话。当一个移动机器人从一个UPF的服务区移动到另一个UPF的服务区时,其业务的锚点(PSA)也需要随之迁移。
PDU Session Anchor (PSA) relocation for Ethernet PDU Session is specified in this release. The target UPF will assist in the update of Ethernet forwarding tables of Ethernet switches in the DN, so that UL/DL traffics will switch to the target UPF once the UE moves.
解读:
这个增强机制定义了当PSA发生重定位时,新的目标UPF如何主动地与工厂的数据网络(DN)中的以太网交换机进行交互,快速更新交换机的转发表(MAC地址表等)。这样可以确保数据流能够第一时间被正确地路由到新的UPF,避免了因路由收敛缓慢导致的数据中断。
4.2 上行分类器(ULCL)重定位
上行分类器(ULCL)是实现边缘计算的关键技术,它能将特定的上行数据流(如来自某个机器人的视频流)在网络边缘(如I-UPF)就近分流到本地的应用服务器,而无需绕行到远端的核心网。
For Uplink Classifier (ULCL) relocation, a forwarding tunnel between the old and new ULCLs is introduced to avoid packet loss during relocation.
解读:
当机器人移动导致其接入的I-UPF发生变化时,ULCL功能也需要随之迁移。为了保证迁移过程中的数据连续性,Rel-16规定在旧的ULCL和新的ULCL之间建立一条临时的转发隧道。在切换的瞬间,从机器人发出的数据包即使到达了旧的ULCL,也会被立刻转发到新的ULCL,确保数据流的平滑过渡,避免了视频卡顿或控制中断。
4.3 AF影响的流量路由
应用功能(AF),即亚历克斯工厂里的业务服务器,现在可以更灵活地与5G网络(SMF)互动,影响数据流的路由决策。
AF-influenced traffic routing mechanism is further enhanced to allow flexible coordination between SMF and AF when user plane change events happen.
解读:
这意味着应用层拥有了更高的话语权。例如,工厂的应用服务器可以根据自身的负载情况或业务调度需求,向SMF请求将某个机器人的数据流切换到另一个边缘数据中心进行处理。这种应用与网络的深度协同,使得流量路由更加智能,更能适应柔性制造的动态需求。
总结
通过对3GPP TR 21.916中5.1章节的深度拆解,我们看到Rel-16为5G核心网的URLLC能力带来了质的飞跃。它不再是一个停留在纸面上的技术指标,而是通过冗余传输、QoS监测、动态PDB和会话连续性增强这四大支柱,为像亚历克斯这样的工业实践者,提供了一套完整、可靠、可度量的工具集。这些增强功能共同作用,为5G在工业互联网、车联网等关键垂直领域的应用铺平了道路,真正开始兑现其改造社会的巨大潜力。
在下一篇文章中,我们将继续我们的探索之旅,聚焦于物理层(Physical Layer)的URLLC增强,看看在无线空口这个“最后一公里”,Rel-16又祭出了哪些黑科技。
FAQ环节
Q1:Rel-16提供的三种冗余传输方案(端到端、N3/N9接口、传输层)应该如何选择?
A1:选择取决于业务的关键性、终端能力和成本。端到端冗余提供最高级别的可靠性,但需要终端和应用支持,资源开销最大,适用于“绝对不能停”的核心关键业务。N3/N9接口冗余是网络侧提供的能力,对终端透明,可靠性高,资源开销适中,是通用URLLC业务的理想选择。传输层冗余成本最低,对3GPP网络改动小,但可靠性依赖于底层承载网的建设情况,适用于可靠性要求稍低但希望优于单路径的业务。
Q2:在N3/N9接口冗余方案中,数据包的复制和消除具体由谁完成?
A2:对于下行流量,由PDU会话锚点UPF(PSA UPF)负责复制数据包,由基站(NG-RAN)负责在接收到两份数据包后消除冗余(通常是保留先到的那一份)。对于上行流量,则反过来,由基站(NG-RAN)负责复制UE发来的单个数据包,由PSA UPF负责消除冗余。
Q3:动态PDB相比静态PDB,其核心优势体现在哪里?
A3:核心优势在于自适应性和资源效率。静态PDB的分配是固定的,无法适应动态变化的无线环境,往往为了保证最差情况下的时延而预留过多冗余,造成资源浪费。动态PDB允许网络根据实时的信道质量,智能地、动态地调整分配给无线侧和核心网侧的延迟预算。这使得整个端到端链路的时延控制更加精细和高效,在保证URLLC性能的同时,提升了网络的整体鲁棒性和资源利用率。
Q4:在Rel-16的URLLC增强中,控制面网元(如SMF)和用户面网元(如UPF、RAN)分别扮演什么角色?
A4:这是一个典型的控制面与用户面分离的体现。控制面网元(SMF) 扮演“大脑”的角色,负责决策和策略制定。例如,它决定是否为某个QoS流启用冗余传输、与RAN协商和分配动态PDB、在切换时决策PSA和ULCL的重定位等。用户面网元(UPF、RAN) 则是“四肢”,负责执行具体的策略。例如,UPF和RAN根据SMF的指令,执行数据包的复制、消除、转发和QoS监测等实际操作。
Q5:会话连续性增强中的ULCL重定位和PSA重定位有什么区别?
A5:两者都服务于切换,但作用的“锚点”不同。**PSA(PDU会话锚点)是整个PDU会话(可以理解为一个IP会话)的终点,决定了UE访问外部数据网络的出口。PSA重定位通常发生在UE大范围移动,需要接入一个新的、更近的核心网UPF时。而ULCL(上行分类器)**是针对PDU会话内部的特定上行数据流(例如,视频流)的分流点,用于实现边缘计算。ULCL重定位通常发生在UE小范围移动,但其业务需要由一个新的边缘UPF来处理时。PSA是会话级锚点,ULCL是流级锚点。