深度解析 3GPP TR 21.916:18 Advanced System Architecture Features (高级系统架构特性)
本文技术原理深度参考了3GPP TR 21.916 V16.2.0 (2022-06) Release 16规范中,关于“18 Other system-wide Features”章节内的18.3, 18.4, 和 18.5等核心部分,旨在为读者系统性地揭示5G Rel-16如何通过对网络拓扑、私网支持和服务交互模型的深刻变革,构建一个更具弹性、可扩展性和开放性的高级系统架构。
引言:从“蓝图”到“摩天大楼”,构筑5G的“承重墙”与“高速路”
在之前的章节中,我们已经深入探索了5G如何为各类应用场景(URLLC、V2X、IoT等)量身打造强大的服务能力。然而,要支撑起这些功能各异的“豪华套房”,其下方的“建筑结构”——即网络本身的系统架构——必须足够坚固、灵活且高效。如果说Rel-15为5G搭建了主体框架,那么Rel-16则对这座“摩天大楼”的承重结构、内部交通动线和对外接口进行了革命性的优化与加固。
本章,我们将聚焦于那些不针对特定业务,但却对整个5G系统的可扩展性、可部署性和可运营性产生深远影响的高级系统架构特性。我们将认识本章的主角——克拉拉(Clara),她是一家大型跨国电信运营商的首席网络架构师。她的工作,不是关心某条产线的数据如何传输,而是要设计一张能够覆盖全国、服务数亿用户和数百万企业的、面向未来十年的5G网络。
克拉拉正面临着三大前所未有的战略挑战:
-
规模与边缘的矛盾: 在一张覆盖广袤国土的网络中,如何既能高效处理用户的全国性漫游,又能满足新兴的边缘计算业务对极致低时延的渴求?
-
公网与私网的融合: 越来越多的企业客户希望部署5G专网,但他们更懂生产,不懂通信。如何让运营商的公共网络,能够“长”出成千上万个安全隔离、无线资源专享的“企业园区网”?
-
复杂性与可靠性的权衡: 5G核心网由数十种、成千上万个微服务化的网络功能(NF)实例组成,它们之间“网状”的直接通信,正在变成一场管理的噩梦。如何梳理这张“蜘蛛网”,提升系统的可靠性和可维护性?
克拉拉的这三大挑战,正是Rel-16在**ETSUN(增强的SMF/UPF拓扑)、RAN侧对NPN的支持、以及eSBA(增强的服务化架构)**这三大领域所要攻克的堡垒。本章,我们将跟随克拉拉的视角,深入5G的“ engine room”,一探究竟。
1. ETSUN:为网络装上“洲际导弹”与“区域指挥部” (18.3节解读)
克拉拉负责的网络覆盖了一个从东海岸到西海岸的广袤国家。在Rel-15的架构下,当一个用户建立一个PDU会话(例如,开始一次视频通话)时,会由一个SMF(会话管理功能)来全程管理。如果这个用户从东海岸飞到西海岸,管理他会话的SMF仍然是东海岸的那个。这意味着,所有信令消息都要“漂洋过海”地传回东海岸的SMF,效率低下,时延巨大。
Enhancing Topology of SMF and UPF in 5G Networks (ETSUN) has two goals:
- Enable the 3GPP system to support deployments where a SMF is not able / allowed to control UPF(s) throughout the same PLMN. …This relates with the addition of I-SMF in the architecture…
- Enhance the capability of 5GS architecture for a UPF to be controlled by multiple SMF’s… especially for the UE IP address / Prefix allocation.
ETSUN的核心,就是为了解决这种“中央集权”式会话管理的弊端,引入了更灵活、更分布式的拓扑结构。
1.1 I-SMF:会话管理的“区域代理”
为了解决长途信令绕转的问题,Rel-16引入了一个全新的角色——I-SMF (Intermediate SMF)。
When a UE with an established PDU Session is not in a TA served by the SMF of this PDU Session, an intermediate SMF (called I-SMF) is inserted by the AMF in the signalling path of the PDU session to control the intermediate UPF (called I-UPF) terminating the N3 interface with the 5G Access Network.
架构解读:
I-SMF的理念,是在用户的“归属SMF”(此时可称为Anchor SMF, A-SMF)和用户当前所在的接入网之间,插入一个“中间”的、地理位置更近的SMF。
规范原文的**“Figure 1: Non-roaming architecture with I-SMF insertion to the PDU Session…”**清晰地展示了这种新拓扑。
场景解读:克拉拉的跨国飞行
-
会话建立: 用户在东海岸的家中,通过手机看在线视频,建立了一个PDU会话。这个会话由东海岸数据中心的A-SMF进行管理。
-
长途飞行: 用户飞往西海岸。当他在西海岸落地开机,并重新接入网络时,西海岸的AMF发现,管理他会话的A-SMF远在东海岸。
-
I-SMF插入: 此时,西海岸的AMF做出了一个智能决策:它在信令路径中,插入了一个位于西海岸数据中心的I-SMF。
-
职责划分:
-
I-SMF(区域指挥部): 接管了所有与用户在西海岸本地移动性相关的“日常事务”,如处理手机的休眠/唤醒、基站间切换等信令。它直接管理着西海岸的本地UPF(I-UPF),负责本地流量的转发。
-
A-SMF(最高统帅部): 继续保留对整个PDU会话的“最高所有权”,负责与外部数据网络(DN)的策略交互(与PCF)、计费(与CHF)、IP地址管理等“战略级”事务。
-
I-SMF的核心价值:
-
低时延移动性管理: 用户的本地移动性信令,都在本地的I-SMF闭环处理,无需再绕行数千公里到A-SMF,大大降低了信令时延,提升了切换等流程的效率。
-
边缘计算的天然使能者:
The I-SMF is thus responsible for the insertion, modification and removal of UPF(s) to ensure local traffic steering: the SMF does not need to know the mapping between DNAI(s) for local traffic offload and local UPF(s).
当用户在西海岸需要访问一个本地的边缘计算应用时(如云游戏服务器),I-SMF可以自主地在本地插入或选择一个UPF,实现流量的本地分流(Local Breakout)。而远在东海岸的A-SMF,甚至都无需知道西海岸具体的UPF拓扑和分流策略。这为大规模、分布式边缘计算的部署,提供了完美的网络架构支持。
1.2 灵活的IP地址分配
ETSUN的另一个重要增强,是允许多个SMF共享控制同一个UPF,特别是在IP地址分配上。
ETSUN adds the possibility for the SMF to defer to the UPF the UE IP address / Prefix allocation… this allows many SMF(s) to control the same UPF without having to synchronise or divide the UE IP address / Prefix space between these SMF(s).
解读:
传统模式下,IP地址由SMF分配。如果多个SMF要共管一个UPF,就需要对IP地址池进行复杂的切分和同步,容易出错。Rel-16允许SMF将“IP地址分配”的权力,下放给UPF自己,或者由UPF代理与外部的DHCP/AAA服务器交互来获取。这大大简化了多SMF共管场景下的配置,提升了网络部署的灵活性。
对于克拉拉而言,ETSUN就像是为她的全国性网络,建立了一套高效的“中央-地方”管理体系。A-SMF如同联邦政府,负责外交、货币等核心事务;I-SMF则如同州政府,高效地管理着本地的交通、市政,并大力发展本地的“特色经济”(边缘计算)。
2. NPN的无线落地:为私网打造专属“电波通道” (18.4节解读)
克拉拉的一家大型汽车制造客户,希望在全国的三个超级工厂内部署5G全连接产线,并实现三个工厂之间的私网互联。他们对数据安全和无线性能的要求极高。克拉拉需要为他们设计的,不仅仅是核心网层面的隔离(如切片),更是无线空口层面的专属接入和隔离。这正是18.4节“Private and Non-Public Network Support for NG-RAN”的核心内容。
This work item specifies the Private Network (i.e. Stand-alone Non-Public Network (NPN) and PLMN Integrated Non-Public Network) features for gNB with the following functionalities…
2.1 基站的“身份宣告”:NPN信息广播
如何让工厂里的设备知道,哪个信号才是它们的“专属内网信号”?
The NPN IDs (i.e. SNPNs… and PNI-NPNs…) were introduced into SIB1 to indicate UEs whether a cell is an NPN cell. … SIB1 allows indication of TAC, RANAC, cell Identity per SNPN or per PNI-NPN.
Rel-16规定,支持NPN的基站(gNB),必须在其系统广播消息1(SIB1)中,明确地“宣告”自己的身份:
-
对于SNPN(独立专网): 广播其专属的网络ID(PLMN ID + NID)。
-
对于PNI-NPN(公网集成专网): 广播其所属的**CAG ID(封闭用户组ID)**列表。一个小区可以同时服务于多个CAG,也可以同时服务于公网用户和CAG用户(共享小区)。
-
基站还会广播这些NPN的人类可读网络名称(HRNN),如“XX汽车-上海工厂专网”。
场景解读:
克拉拉在汽车工厂内部署了专用的5G微基站。这些基站会在SIB1中广播一个专属的CAG ID,例如“AutoMobile-SH-01”。工厂里的所有AGV、机器人终端的USIM卡中,都预先配置了对这个CAG ID的“访问权限”。
2.2 无线空口的“门禁系统”
-
小区选择/重选:
when a cell broadcasts any CAG IDs or NIDs, NPN-capable Rel-16 UE can treat the cell with cellReservedForOtherUse = true as a candidate cell during cell selection and cell reselection.
工厂的AGV在开机时,会扫描周围的5G信号。当它发现一个小区广播了CAG ID时,即使这个小区也对公网用户保留(
cellReservedForOtherUse=true),AGV也会将其视为一个潜在的“内网”候选小区,并上报给上层(NAS)进行决策。而非NPN终端,则会认为此小区是“预留”的而忽略它。 -
接入控制:
During the access procedure… for PNI-NPN the Allowed CAG list is provided to the gNB by the AMF. A single Cause “NPN access denied” will be sent to users when they fail to access NPN cells.
当AGV尝试接入这个CAG小区时,AMF会从UDM获取该AGV的“允许访问的CAG列表”,并将其下发给基站。基站会进行严格的核对。如果一个未经授权的员工私人手机(其签约中没有这个CAG ID)尝试接入,基站会直接拒绝,并返回一个明确的原因值:“NPN接入被拒绝”。
-
移动性管理(切换):
At mobility, the source NG-RAN node… needs to be informed of the… UE allowed CAG ID list… If the… allowed CAG ID list does not match any of the target cell supported list of… CAG IDs, target RAN node shall fail the handover.
当AGV从工厂A区移动到B区,需要切换基站时,源基站会把AGV的“CAG通行证列表”一并告知给目标基站。目标基站会检查自己是否支持列表中的任何一个CAG ID。如果不支持,切换将被拒绝。这确保了专网用户永远不会被错误地切换到公网小区上,保证了业务的连续性和隔离性。
解读:
RAN侧对NPN的支持,为企业专网构建了一道坚固的“无线围墙”。通过广播、接入控制和移动性管理的全面改造,基站本身就成为了专网的第一道“物理门禁”,确保了只有授权的“内部人员”(设备),才能使用专属的“电波通道”,其安全性和隔离性远非Wi-Fi等技术可比。
3. eSBA:重塑网络内部的“沟通法则” (18.5节解读)
克拉拉的网络正变得越来越庞大和复杂。成千上万的NF实例之间,如果都采用Rel-15那种“点对点直连”的服务调用模式,其配置、管理、监控和安全将成为一场灾难。
This WI enhances the service-based architecture of 5G system to improve the service framework and support high reliability. The main features introduced by the WI include: 1) support of indirect communication models of NF/NF Services via an intermediary function (Service Communication Proxy - SCP)…
3.1 SCP:网络功能的“智能API网关”
为了解决“蜘蛛网”式的通信混乱,Rel-16引入了一个重量级的网络功能——SCP(服务通信代理,Service Communication Proxy)。
Model D - Indirect communication with delegated discovery: Consumers do not do any discovery or selection. The consumer adds any necessary discovery and selection parameters required to find a suitable producer to the service request. The SCP uses the request address and the discovery and selection parameters in the request message to route the request to a suitable producer instance.
架构解读:
SCP的角色,类似于现代微服务架构中的“API网关”或“服务网格(Service Mesh)”。它将NF之间的通信模式,从“直接互访”转变为“通过代理间接通信”。
规范原文的“Figure 1: Communication models for NF/NF services interaction”通过A, B, C, D四种模型,清晰地展示了这一演进:
-
模型A/B(Rel-15模式): NF消费者自己去NRF发现服务,然后直接调用服务提供者。
-
模型C/D(Rel-16增强模式): NF消费者将所有服务请求,都统一发送给SCP。它甚至可以不用自己去发现,只需在请求中告诉SCP:“我需要一个支持某某功能的SMF”。由SCP全权代理,去NRF发现、选择一个最合适的SMF实例,并将请求安全地路由过去。
SCP的核心价值:
-
拓扑解耦与简化: NF不再需要知道网络中其他成千上万个NF实例的具体地址,它只需要知道SCP的地址。网络拓扑的管理被极大地简化了。
-
集中式策略控制: 所有的跨NF流量都流经SCP,使得克拉拉可以在SCP上部署统一的负载均衡、访问控制、流量监控和安全策略。
-
提升可靠性: 当某个NF实例失效时,SCP可以自动将流量切换到备用实例上,而消费者NF对此毫无感知。
3.2 绑定机制:在代理模式下保持“会话黏性”
引入了SCP代理后,一个新的问题出现了:如何保证属于同一个会话(例如,同一个PDU会话)的连续多个请求,都能被路由到同一个NF实例上进行处理?
Binding is used to indicate suitable target NF producer instance(s) for NF service instance selection, reselection and routing of subsequent requests associated with a specific NF producer resource (context) and NF service.
Rel-16为此引入了绑定机制(Binding mechanism)。当一个服务提供者(如SMF)在处理一个会话的第一个请求后,它可以在响应中,返回一个“绑定指示”,告诉SCP:“后续所有关于这个会话的请求,请务必继续发给我”。SCP会记录下这个绑定关系,从而保证了会话的“黏性”或“状态一致性”。
总结
通过对18.1/3/4/5等核心系统架构章节的深度解读,我们跟随架构师克拉拉的视角,完成了一次对5G“承重结构”的全面审视。Rel-16的这些增强,共同将5G网络从一个功能性的连接系统,提升为一个真正具备电信级弹性、互联网级敏捷性和企业级定制能力的“未来网络平台”。
-
ETSUN通过引入I-SMF,解决了网络的**纵向扩展性(Scale-up)**问题,使得一张网络能够同时承载全国漫游和区域边缘计算。
-
RAN侧对NPN的支持,通过在无线空口构建“物理门禁”,解决了网络的**横向定制化(Customization)**问题,使得一张公网能够“长出”千万个隔离安全的私网。
-
eSBA与SCP,通过重塑内部通信范式,解决了网络的**内部复杂性(Complexity)**问题,为网络的“自动驾驶”和长期演进奠定了基础。
对于克拉拉而言,Rel-16为她提供了设计下一代网络的“三大法宝”。她设计的网络,将不再是一个僵化的、均质化的管道,而是一个可以根据业务需求,在拓扑、接入和交互上动态“变形”的、充满生命力的有机体。
FAQ环节
Q1:I-SMF和我们在VoLTE中听说的I-CSCF有什么相似之处?
A1:它们在理念上有一定的相似性,都扮演着“中间(Intermediate)”或“入口”的角色,负责信令的路由和分发。但它们作用的领域和具体职责完全不同。I-CSCF是IMS域的信令入口,主要负责用户的注册和会话路由。而I-SMF是5GC中针对PDU会话用户面信令的“区域代理”,主要负责处理与用户本地移动性相关的信令,并使能边缘计算的本地流量分发。
Q2:企业部署PNI-NPN专网,是否意味着要在工厂里安装新的、特殊的基站?
A2:不一定。PNI-NPN的部署非常灵活。企业可以选择要求运营商在厂区内部署专用的基站(只广播CAG ID),以获得最佳的性能和隔离性。也可以选择利用运营商已有的公网宏基站,只要这个宏基站的覆盖范围内包含了该工厂,运营商就可以通过软件配置,让这个宏基站的某个载波或扇区,同时也广播工厂的CAG ID(形成“共享小区”)。后者部署成本更低,速度更快,但无线资源是与公网用户共享的。
Q3:SCP的引入,会不会让它自己成为一个新的性能瓶颈和单点故障?
A3:这是一个非常关键的架构设计问题。为了避免这种情况,SCP本身在设计上就是高可用、可水平扩展的。在一个大规模网络中,运营商会部署一个SCP集群(NF Set),而不是单个SCP实例。这些SCP实例之间可以相互负载均衡和备份。此外,SCP主要处理的是控制面的信令消息路由,而不是用户面的海量数据流,因此其性能压力是可控的。同时,3GPP架构也保留了NF间直接通信的能力,对于某些内部的、时延敏感的交互,仍然可以绕过SCP。
Q4:NWDAF和SCP都是5G核心网新增的“大脑”或“中枢”,它们有什么区别和联系?
A4:它们扮演着不同维度的“中枢”角色。NWDAF是“分析大脑”,它的核心职责是收集数据、进行分析和预测,产出“智能/洞察(Analytics)”。SCP是“通信大脑”或“路由中枢”,它的核心职责是管理和路由NF之间的信令交互。两者可以协同工作:例如,NWDAF分析出某个SMF实例即将过载(产出洞察),它可以将这个分析结果通知给SCP。SCP收到后,在其后续的路由决策中,就会自动降低向这个过载SMF实例分发新请求的权重,从而实现基于智能分析的动态流量调度。
Q5:这些高级架构特性(ETSUN, NPN for RAN, eSBA)对普通手机用户有什么直接影响吗?
A5:虽然这些特性主要面向网络的可扩展性和B端业务,但普通用户也能间接感受到体验的提升。例如,ETSUN的I-SMF机制,可以让你在出差到外地时,手机的休眠唤醒、小区切换等反应更快。NPN for RAN,可以让你在大型场馆(如体育场、机场)连接场馆提供的“专属Wi-Fi”时,获得更稳定、更高速的体验(如果这个“Wi-Fi”的底层是5G PNI-NPN的话)。eSBA的可靠性增强,则会降低整个网络发生大规模故障的概率,让你感觉网络整体上更“稳”了。