深度解析 3GPP TR 21.916:18.1 Enablers for Network Automation Architecture for 5G (5G网络自动化架构使能技术)
本文技术原理深度参考了3GPP TR 21.916 V16.2.0 (2022-06) Release 16规范中,关于“18.1 Enablers for Network Automation Architecture for 5G (eNA)”的核心章节,旨在为读者揭开5G网络如何从一个被动执行指令的“神经网络”,演进为一个具备“自我感知、分析、预测”能力的“智慧大脑”的神秘面纱。
引言:从“消防员”到“占卜师”,5G网络的“大脑”觉醒
在之前的章节中,我们已经见证了5G网络如何在URLLC、V2X、IoT等领域炼就了一身“钢筋铁骨”,具备了前所未有的强大连接能力。然而,一个四肢发达的巨人,如果缺少一个智慧的大脑,也只能算是一个“莽夫”。随着5G网络承载的业务日益复杂、网络规模指数级增长,传统的、依赖人工和事后分析的网络运维(O&M)模式,已经变得捉襟见肘。
为了理解这种困境,让我们隆重介绍本章的主角——Leo。他是一家名为“FutureNet”的顶尖移动运营商的高级网络优化工程师。Leo的日常,就像是一名永不停歇的“网络消防员”。他的办公桌上,永远闪烁着来自不同网管系统的告警:A区域的用户投诉视频卡顿,B区域的基站负载过高,C区域发生了频繁的“乒乓切换”……他依赖的是滞后的统计报表和被动的告警,等他定位到问题根源时,成千上万用户的体验早已受到了影响。Leo梦想着有一天,网络能够拥有“自我意识”,能够告诉他:“Leo,30分钟后市中心体育场的音乐会将导致SMF-03过载,请提前扩容”,而不是等到用户投诉电话被打爆。
Leo的梦想,正是3GPP Rel-15引入NWDAF(网络数据分析功能,Network Data Analytics Function)的初衷——为5G网络植入一个“大脑”的雏形。然而,Rel-15的NWDAF更像是一个概念验证,其能力和标准化程度都有限。真正的“大脑觉醒”,发生在Rel-16。本章的eNA(5G网络自动化使能技术)工作项,为NWDAF注入了灵魂,将其从一个孤立的功能,升级为一个能够汇聚全网数据、提供丰富洞察、赋能闭环自动化的网络智能中枢。
In order to improve the NWDAF initiated in Rel 15, the eNA (Enablers for Network Automation for 5G) feature specifies the data collected by NWDAF and the NWDAF output (i.e. statistics and predictions) to support network automation.
The eNA feature includes:
- Architecture enhancements of 5G System to support network data analytics service
- A framework to enable data collection and provide analytics to consumers
- Extensions to existing Nnwdaf services to support the analytics that are required.
本章,我们将跟随Leo的视角,探索Rel-16如何通过全新的架构、丰富的分析能力和灵活的服务模式,将他从一个被动的“消防员”,转变为一个能够预知未来的“网络占卜师”。
1. 架构之变:从“数据孤岛”到“智慧中枢”
在Rel-15时代,Leo想要分析一个端到端的问题,需要从AMF、SMF、UPF、PCF等多个网元的日志和性能计数器中手动采集数据,过程如同“大海捞针”。这些数据散落在各个“孤岛”上,格式不一,关联困难。eNA的首要任务,就是打破这些孤岛,建立一个统一的数据汇聚与分析框架。
规范原文的18.1节中,通过两张关键的架构图,描绘了这个全新的数据流动范式。
- Non-roaming reference architecture for data analytics:
- Data Collection architecture from any NF:
- Network Data Analytics Exposure architecture:
1.1 数据采集架构:万涓成海
**规范原文“Figure 1: Data Collection architecture from any NF”**清晰地展示了数据如何从网络中的任何NF(网络功能)流向NWDAF。
架构解读:
这张图的核心思想是**“统一汇聚”**。网络中的任何一个NF(AMF, SMF, PCF等),甚至是AF(通过NEF的应用功能),都可以成为NWDAF的“数据提供者”。它们通过标准化的Nnf接口(这里的Nnf是一个泛指,代表各NF与NWDAF之间的接口),将自身的运行数据、统计信息、事件通知等,源源不断地输送给NWDAF。
Leo的视角:
这对于Leo来说是一个革命性的变化。他再也不需要去连接几十个不同的网元来“扒数据”了。他只需要告诉NWDAF:“我需要分析与用户移动性相关的所有事件”。NWDAF会自动订阅来自AMF的移动性管理事件、来自RAN的位置报告、来自UDM的签约信息等。所有相关数据都被汇聚到了NWDAF这个统一的“数据湖”中,等待着被挖掘和分析。
1.2 数据开放架构:洞察赋能
**规范原文“Figure 2: Network Data Analytics Exposure architecture”**则描绘了分析结果如何从NWDAF流出,赋能给其他NF。
架构解读:
这张图的核心思想是**“能力开放”**。NWDAF在对海量数据进行分析、建模、预测后,会将得出的“智能”(即分析结果),通过标准化的Nnwdaf服务化接口,开放给网络中任何一个经过授权的“消费者NF”。
Leo的视角:
NWDAF的分析结果不再是仅仅生成一张报表给Leo看,而是变成了可以被其他网络功能直接消费、并据此做出实时决策的“动态指令”。例如,NWDAF可以告诉PCF:“A区域的网络即将拥塞,请适当调低该区域后台下载业务的优先级”,PCF收到后会自动更新QoS策略。网络第一次实现了基于数据洞察的“思考”与“行动”。
2. 智能的“菜单”:Analytics ID详解,网络能“算”什么?
拥有了强大的架构,下一个核心问题是:NWDAF这个“大脑”到底能思考和计算些什么?Rel-16为此定义了一份详尽的、标准化的“智能菜单”——Analytics IDs。每一个ID都代表着一种特定的分析能力。
For each Analytics ID, the following was specified:
- General description;
- Input data consumed by NWDAF…;
- Output Analytics including details of the parameters;
- Procedure for NWDAF providing the network data analytics.
- Possible usage of analytics by some consumer NFs is defined…
让我们跟随Leo的实际工作场景,逐一品尝这份“智能菜单”上的佳肴。
2.1 “NF负载信息” (NF load information)
Analytics ID = “NF load information”
If the Consumer NF is AMF, based on the SMF Load, AMF could select a suitable SMF during the PDU Session Establishment or Modification procedure.
-
Leo的挑战: 市中心体育场即将举办一场大型演唱会,预计将有5万名观众同时入场,必然会引发信令风暴和数据洪流。如何避免负责该区域的AMF和SMF过载瘫痪?
-
NWDAF的“占卜”:
-
输入: NWDAF持续收集来自全网AMF、SMF、UPF的实时负载信息(CPU、内存、会话数等)。
-
分析与输出: 结合历史数据和事件信息(如演唱会日程),NWDAF的AI模型预测出:“今晚8点至9点,服务于体育场区域的SMF-03负载将达到95%”。它将这个预测性的负载统计暴露出来。
-
智能决策(AMF消费): 负责体育场区域的AMF订阅了这个分析结果。当新的用户(观众)发起PDU会话建立请求时,AMF在选择SMF时,会主动避开即将过载的SMF-03,而选择一个邻近的、负载较轻的SMF-04。一场潜在的网络雪崩,就这样被“未卜先知”地化解了。
-
2.2 “UE移动性” (UE mobility)
Analytics ID = “UE mobility”
If the Consumer NF is AMF, then AMF may use it to optimize the UE’s paging strategy or to learn expected UE behavior parameters for deriving appropriate MICO mode configuration.
-
Leo的挑战: 在市区的交通枢纽,大量用户在地铁和地面之间频繁移动,导致了大量的“乒乓切换”和不必要的寻呼,浪费了网络资源,也增加了终端功耗。
-
NWDAF的“洞察”:
-
输入: AMF上报的UE移动性事件(TAI更新、切换等)、RAN上报的位置信息。
-
分析与输出: NWDAF分析海量用户的历史轨迹,识别出移动性模式。例如,它发现“每天早上8点,有大量UE会从A小区(地铁站)移动到B小区(写字楼),且通常会在B小区停留8小时”。它输出的分析结果是UE的移动轨迹预测。
-
智能决策(AMF消费): AMF获取这个预测后,可以进行两项优化:1)优化寻呼策略:当需要寻呼这个UE时,AMF会优先在预测的目的地B小区进行寻呼,而不是在整个寻呼区域(TA)内“广播”,大大提升了寻呼效率。2)优化节能配置:对于那些移动模式非常规律的IoT设备,AMF可以为其配置更激进的MICO(仅移动发起连接)模式,因为网络已经能“预知”它何时何地会再次活动。
-
2.3 “QoS可持续性” (QoS Sustainability)
Analytics ID = “QoS Sustainability”
If the Consumer is V2X Application Server acting as an AF, the V2X Application Server can use this analytics for the purposes of adjustment of the application, e.g. adjust inter-vehicle gap, change video codec parameters, etc.
-
Leo的挑战: 运营商的V2X合作伙伴(一家自动驾驶卡车公司)投诉,他们的卡车编队在途经某工业园区时,偶尔会因网络抖动而导致编队控制短暂失灵。
-
NWDAF的“预警”:
-
输入: UPF和RAN的QoS监测数据、网络负载信息、无线信道质量报告。
-
分析与输出: NWDAF能够预测在未来的某个时间段、某个地理区域内,特定QoS(如5ms时延)的满足概率。它向V2X服务器暴露的分析结果是:“未来15分钟内,工业园区路段的5ms时延保障满足率,预计将从99.999%下降到99.9%”。
-
智能决策(AF消费): V2X应用服务器(通过NEF订阅了该服务)收到这个预警后,立即向卡车编队下达指令:“即将进入QoS不稳定区域,请将跟车距离从5米增加到10米,并切换到更鲁棒的通信协议”。一次潜在的事故风险,被应用的提前自适应所消除。这与我们在第8章V2X中提到的场景完美呼应。
-
2.4 其他关键分析能力
-
服务体验 (Service experience): 分析某个应用(如视频、云游戏)的MOS(平均意见分)得分,帮助Leo快速定位是网络问题还是应用服务器问题。
-
网络性能 (Network Performance): 预测小区级的吞吐率、时延等KPI,为网络规划和优化提供依据。
-
UE通信 (UE Communication): 分析UE的通信模式,如上下行流量比例、会话时长等,帮助SMF在选择UPF时,选择一个拓扑位置最优的UPF(例如,对于以P2P为主的UE,选择一个离对端更近的UPF)。
-
异常行为 (Abnormal behaviour):
If the Consumer NF is PCF, based on different Exception IDs in the analytics, the PCF could make different policies… “Suspicion of DDoS attack” to request the SMF to terminate the PDU session…
这是网络安全的“哨兵”。NWDAF可以识别出“流量模型异常”、“移动路径异常”、“信令行为异常”等模式。当它发现成千上万的物联网终端突然在同一时间向同一个IP地址发起连接(疑似DDoS攻击),它会立即通知PCF和SMF,触发策略来隔离或终止这些异常会话。
-
用户数据拥塞 (User Data Congestion): 分析并预测特定区域或特定应用(DNN)的拥塞状况,并通知AF,让AF可以主动采取措施(如降低视频码率、提示用户)。
3. 服务的“快递方式”:两种数据暴露模型
NWDAF计算出了这么多宝贵的“情报”,如何高效、灵活地“快递”给需要它们的消费者NF?eNA为此定义了两种标准的服务模式。
NWDAF services to expose Network Data Analytics to the Consumer NFs are specified. Two models are defined:
- Subscribe-Notify model…
- Request-Response model…
1. 订阅-通知模型 (Subscribe-Notify)
-
理念: 消费者NF向NWDAF发起一个长期“订阅”。一旦NWDAF分析出任何满足订阅条件的新洞察,就会主动“通知”消费者。
-
Leo的视角: 这就像Leo在新闻App上订阅了“网络安全”频道。只要有新的安全威胁分析报告出炉,App就会立即向他推送一条通知。这种模式适用于需要对某一主题进行持续监控和实时响应的场景,如负载监控、QoS预警等。
2. 请求-响应模型 (Request-Response)
-
理念: 消费者NF发起一次性的“查询请求”,NWDAF返回当前时刻的分析结果。
-
Leo的视角: 这就像Leo在搜索引擎里输入一个问题:“现在SMF-03的负载是多少?”搜索引擎(NWDAF)会返回一个即时的答案。这种模式适用于临时的、按需的信息获取场景,如AMF在为新用户选择SMF前,进行一次性的负载查询。
这两种灵活的服务模式,确保了NWDAF的智能可以根据不同消费者的不同需求,以最高效的方式进行传递和应用。
总结:5G网络,始具“智慧”
通过对18.1节的深度解读,我们看到Rel-16的eNA特性,真正为5G网络点亮了“智慧之光”。它通过一个统一的架构、丰富的分析能力“菜单”和灵活的服务模式,将NWDAF从一个抽象的概念,锻造成了一个强大、实用、可扩展的网络智能中枢。
-
它打破了数据孤岛,让网络第一次能够全面地“自我审视”。
-
它引入了AI和大数据分析,让网络第一次具备了**“洞察过去、预测未来”**的能力。
-
它打通了分析与决策的闭环,让网络第一次能够基于数据洞察,进行实时的“自我优化”。
对于Leo和“FutureNet”而言,一个全新的网络运维时代已经到来。网络不再是需要他时刻紧盯的“病人”,而是一个能够自我诊断、自我调节、甚至自我进化的“智慧生命体”。他终于可以从繁琐的“救火”工作中解放出来,将精力投入到更高阶的业务创新和架构演进中。5G的“自动驾驶网络”(Autonomous Network)之路,自此,才真正迈出了坚实的第一步。
FAQ环节
Q1:Rel-15的NWDAF和Rel-16的eNA增强,最核心的区别是什么?
A1:最核心的区别在于系统化和实用化。Rel-15的NWDAF更像是一个功能单一的“分析孤岛”,它能从少数几个NF获取数据,提供有限的几种分析(如切片负载)。而Rel-16的eNA,则将其系统化为一个网络智能平台:1) 数据源更广:明确定义了几乎所有NF都可以成为数据源;2) 分析能力更丰富:标准化了一整套详尽的Analytics IDs,覆盖了负载、移动性、QoS、安全等方方面面;3) 服务模式更清晰:定义了订阅/通知和请求/响应两种模式,使其能被其他NF和外部应用方便地集成。
Q2:NWDAF是5G核心网的强制性网元吗?
A2:不是。NWDAF在3GPP规范中是一个**可选(Optional)**网元。一个没有NWDAF的5G网络,在基础的通信功能上是完备的。然而,如果运营商希望构建一个智能、高效、能够自我优化的“自动驾驶网络”,降低Opex,并对外提供高价值的网络能力API,那么部署NWDAF就变得至关重要。可以说,NWDAF是实现5G网络从“功能机”到“智能机”跨越的关键。
Q3:NWDAF分析了如此多的网络和用户数据,如何保证用户隐私?
A3:NWDAF在设计上严格遵循隐私保护原则。它分析的对象是海量的、匿名的、聚合后的数据和行为模式,而不是单个用户的具体通信内容。例如,它关心的是“某个区域用户的平均移动速度和方向”,而不是“张三的具体位置”;它关心的是“某个视频应用的平均卡顿率”,而不是“李四在看什么视频”。所有可能涉及个人隐私的数据,在被用于分析前,都会经过严格的匿名化和脱敏处理。
Q4:NWDAF的分析结果是100%准确的吗?
A4:不是100%准确,但追求高可用性的概率性预测。NWDAF的很多输出是基于历史数据和AI模型的“预测(Prediction)”或“统计(Statistics)”。例如,它预测网络负载、预测UE移动轨迹。这些预测必然存在一定的误差,但其价值在于,即使只有80%或90%的准确率,也足以让网络从完全的“被动响应”转变为“主动预备”,从而极大地提升网络效率和鲁棒性。
Q5:第三方应用(如一个物流公司的调度平台)可以直接从NWDAF获取分析数据吗?
A5:不能直接获取,但可以通过NEF(网络能力开放功能)间接、安全地获取。NWDAF是核心网内部的网元,其接口不对外直接暴露。当第三方应用需要网络分析能力时(如V2X服务器需要QoS可持续性分析),它会向NEF发起API请求。NEF作为安全网关,在对第三方进行认证和授权后,再代表它向NWDEAF发起内部服务请求,并将获取到的分析结果(经过策略过滤和格式转换后)返回给第三方应用。这确保了网络能力的开放是在一个安全、可控的框架下进行的。