好的,我们继续本次的深度探索之旅。在前序文章中,我们已经系统性地剖析了NWDAF如何进行切片负载分析、业务体验分析等面向“外部服务”的智能。今天,我们将把目光转向网络内部,聚焦于5G核心网的“自我健康管理”——网络功能负载分析。
深度解析 3GPP TS 23.288:6.5 NF load analytics (网络功能负载分析)
本文技术原理深度参考了3GPP TS 23.288 V18.9.0 (2025-03) Release 18规范中,关于“6.5 NF load analytics”的核心章节。本文旨在为读者详细剖析NWDAF如何化身“网络中枢神经系统”,实时感知并预测各个核心网功能(NF)的负载压力,从而为网络的弹性伸缩、智能路由和高可靠性运行提供决策依据。
5G核心网是一个由众多高度专业化的网络功能(NF)组成的复杂分布式系统,如负责接入与移动性管理的AMF、负责会话管理的SMF、负责用户数据管理的UDM等。在大型活动、节假日抢购或突发事件等场景下,这些NF可能会面临瞬时的、巨大的信令冲击。如果不能提前预测并应对,就可能导致NF过载、响应延迟甚至服务中断,严重影响用户体验。
网络功能负载分析 (NF load analytics) 正是NWDAF“小慧”为应对这一挑战而生的“健康晴雨表”和“压力预测仪”。她不再仅仅关注外部的切片或业务,而是将目光投向自己的“兄弟姐妹”,实时监控它们的“健康状况”(负载),并预测它们未来的“工作压力”。
场景设定:“双十一”购物节零点的钟声即将敲响。运营商的最高级别网络运维大脑——“智网中枢”(一个高级OAM系统或网络编排器),肩负着保障全国用户在那一刻能够顺畅“秒杀”的重任。它知道,零点一到,数以亿计的用户将同时发起网络请求,这将对核心网,特别是AMF(处理注册、服务请求)和SMF(处理PDU会話建立)造成史无前例的冲击。“智网中枢”必须提前知道哪些区域的AMF/SMF将面临最大压力,并提前进行资源扩容。为此,它向“小慧”下达了一项最高优先级的任务。
1. “网络健康体检”:NF负载分析的服务内容 (TS 23.288 Clause 6.5.1)
“智网中枢”在向“小慧”请求“NF健康体检”时,需要明确哪些检查项目?6.5.1节“General”对此进行了定义。
The clause 6.5 describes how NWDAF can provide NF load analytics, in the form of statistics or predictions or both, to another NF. The service consumer may be an NF, or the OAM.
“小慧”的核心任务是:为消费者(其他NF或OAM)提供关于特定NF的负载统计和/或预测。
1.1 核心请求参数
Analytics ID = "NF load information": 明确“体检”主题。Target of Analytics Reporting: 可选参数。如果指定了特定用户(SUPI),则“小慧”会分析服务该用户的NF(如AMF、SMF)的负载。但在本场景中,“智网中枢”关心的是区域性的NF负载,因此通常设置为“any UE”或不设置。Analytics Filter Information: 这是圈定“体检对象”的关键。an optional list of NF Instance IDs, NF Set IDs, or NF types: “智网中枢”可以精确指定要检查的NF。例如:“请检查NF类型为AMF和SMF的所有实例”。optional area of interest: “智网中枢”进一步限定范围:“检查范围限定在北京、上海、广州的CBD区域”。optional S-NSSAI: 还可以进一步细化,例如:“只关心承载了‘电商抢购’专用切片的那些AMF/SMF实例”。
通过这些参数,“智网中枢”向“小慧”下达了明确指令:“请预测‘双十一’零点前后,北上广CBD区域内,所有AMF和SMF的负载情况。”
2. “望闻问切”:负载分析的数据来源 (TS 23.288 Clause 6.5.2)
要成为一名出色的“网络医生”,“小慧”需要通过多种手段来收集NF的“生命体征”。
2.1 “官方报告”:来自NRF和OAM的核心指标 (Table 6.5.2-1)
这是最直接、最基础的数据来源。
表格用途解读与重绘:
Table 6.5.2-1: Data collected by NWDAF for NF load analytics
| Information | Source | Description |
|---|---|---|
| NF load | NRF | NF实例在其NF Profile中自己上报的负载信息(通常是一个百分比)。 |
| NF status | NRF | NF实例的状态(registered, suspended等)。 |
| NF resource usage | OAM | NF实例的实际物理/虚拟资源使用率(如CPU、内存、磁盘的平均使用率)。 |
| NF resource configuration | OAM | NF资源的生命周期变更(如NF实例扩容或缩容)。 |
这里揭示了一个关键点:NF load (from NRF) 和 NF resource usage (from OAM) 的区别。
- NRF的NF load 是NF**“自己感觉”**的负载,是应用层面的指标,例如“我处理的会话数已经达到我容量上限的80%了”。
- OAM的resource usage 是NF**“身体的真实状况”**,是底层资源的物理指标,例如“我的CPU使用率已经95%了”。
“小慧”会综合这两个指标,做出更准确的判断。一个NF可能应用层负载不高,但底层CPU泄漏导致资源耗尽,反之亦然。
2.2 “流量前线”的特别情报:来自UPF、AF和MDT的数据
仅仅看NF自身的负载是不够的,高明的医生需要“治未病”,即通过外部的“征兆”来预测未来的“病情”。
-
来自UPF的情报 (Table 6.5.2-2):
Report of user plane traffic in the UPF for the accumulated usage of network resources… UPF的**
Traffic usage report**反映了用户面流量的真实情况。流量的激增,往往是控制面信令风暴(导致AMF/SMF过载)的前兆。 -
来自UE的“群体行为”情报 (Tables 6.5.2-3, 6.5.2-4, 6.5.2-5): 这是实现预测的关键。
- MDT数据 (Table 6.5.2-3): OAM通过MDT收集的大量用户的移动速度和方向,可以帮助“小慧”预测人群的聚集趋势。
- AF数据 (Table 6.5.2-5): AF可以提供**
Collective Attribute**(群体属性)。在“双十一”场景中,“淘淘乐”App的AF可以向“小慧”提供一个关键情报:“监测到在11月10日23:55,有超过500万用户同时打开了我们的App并停留在抢购页面”。
这个来自AF的“群体行为”情报,对于“小慧”来说是含金量极高的“领先指标”。她可以立即推断出:这500万用户在零点一到,极大概率会同时发起PDU会话修改或建立请求,这将直接转化为对SMF和AMF的巨大负载冲击。
3. “体检报告与预测”:负载分析的输出 (TS 23.288 Clause 6.5.3)
在融合了所有“望闻问切”得到的信息后,“小慧”将出具一份关于NF健康状况的报告。
3.1 NF负载统计 (Table 6.5.3-1)
这份报告总结了“过去”的NF负载情况,用于事后复盘和基线建立。
表格用途解读与重绘:
Table 6.5.3-1: NF load statistics
| Information | Description |
|---|---|
| > NF type / NF instance ID | NF的类型或具体实例ID |
| > NF status | NF的可用性状态统计 |
| > NF resource usage | NF资源的平均使用率 |
| > NF load (average, peak) | NF应用层负载的平均值和峰值 |
| > NF load (per area of interest) | 特定区域内NF的平均负载 |
3.2 NF负载预测 (Table 6.5.3-2)
这是“智网中枢”最关心的报告,它预测了“未来”的NF负载压力。
表格用途解读与重绘:
Table 6.5.3-2: NF load predictions
| Information | Description |
|---|---|
| > NF load (average, peak) | 预测的NF负载平均值和峰值 |
| > NF resource usage | 预测的NF资源平均使用率 |
| > Confidence | 预测的置信度 |
报告解读: 在“双十一”零点前的10分钟,“智网中枢”收到了“小慧”的紧急预警:“预测报告:
- 对象: 北京CBD区域的AMF-Set-01和SMF-Set-02。
- 预测: 预计在00:00到00:05之间,AMF-Set-01的应用层峰值负载将达到98%,SMF-Set-02的CPU平均使用率将达到95%。
- 置信度: 97%。”
4. “应急预案”:从预测到闭环行动的流程 (TS 23.288 Clause 6.5.4)
Figure 6.5.4-1: NF load analytics provided by NWDAF 描绘了从请求到闭环行动的完整流程。
- “智网中枢”发起订阅: “智网中枢”(NF Consumer)向“小慧”(NWDAF)订阅北上广CBD区域AMF/SMF的负载预测。
- “小慧”启动多源侦察:
- 2-5: 向OAM订阅目标NF实例的资源使用率历史数据和MDT用户移动数据。
- 6: 向AF(如“淘淘乐”)订阅群体行为属性。
- 7a-7b: 向NRF订阅目标NF实例实时上报的负载和状态信息。
- “小慧”进行分析预测 (8): “小慧”将所有信息输入她的“NF负载预测模型”。该模型关联了“用户群体行为”(如500万人打开App)与“网络信令负载”(PDU会话请求数),以及“信令负载”与“NF资源消耗”之间的复杂关系,最终生成了高置信度的负载预测。
- “小慧”发送预警 (9): “小慧”将预测报告发送给“智网中枢”。
- “智网中枢”执行应急预案: 收到预警后,“智网中枢”立即采取行动。它调用云管理平台(NFVO/VNFM)的接口,对北京CBD区域的AMF-Set-01和SMF-Set-02进行预测性扩容 (Predictive Scaling-out),提前增加了多个AMF和SMF实例。
零点到来,流量洪峰如期而至。由于提前扩容,核心网平稳地承接了所有用户的请求,无一拥塞,无一卡顿。“智网中枢”和“小慧”的这次完美配合,保障了一场数亿人参与的数字狂欢。
FAQ - 常见问题解答
Q1:NF负载分析与传统的基于阈值的告警系统有什么根本不同? A1:根本不同在于从“被动响应”到“主动预测”的转变。传统告警系统是“事后诸葛亮”:当NF的CPU使用率已经超过90%时,它才会告警,此时可能已经有用户体验受损。而NF负载分析是“事前预言家”:它通过分析用户行为等领先指标,在负载高峰到来之前就预测到压力的产生,为网络采取预防性措施(如提前扩容)赢得了宝贵的时间窗口。
Q2:在NF负载分析中,为什么来自AF的数据如此重要? A2:因为AF提供了最接近用户意图的“领先指标”。网络负载的根源是用户的业务行为,而用户的业务行为首先体现在应用层面。当AF告知NWDAF“有大量用户正在我的App里准备抢购”时,它提供了一个极强的信号,预示着接下来必然会发生大规模的网络请求。相比于等待网络层的流量已经起来再做分析,利用AF的“群体行为”数据可以让预测的提前量更长、准确性更高。
Q3:AMF在为新用户选择SMF时,如何利用NF负载分析? A3:这是一个典型的NF负载分析的应用场景。当一个UE发起PDU会话建立请求时,AMF需要从一个SMF池(SMF Set)中选择一个实例来为该UE服务。传统的选择算法可能是轮询或随机。而一个“聪明”的AMF可以向NWDAF请求它所管辖的SMF Set的实时负载预测。然后,AMF会基于“最小负载优先”的原则,将新的PDU会话请求路由到当前及未来一段时间内预计最空闲的那个SMF实例上,从而实现动态、智能的负载均衡。
Q4:NWDAF的输出中,NF load和NF resource usage有什么区别,应该如何使用?
A4:
NF load是应用层负载,通常是NF开发者根据其内部处理逻辑定义的一个百分比(如会话容量、TPS容量等)。它反映了业务处理能力的饱和度。NF resource usage是资源层负载,指CPU、内存等底层计算资源的消耗率。它反映了物理/虚拟资源的饱和度。 在理想情况下,两者是正相关的。但有时会出现偏差,例如内存泄漏可能导致resource usage很高而NF load很低。因此,一个完善的消费者(如“智网中枢”)应该同时监控这两个指标,以获得对NF健康状况的全面视图。
Q5:如果一个NF实例即将过载,除了扩容(Scaling-out),NF负载分析还能指导哪些操作? A5:除了扩容,NF负载分析还可以指导多种其他的网络操作:
- 流量重路由 (Traffic Rerouting):AMF或SMF可以将新来的用户请求重定向到其他区域或其他Set的NF实例上。
- 准入控制 (Admission Control):在极端情况下,如果所有资源都已饱和,AMF/SMF可以根据NWDAF的预测,拒绝低优先级用户(如普通免费用户)的接入请求,以保障高优先级用户(如VIP用户、紧急呼叫)的服务。
- 策略调整 (Policy Adjustment):PCF可以根据NF负载预测,临时下发更严格的策略,例如,降低某些非关键业务的带宽,以减轻UPF和SMF的压力。