好的,我们继续启程,深入探索3GPP TS 23.288规范的核心腹地。

深度解析 3GPP TS 23.288:5 Network Data Analytics Functional Description (网络数据分析功能描述)

本文技术原理深度参考了3GPP TS 23.288 V18.9.0 (2025-03) Release 18规范中,关于“5 Network Data Analytics Functional Description”的核心章节,旨在为读者提供一个5G网络数据分析功能(NWDAF)内部运作机制与核心逻辑的全景视图。

如果说上一篇文章我们鸟瞰了NWDAF这座“智慧城市”的宏伟蓝图(参考架构),那么今天,我们将深入城市的内部,探访各个功能建筑的内部运作,理解市民(网络功能)们是如何在这里协同生活和工作的。

我们将继续跟随AI网络优化系统“小慧”的视角。她已经清楚了自己在网络中的“家庭住址”和“社区配套”(架构),现在,她需要深入理解自己的“工作职责”和“社交规则”(功能描述)。为了让这一切不那么抽象,我们引入一个典型场景:一位名叫“小明”的用户,正在使用一部5G手机,沉浸式地体验一款对网络时延和带宽要求极高的云游戏。保障“小明”的极致体验,正是“小慧”团队面临的日常挑战。

1. “小慧”的双重身份:分析师(AnLF)与科学家(MTLF) (TS 23.288 Clause 5.1)

在NWDAF的智慧城市里,并非所有的“小慧”都做着同样的工作。规范在5.1节“General”中,为她赋予了两种截然不同但又紧密协作的逻辑身份。

The NWDAF provides analytics to 5GC NFs and OAM as defined in clause 7. An NWDAF may contain the following logical functions:

  • Analytics logical function (AnLF): A logical function in NWDAF, which performs inference, derives analytics information (i.e. derives statistics and/or predictions based on Analytics Consumer request) and exposes analytics service i.e. Nnwdaf_AnalyticsSubscription or Nnwdaf_AnalyticsInfo.
  • Model Training logical function (MTLF): A logical function in NWDAF, which trains Machine Learning (ML) models and exposes new training services (e.g. providing trained ML Model) as defined in clause 7.5 and clause 7.6.

这段原文定义了NWDAF的“人格分裂”:

  • AnLF (分析逻辑功能):这是“一线分析师”小慧。她的主要工作是“推理(inference)”,利用现成的机器学习模型和实时数据,快速生成统计或预测结果。当PCF(策略控制功能)为了保障“小明”的游戏体验,需要预测未来5分钟内小明所在小区的网络负载时,正是AnLF小慧快速响应,给出来自未来的“情报”。

  • MTLF (模型训练逻辑功能):这是“后台科学家”小慧。她的工作是“训练(trains)”,如同在实验室里埋头研究。她利用海量的历史数据,通过复杂的算法训练、验证、迭代机器学习模型。那个用于预测小区负载的精准模型,正是出自MTLF小慧之手。

这种职责分离带来了巨大的好处:运营商可以将计算资源消耗巨大的模型训练任务(MTLF),集中部署在数据中心的强大服务器上;而将需要快速响应的推理任务(AnLF),部署在更靠近网络边缘的位置,实现资源优化和性能最大化。

更重要的是,为了保证分析结果的质量,“小慧”还具备自我净化和修正的能力。

To guarantee the accuracy of analytics output for an Analytics ID, based on the UE abnormal behaviour analytics from itself or other NWDAF including abnormal UE list and the observed time window, the NWDAF is to detect and may delete the input data from the abnormal UE(s) and then may generate a new ML Model and/or analytics outputs…

这意味着,如果“小慧”发现某些用户(比如因为手机故障而行为异常的用户)的数据是“脏数据”,她会主动将其从训练数据集中剔除,以保证训练出的模型不会被“带偏”,从而确保分析结果的准确性。这体现了NWDAF设计的严谨性。

2. “你好,请问谁是分析专家?”——NWDAF的发现与选择 (TS 23.288 Clause 5.2)

当“小明”开始游戏时,PCF决定向NWDAF寻求帮助。但在庞大的5G网络中,可能存在成百上千个“小慧”实例,PCF该如何找到最适合为“小明”服务的那一位呢?这就是5.2节“NWDAF Discovery and Selection”要解决的核心问题。

The NWDAF service consumer selects an NWDAF that supports requested analytics information and required analytics capabilities and/or requested ML Model Information by using the NWDAF discovery principles defined in clause 6.3.13 of TS 23.501.

寻找“小慧”的过程,本质上是一个服务发现过程,主要通过NRF(网络功能存储库功能)来完成,就像是通过网络世界的“大众点评”来寻找服务。发现和选择的逻辑根据分析任务的类型有所不同。

2.1 发现AnLF(一线分析师)

PCF想为“小明”的游戏业务获取“UE移动性预测”分析。这个分析与特定用户“小明”相关,属于UE相关分析 (UE related analytics)。发现过程如下:

  1. 基于位置的初筛:PCF知道“小明”当前所在的区域(Area of Interest),它会向NRF查询:“请告诉我,哪些NWDAF(AnLF)的服务范围覆盖了这个区域,并且能够提供‘UE移动性预测’(由Analytics ID标识)?”

  2. 处理无明确区域的情况:如果PCF没有提供具体区域,或者找不到完全匹配的“小慧”。

    If the analytics is related to UE(s) and the NWDAF service consumer (other than an NWDAF) cannot provide an Area of Interest for the requested data analytics, the NWDAF service consumer may select an NWDAF with large serving area… Alternatively, in case the consumer receives NWDAF(s) with aggregation capability, the consumer preferably selects an NWDAF with aggregation capability with large serving area.

    这时,PCF会采取两种策略:

    • 选择“劳模”:找一个服务范围最大的“小慧”(NWDAF with large serving area)。
    • 选择“领导”:找一个具备“聚合能力”的“小慧”(NWDAF with aggregation capability),由这个“领导”去协调其他“下属”共同完成任务。
  3. 发现的“捷径”——查询UDM

    In order to discover an NWDAF that has registered in UDM for a given UE:

    • NWDAF service consumers or other NWDAFs interested in UE related data or analytics, if supported, may make a query to UDM to discover an NWDAF instance that is already serving the given UE.

    这是一个非常智能的优化。如果某个“小慧”实例已经开始为“小明”提供服务(例如,AMF已经订阅了小明的移动性分析),那么这个“小慧”会很贴心地去UDM(统一数据管理)中“小明”的档案下留个便条:“我是正在为小明服务的NWDAF-A”。之后,当PCF也想为“小明”获取分析服务时,它可以先去UDM翻一下“小明”的档案,直接找到NWDAF-A,大大提高了效率。

2.2 发现MTLF(后台科学家)

假设一个AnLF“小慧”需要一个新的、更精准的模型来预测游戏业务的网络拥塞。她需要找到一个MTLF“小慧”来为她训练模型。

In order to discover an NWDAF containing MTLF via NRF: …a consumer (e.g. an NWDAF containing AnLF…) may include in the request the target NF type (i.e. NWDAF), the Analytics ID(s), the S-NSSAI(s), Area(s) of Interest of the Trained ML Model required and Vendor ID.

AnLF向NRF的查询会更加具体,可能包含:

  • Analytics ID:我需要用于“网络拥塞预测”的模型。
  • S-NSSAI/Area of Interest:这个模型最好是用游戏切片(S-NSSAI)和特定区域的数据训练出来的。
  • Vendor ID:为了保证兼容性,我希望模型是由A厂商的MTLF训练的。

NRF会返回符合条件的MTLF候选列表,AnLF再从中选择一个来启动模型训练或获取已训练好的模型。

3. 集体智慧的进化:联邦学习 (TS 23.288 Clause 5.3)

单个“小慧”的智慧是有限的,但整个“小慧”团队的智慧是无穷的。5.3节“Federated Learning (FL) among multiple NWDAFs”描述了一种尖端的群体智能进化方式。

Federated learning among multiple NWDAFs is a machine learning technique in core network that trains an ML Model across multiple decentralized entities holding local data set, without exchanging/sharing local data set. This approach stands in contrast to centralized machine learning techniques where all the local datasets are uploaded to one server, thus allowing to address critical issues such as data privacy, data security, data access rights.

场景:假设运营商在华北、华东、华南各部署了一个MTLF“小慧”,每个“小慧”都拥有本地用户的海量数据。现在,他们希望共同训练一个全国范围的、更精准的用户移动模型。但出于数据隐私和安全法规,华北的数据不能直接发送到华东或华南。联邦学习完美地解决了这个问题。

这个过程中,角色被清晰地定义:

  • FL server NWDAF:联邦学习服务器,扮演“总教练”的角色。
  • FL client NWDAF:联邦学习客户端,扮演“学员”的角色。

“总教练”和“学员”们通过以下步骤,隔空练就神功:

  1. 总教练下发任务:“总教练”小慧(FL Server)发现并选择华北、华东、华南的“学员”小慧(FL Clients),并给她们一个初始的、比较粗糙的模型。
  2. 学员本地训练:每个“学员”小慧用自己的本地数据(例如,本地用户移动数据)对这个模型进行“本地化训练”,使模型更适应本地情况。
  3. 学员汇报心得:训练完成后,“学员”们并不上传她们的本地数据,而是上传模型的“更新参数”或“训练心得”(例如,模型权重梯度)。
  4. 总教练博采众长:“总教练”收集所有“学员”的“心得”,通过聚合算法(如FedAvg),将大家的智慧融为一体,生成一个性能更优的“全局模型”。
  5. 下发新模型,开启新一轮迭代:总教练再将这个新的全局模型分发给所有学员,重复上述过程,直到模型性能收敛。

通过这种方式,“小慧”团队在不泄露任何用户原始数据的前提下,实现了集体智慧的共同进化。

4. 新增功能模块深度剖析 (Clauses 5A, 5B, 5C)

随着R16及后续版本的演进,3GPP为NWDAF架构引入了几个至关重要的增强功能模块,极大地提升了其能力。

4.1 数据收集的“总调度师”:DCCF功能详述 (Clause 5A)

我们在架构篇已经介绍了DCCF作为数据协调员的角色。5A章节则深入描述了它的具体工作方法。

4.1.1 智能的“通讯录”

当“小慧”(或DCCF)需要收集关于用户“小明”的数据时,她如何知道应该联系哪个AMF或SMF呢?Table 5A.2-1 就是她的“智能通讯录”。

表格用途解读: 这张表格的核心作用是服务发现映射。它告诉数据消费者(如NWDAF或DCCF),为了获取关于某个UE的特定类型数据,应该去查询哪个“上级”网元(NF to be contacted)来找到最终的数据源(Type of NF instance to determine)。

  • 比如,要找到为“小明”服务的AMFSMF,表格指示DCCF应该去查询UDM
  • 要找到为“小明”服务的PCF,则需要先通过NRF找到BSF(绑定支持功能),再由BSF告知PCF的地址。

Markdown表格重绘:

Table 5A.2-1: NF Services consumed by DCCF or NWDAF to determine which NF instances are serving a UE

Type of NF instance (serving the UE) to determineNF to be contacted by DCCFServiceReference in TS 23.502
UDMNRFNnrf_NFDiscovery (NOTE 1)5.2.7.3
AMFUDMNudm_UECM5.2.3.2
SMFUDMNudm_UECM5.2.3.2
BSFNRFNnrf_NFDiscovery (NOTE 1)5.2.7.3
PCFBSFNbsf_Management5.2.13.2
NEFNRFNnrf_NFDiscovery5.2.7.3
NWDAFNRF, UDMNnrf_NFDiscovery, Nudm_UECM5.2.7.3, 5.2.3.2
GMLCNRFNnrf_NFDiscovery (NOTE 2)5.2.7.3
NSACFNRFNnrf_NFDiscovery5.2.7.3
NOTE 1: Discovery can be based on a group ID. The group ID for a UE ID can be obtained using the Nudr_GroupIDmap service defined in clause 5.2.12.3 of TS 23.502.
NOTE 2: Discovery of the GMLC serving a UE is described in clause 5.1a of TS 23.273 and can also be based on DNS. A GMLC is supposed to be able to serve any UE in the PLMN; the GMLC will in turn discover an AMF serving the UE via the UDM as described in clause 6.1 of TS 23.273.

4.1.2 灵活的数据格式化与处理

5A.4节“Data Formatting and Processing”是DCCF和NWDAF的一大“杀手锏”。它允许数据消费者提出非常精细化的数据上报要求。

Formatting determines when a notification is sent to the Consumer. Formatting Instructions may indicate:

  • Notification Event clubbing: Buffering and sending of several notifications in one message.
  • Notification Time Window (example: notifications are buffered and sent between 2 and 3 AM).
  • Cross event reference-based notification…
  • Consumer triggered Notification…

这些指令赋予了数据收集极大的灵活性:

  • 事件打包 (Clubbing):AMF不必每次“小明”一动就上报,可以攒够10次移动事件再打包上报一次,大幅减少信令。
  • 时间窗口 (Time Window):只在凌晨2点到3点网络空闲时上报前一天的所有数据,避免对白天业务造成冲击。
  • 消费者触发 (Consumer triggered):数据源先缓存数据,等“小慧”主动来取时再一次性给到,实现了拉(Pull)模式的数据获取。

此外,处理指令 (Processing instructions) 还能让数据源(或DCCF)对数据进行预处理,比如计算平均值、方差、最大/最小值等,只上报聚合后的统计结果,进一步降低了数据传输量。

4.2 网络记忆的守护者:ADRF功能详述 (Clause 5B)

5B节“Analytics Data Repository Functional Description”详细描述了ADRF作为“网络记忆库”的服务能力。

The ADRF offers services that enable a consumer to store, retrieve and delete data and analytics.

ADRF对外提供了一套标准的“存、取、删”服务接口,主要包括:

  • 数据存储 (Storage):消费者可以通过 Nadrf_DataManagement_StorageRequest 直接将数据存入ADRF,或者通过 Nadrf_DataManagement_StorageSubscriptionRequest 请求ADRF去订阅并存储来自某个数据源(如NWDAF)的数据。
  • 数据检索 (Retrieval):同样,消费者可以一次性检索(RetrievalRequest)或订阅(RetrievalSubscribe)ADRF中存储的数据。
  • 数据删除 (Delete):通过 Nadrf_DataManagement_Delete 删除不再需要的数据。

ADRF还引入了“生命周期”管理的概念。消费者在存储数据时可以指定一个存储生命周期 (lifetime),ADRF会在此期限后自动删除数据,并可以在删除前发送提醒。这确保了“网络记忆库”不会无限膨胀,实现了高效的数据治理。

4.3 智能的自我审视:分析/模型精度监控 (Clause 5C)

一个只做预测而不关心对错的智能系统是危险的。5C节“Analytics/ML Model Accuracy Monitoring Functional Description”赋予了“小慧”自我审视和持续改进的能力。

A NWDAF may have the accuracy checking capability for Analytics and/or ML Models. The NWDAF may provide the accuracy information to consumers when requested or use it for its internal processes.

核心逻辑:通过比较“预测值”和“真实值(Ground Truth)”来评估精度。

  • 场景:“小慧-AnLF”预测“小明”在10分钟后会移动到小区B。10分钟后,AMF上报了“小明”的真实位置——他确实在小区B。这次预测就是准确的。如果他去了小区C,预测就是错误的。
  • 精度信息 (Accuracy Information):通过大量此类事件的统计(例如,在100次预测中正确了95次),NWDAF就可以计算出“UE移动性预测”这个分析项的准确率为95%,并将这个“精度信息”提供给消费者。
  • 反馈驱动的提升:当PCF根据“小慧”的预测调整了“小明”的QoS策略后,可以将这一行动作为“分析反馈信息(Analytics Feedback Information)”告知“小慧”。“小慧”知道自己的预测被采纳并影响了网络行为,这可以帮助她更准确地评估后续预测的效果,形成一个闭环优化。

这个机制确保了NWDAF的智能不是一成不变的,而是在与真实网络环境的持续互动中,不断进行自我评估和迭代优化的生命体。


FAQ - 常见问题解答

Q1:AnLF和MTLF在实际网络部署中有什么区别和联系? A1:在实际部署中,AnLF(分析逻辑功能)通常被部署得更广泛、更靠近数据消费者(如AMF、PCF),因为它负责实时、低时延的分析推理。而MTLF(模型训练逻辑功能)因为需要处理海量数据和进行复杂计算,通常被集中部署在数据中心,数量较少但计算能力强大。它们之间的关系是“生产”与“消费”:MTLF是“模型工厂”,生产出高质量的ML模型;AnLF是“应用商店”,从MTLF处获取模型并将其应用到实际的网络优化场景中。

Q2:一个NF(比如PCF)在寻找NWDAF时,是优先查NRF还是UDM? A2:这取决于具体场景和优化策略。一般而言,如果PCF是第一次为某个UE(如“小明”)请求分析,或者它需要的是与UE无关的区域性分析,它会查询NRF。如果PCF之前或其他NF已经为“小明”请求过分析,并且服务该UE的NWDAF已经在UDM中注册了信息,那么直接查询UDM会是更高效的“捷径”。可以理解为,NRF是“公用黄页”,UDM是“个人档案里的常用联系人”。

Q3:联邦学习(Federated Learning)相比于把所有数据集中到一个中央NWDAF进行训练,最大的优势是什么? A3:最大的优势在于数据隐私保护和安全性。在很多国家和地区,严格的法规(如GDPR)限制了用户数据的跨地域流动。联邦学习通过只交换不包含个人敏感信息的模型参数(梯度或权重)而非原始数据,使得在不违反数据隐私法规的前提下,利用多方数据协同训练模型成为可能。此外,它还减少了海量原始数据在网络中传输的带宽开销。

Q4:DCCF看起来在数据收集中间增加了一个节点,这不会增加时延吗?为什么需要它? A4:虽然DCCF增加了一个处理节点,但它的核心价值在于减少对数据源NF的信令风暴和重复订阅。当网络中有大量NWDAF实例或其他NF消费者都需要订阅来自同一个AMF的同一类事件时,如果没有DCCF,AMF会收到成百上千份相同的订阅请求,并需要向每个订阅者发送通知,造成巨大的信令负载。有了DCCF,它作为唯一的订阅代理,AMF只需处理一份订阅并向DCCF发送一份通知,再由DCCF分发给所有最终消费者。在多消费者场景下,这种“批发转零售”模式的总体效率远高于“直销”。

Q5:什么是“地面真实(Ground Truth)”数据?在电信网络中如何获取? A5:“地面真实”或“真实值”(Ground Truth)是机器学习领域的术语,指的是用于验证模型预测结果的、真实发生的、可观测的客观事实。在电信网络中,它通常指代网络中实际发生的事件或测量值。例如,NWDAF预测一个UE将要发生切换,那么该UE之后从gNB上报的测量报告和实际发生的切换信令就是“真实值”;NWDAF预测一个切片的时延将超过20ms,那么从UPF或OAM采集到的实际端到端时延测量结果就是“真实值”。通过比较预测与真实,系统才能评估其精度。