非常好,让我们继续这次的深度探索之旅,揭开5G智能网络“记忆中枢”的神秘面纱。
深度解析 3GPP TS 23.288:5B Analytics Data Repository Functional Description (分析数据存储库功能描述)
本文技术原理深度参考了3GPP TS 23.288 V18.9.0 (2025-03) Release 18规范中,关于“5B Analytics Data Repository Functional Description”的核心章节,旨在为读者详细阐述5G网络的“长期记忆”与“智慧宝库”——ADRF(分析数据存储库)的核心功能与运作机制。
在前两篇文章中,我们已经结识了NWDAF“小慧”这位AI网络优化专家,并了解了她的“数据总管家”DCCF。我们知道,“小慧”的许多高级智能,如趋势预测、模型训练,都严重依赖于历史数据的积累。那么,这些海量的原始数据、宝贵的分析结果以及精心训练的AI模型,究竟存放在哪里?它们又是如何被有序管理和高效利用的呢?
答案就在本章的主角——ADRF (Analytics Data Repository Function)。如果说NWDAF是智慧城市的大脑,DCCF是高效的物流系统,那么ADRF就是这座城市的中央数据档案馆和智慧成果展览馆。它负责永久或长期地保存网络运行的“历史卷宗”和大脑产生的“智慧结晶”。
今天,我们将继续跟随“小慧”的视角,看她是如何与这座宏伟的档案馆互动,从中汲取历史的智慧,以应对未来的挑战。
场景设定:一年一度的大型音乐节即将在A城市中心公园举办,预计将有数十万观众涌入。“小慧”的主要任务是保障活动期间的网络质量,提前预测并规避潜在的网络拥堵。要做到这一点,仅仅依靠实时数据是远远不够的,她迫切需要查阅去年音乐节期间的所有网络历史数据。
1. ADRF的核心价值:为何需要一个“档案馆”?(TS 23.288 Clause 5B.1)
规范开篇即点明了ADRF的核心使命,简洁而有力。
The ADRF offers services that enable a consumer to store, retrieve and delete data and analytics. The analytics are produced by the NWDAF as described in clause 6.1 and data are collected as described in clause 6.2.
这段话告诉我们,ADRF对外提供了一套标准的“存、取、删”服务。它的馆藏主要有两类:一是“原始卷宗”,即从网络中收集的原始数据(data);二是“研究报告”,即由NWDAF“小慧”处理和分析后生成的分析结果(analytics)。
对于“小慧”来说,这座档案馆的价值无可估量:
- 模型训练的基石:没有去年音乐节海量的用户移动、业务流量等历史数据,MTLF“科学家小慧”就无法训练出精准预测今年人流和话务的模型。
- 深度洞察的源泉:通过对比历年音乐节的数据,可以发现网络负载变化的长期趋势和模式,为网络规划和扩容提供决策依据。
- 事后复盘的依据:如果网络出现问题,可以随时调阅历史数据进行根因分析,实现故障的快速定位和修复。
- 智慧成果的共享:一个“小慧”生成的有价值的分析报告或ML模型,可以存入ADRF,供全网其他“小慧”或NF消费者共享使用,避免重复劳动。
2. 数据入库:如何将智慧结晶存入档案馆 (TS 23.288 Clause 5B.1)
将数据和分析结果存入ADRF,主要有两种方式:“主动上交”和“委托代收”。
2.1 方式一:主动上交 (Direct Storage)
这是最直接的存储方式,由数据的所有者(消费者)主动将数据发送给ADRF。
Data may be stored in the ADRF by:
- a consumer sending the ADRF an Nadrf_DataManagement_StorageRequest containing the data or analytics to be stored. The ADRF response provides a result indication.
场景举例:
去年音乐节结束后,负责A城市的“小慧”实例对收集到的所有数据进行了深度分析,生成了一份详尽的《2024年A市音乐节网络性能复盘报告》。为了给未来的工作留下参考,她调用了ADRF的Nadrf_DataManagement_StorageRequest服务,将这份报告连同相关的原始数据摘要,作为一个完整的“藏品”存入了档案馆。ADRF收到后,会给她一个回执,告诉她“已成功入库”。
2.2 方式二:委托代收 (Subscription-based Storage)
这是一种更智能、更自动化的存储方式。消费者可以请求ADRF自己去订阅并接收需要存储的数据。
- a consumer sending the ADRF an Nadrf_DataManagement_StorageSubscriptionRequest requesting that the ADRF subscribes to receive data or analytics for storage. The ADRF then subscribes to the NWDAF or DCCF for data or analytics…
场景举例: 今年的音乐节即将开始,“小慧”希望将活动期间所有的“小区负载实时分析”结果都自动存档。她不再需要自己先接收分析结果再转存,而是直接向ADRF下达一个指令:“请你(ADRF)立即去向负责A市中心公园区域的NWDAF-AnLF订阅‘小区负载分析’,从现在开始,未来72小时内他产生的所有报告,你都替我接收并存起来。”
接到指令后,ADRF会“摇身一变”,自己扮演一个数据消费者的角色,主动去向目标NWDAF或DCCF发起订阅。这种“设置一次,自动归档”的模式,极大地简化了数据存档的流程。
3. 数据出库:从历史中汲取智慧 (TS 23.288 Clause 5B.1)
档案馆的价值在于被查阅。当“小慧”需要历史数据时,同样有两种方式可以从ADRF中获取。
3.1 方式一:按需查阅 (One-time Retrieval)
这是最常见的检索方式,即一次性的查询-响应。
Data may be retrieved from the ADRF by:
- a consumer sending an Nadrf_DataManagement_RetrievalRequest request to the ADRF to retrieve data or analytics…
场景举例:
音乐节前一周,“小慧”开始准备预测模型。她向ADRF发送了一个Nadrf_DataManagement_RetrievalRequest请求:“请把馆藏里所有关于‘2024年A市音乐节’的数据和分析报告都找出来给我。” ADRF在自己的“馆藏目录”中检索,找到对应的资料,然后打包发送给“小慧”。
3.2 方式二:订阅查阅 (Subscription-based Retrieval)
这是一种更高级的检索方式,不仅能获取历史数据,还能订阅未来的存档数据。
- a consumer sending an Nadrf_DataManagement_RetrievalSubscribe request to the ADRF to retrieve data or analytics for a specified data or analytics collection time window. If the time window includes the future…subsequent notifications received by the ADRF are sent by the ADRF to the notification endpoint.
场景举例:
“小慧”不仅需要去年的数据,还想实时跟踪今年音乐节期间,其他“小慧”实例可能存入的与本次活动相关的任何新分析报告。她可以向ADRF发起一个Nadrf_DataManagement_RetrievalSubscribe订阅:“请检索所有‘音乐节’相关的历史数据发给我。并且,如果未来72小时内,有任何新的数据或分析被存入且也与‘音乐节’相关,请立即通知我。”
这种模式让ADRF从一个被动的仓库,变成了一个主动的“信息推送服务”,使得“小慧”能够基于历史和最新归档的全局信息,做出更全面的决策。
4. 特殊馆藏:机器学习模型的管理 (TS 23.288 Clause 5B.1)
ADRF不仅存储“数据”,还存储由数据升华而来的“智慧”——机器学习模型 (ML Models)。
The ADRF offers services that enable a consumer to store, delete and retrieve ML Models. The ML Models are trained by NWDAF containing MTLF as described in clause 5.1.
ADRF为ML模型也提供了一整套专属的“存、取、删”服务:
- 模型入库 (
Nadrf_MLModelManagement_StorageRequest):MTLF“科学家小慧”利用去年音乐节的数据,训练出了一个高度精准的“人群密度与网络拥塞关联预测模型v3.0”。她可以将这个模型文件本身,或者模型的存储地址,通过此服务存入ADRF。 - 模型出库 (
Nadrf_MLModelManagement_RetrievalRequest):一线AnLF“工程师小慧”在音乐节开始前,需要最新的预测工具。她向ADRF请求检索“人群拥塞预测模型”,ADRF会返回v3.0这个最新模型的地址或文件,AnLF下载后即可立即投入使用。 - 模型淘汰 (
Nadrf_MLModelManagement_Delete):当v4.0模型被研发出来后,为了避免混淆,可以通过此服务将老旧的v3.0模型从ADRF中删除。
ADRF通过对ML模型的集中管理,形成了一个全网共享的“模型库”,极大地促进了AI能力在整个5G网络中的复用和快速迭代。
5. 档案馆的管理制度:数据生命周期 (TS 23.288 Clause 5B.1)
档案馆的馆藏不能无限增长,必须有严格的管理制度。规范为此定义了存储处理信息 (Storage Handling information)。
When a consumer requests data or analytics to be stored in an ADRF, it may specify Storage Handling information requesting:
- a lifetime indicating how long the data or analytics should be stored; and/or
- that a notification alerting the consumer be sent prior to data deletion from the ADRF.
这套机制就像是图书馆的图书管理规定:
- 指定保存期限 (Lifetime):数据存入时,可以附上一个“保存期限”。比如,实时性能数据可能只需要保存3个月用于短期排障,而网络规划相关的宏观统计数据则可能需要保存5年。
- 默认馆规 (Default Operator Policies):档案馆本身有全局的“馆规”。即使某个消费者请求永久保存一份数据,但馆规规定该类型数据最长只能保存2年,那么最终将以馆规为准。
- 销毁前通知 (Pre-deletion Alert):在数据即将到期被“销毁”前,ADRF会提前通知当初存储该数据的消费者,“您存储的xxx资料即将到期,请问是否需要续期或在销毁前取回?”这为重要数据提供了最后一道保险。
The ADRF, DCCF or NWDAF determines when the data or analytics lifetime has expired. When data or analytics is to be removed from the ADRF, an alert is sent to the Consumer that the data is about to be deleted.
通过这套完善的生命周期管理机制,ADRF在确保数据可用性的同时,也保证了存储资源的有效利用和数据治理的合规性。
FAQ - 常见问题解答
Q1:ADRF和UDR(统一数据存储)有什么区别?它们存储的数据类型有何不同? A1:这是两个定位完全不同的数据存储库。UDR主要存储用户的签约数据、策略数据、应用特定数据等,这些数据相对静态,是网络提供服务的基础依据,可以理解为每个用户的“户籍档案”。而ADRF则专门存储用于网络分析的历史数据、分析结果和ML模型,这些数据通常是时间序列的、体量巨大、动态生成的,是网络进行智能化运营的“历史大数据”。简言之,UDR关心“用户是谁,能用什么”,ADRF关心“网络过去发生了什么,未来可能发生什么”。
Q2:NWDAF必须要把数据存储在ADRF中吗?它能有自己的内部存储吗? A2:不是必须的。NWDAF可以有自己的内部存储来处理短期或小规模的数据。但是,将数据存储在ADRF中是3GPP推荐的最佳实践。因为ADRF提供了一个标准化的、可扩展的、全网共享的存储方案。使用ADRF可以实现数据和分析能力的解耦,一个NWDAF产生的数据可以被另一个NWDAF轻松访问和利用,从而构建起一个协同工作的网络智能生态系统。
Q3:谁来决定哪些数据需要被存入ADRF?
A3:决策权是灵活的。可以由数据消费者(如NWDAF或DCCF)在运行时动态决定,通过StorageRequest或StorageSubscriptionRequest服务发起存储。也可以由运营商通过策略配置来静态决定,例如,在DCCF上配置一条策略:“凡是收集到的与网络切片相关的性能数据,一律自动归档到ADRF中”。
Q4:规范中提到的“存储事务标识符 (Storage Transaction Identifier)”是什么作用?
A4:它就像是档案馆为一批入库资料分配的唯一索引号。当消费者通过StorageRequest存储了一大批数据后,ADRF会返回一个Storage Transaction Identifier。未来,消费者如果想检索或删除这批数据,只需提供这个简单的ID即可,而无需再次描述这批数据的所有复杂特征(如时间范围、数据类型等)。这是一种简化后续操作、提高交互效率的机制。
Q5:ADRF是存储ML模型文件本身,还是只存储一个指向模型的链接?
A5:规范设计得非常灵活,两者都支持。Nadrf_MLModelManagement_StorageRequest请求中既可以包含模型文件本身,也可以包含模型的地址(ML Model address)。这允许运营商根据实际情况选择:对于较小的模型,可以直接存储在ADRF的数据库中,方便管理;对于动辄几百MB甚至上GB的大型模型,更合适的做法是将其存储在对象存储(Object Storage)等专业系统中,然后在ADRF中只注册和管理该模型的元数据和访问地址。