好的,我们继续解读TR 21.918的后续章节。

深度解析 3GPP TR 21.918:11.2 AI/ML for NG-RAN (用于NG-RAN的AI/ML)

本文技术原理深度参考了3GPP TR 21.918 V18.0.0 (2025-03) Release 18规范中,关于“11.2 AI/ML for NG-RAN”的核心章节,旨在为读者深入剖析5G-Advanced无线接入网(RAN)如何引入内生的AI/ML能力,实现从“人工配置”到“智能自优化”的革命性转变。

在上一篇文章中,我们探讨了5G系统(5GS)如何演进以更好地“服务”于上层的AI/ML应用。今天,我们将把视角从“AI for Network”(利用网络服务AI)转向“AI in Network”(将AI能力内植于网络自身),聚焦于5G网络中最为复杂、也最具优化潜力的部分——无线接入网(NG-RAN)

传统的RAN优化,高度依赖于专家的经验和繁琐的人工参数调优。面对日益复杂的网络环境——多频段、多小区、多波束、多样化的业务需求——这种“手工作坊”式的优化方法已难以为继。将AI/ML技术引入RAN,让基站(gNB)拥有自主学习和智能决策的能力,实现网络的“自配置、自监控、自优化”,已成为业界共识。

Release 18的11.2章节,正是这场RAN智能化革命的开篇之作。它并非要定义某个具体的AI算法,而是着力于构建一套标准化的数据收集与信令交互框架,为AI/ML在RAN中的应用“铺路搭桥”。

今天,我们的主角,是一家领先通信设备商的RAN算法专家,高工。他所在的团队,正在为下一代5G基站开发内嵌的AI/ML引擎,以实现更智能的网络节能、负载均衡和移动性管理。让我们跟随高工的视角,深入11.2章节,看看3GPP是如何为他手中的AI模型,提供赖以生存的“数据土壤”和“通信神经”的。

1. RAN智能化的基石:统一的数据框架

任何AI/ML应用都离不开数据。要在RAN中实现智能化,首先必须解决一个根本问题:AI模型需要的数据(如UE测量、邻区负载、干扰情况等)从哪里来?不同gNB之间如何安全、高效地交换这些数据?

Support of AI/ML for NG-RAN, as a RAN internal function, is used to facilitate Artificial Intelligence (AI) and Machine Learning (ML) techniques in NG-RAN. The objective of AI/ML for NG-RAN is to improve network performance and user experience, through analysing the data collected and autonomously processed by the NG-RAN… Signalling procedures used for the exchange of information to support AI/ML in NG-RAN are use case and data type agnostic… The collection and reporting of information are configured through the Data Collection Reporting Initiation procedure, while the actual reporting is performed through the Data Collection Reporting procedure.

11.2章节的核心贡献,就是定义了一套**“用例与数据类型无关”**的通用数据收集与交互框架。

  • “无关性”的智慧: 这意味着,无论上层的AI应用是为了节能、负载均衡还是移动性优化,无论它需要的是UE性能数据、邻区资源状态还是干扰预测,底层的这套数据交换流程都是统一的
  • 两步走流程:
    1. 发起(Initiation): 一个gNB(消费者)向另一个gNB(生产者)发起“数据收集请求”,明确告知“我需要什么数据”(Data Type)、“多久报一次”(Reporting Periodicity)等。
    2. 上报(Reporting): 生产者gNB根据请求,周期性地或在事件触发时,将收集到的数据上报给消费者gNB。

这套统一的框架,极大地简化了新AI应用的开发。高工在设计一个新的AI功能时,无需再为数据交互重新设计一套私有信令,只需复用这套标准的“数据管道”即可。

2. AI赋能的三大经典场景

基于这套统一的数据框架,Rel-18重点使能了三大经典的RAN自优化场景。

2.1 场景一:AI驱动的网络节能 (Network Energy Saving)

痛点: 基站何时应该关闭某个小区或载波以节省能源?这个决策非常复杂,既要考虑当前的用户负载,还要预测未来的话务模型,否则盲目关停可能导致用户体验下降。

AI/ML-based Network Energy Saving is to optimize the overall energy consumption… by leveraging on the data collected in the RAN network. AI/ML based Energy Saving at a NG-RAN node essentially is for a trained AI model to make real-time decisions to either deactivate or activate a cell or a NG-RAN node…

AI的价值:

  • 智能预测: gNB上的AI引擎,可以基于历史话务数据、时间、天气、周边大型活动等多种信息,精准地预测出未来几小时内该小区的话务量变化趋势。

  • 协同决策: 在做出关停决策前,gNB-A可以向邻近的gNB-B查询一个AI/ML指标——能量成本(Energy Cost, EC)

    In R18, the metric of Energy Cost (EC), which can be used e.g. for the Network Energy Saving use case, is introduced as the AI/ML metric and can be exchanged within the neighbouring NG-RAN nodes…

    EC是一个由OAM系统定义的、归一化的指数,它反映了邻区gNB-B当前的“能源效率”状态。如果gNB-B的EC值很低(意味着它很节能,负载很轻),那么gNB-A就可以更放心地将其边缘用户“托付”给gNB-B,然后自己进入深度睡眠。

通过这种基于AI预测和跨节点信息交互的决策,网络节能不再是“一刀切”的定时开关,而是变成了精细化的、自适应的智能调度。

2.2 场景二:AI驱动的负载均衡 (Load Balancing)

痛点: 当某个小区发生拥塞时,应该将哪些用户切换到哪个邻区,才能达到最优的整体效果?传统的负载均衡策略通常只看邻区的实时负载,缺乏前瞻性。

The AI/ML-based Load Balancing is introduced to improve the load balancing performance by using load predictions from AI/ML models and feedback information mirroring the performance of a UE after an offloading action.

AI的价值:

  • 预测性均衡: gNB-A在决策将用户切换到gNB-B之前,可以先向gNB-B查询其**“预测的资源状态”**。gNB-B的AI模型会告诉你:“虽然我现在负载是80%,但根据预测,10分钟后我的负载会降到30%”。基于这个预测,gNB-A就可以做出更明智的切换决策。

  • 闭环反馈: 更重要的是,切换完成后,故事并没有结束。gNB-A可以请求gNB-B在未来的某个时间点,反馈那个被切换过去的用户(UE)的真实性能体验(如吞吐量、时延)。

    The collection of UE performance feedback is triggered at successful Handover execution. Both one-time and periodic UE performance feedback reporting are supported.

    这个“事后反馈”机制,形成了一个决策-执行-反馈的闭环。gNB-A的AI模型可以利用这些反馈数据,不断地学习和优化其负载均衡算法:“原来上次把这类用户切换到那个小区,效果很好/很差,下次我要调整我的策略”。

2.3 场景三:AI驱动的移动性优化 (Mobility Optimization)

痛点: 如何减少掉话、降低乒乓切换、为高速移动的用户选择最优的切换目标?这需要对用户的移动轨迹有精准的预测。

AI/ML-based mobility optimization is introduced to improve successful handover rates and determine which is the best mobility target for maximisation of efficiency and performance. …a cell-based UE trajectory prediction is transferred to the target NG-RAN node via the Handover Preparation procedure to provide information for subsequent mobility decisions…

AI的价值:

  • 轨迹预测与传递: 当gNB-A决定将一个用户切换到gNB-B时,gNB-A的AI模型会根据该用户的历史移动模式,预测出他接下来最可能移动到的小区序列(例如,B C D)。这个“UE轨迹预测”信息,会通过切换准备信令,一同“交接”给目标gNB-B。
  • 资源的提前准备: gNB-B拿到这份“未来剧本”后,就可以为该用户在小区C和小区D提前准备好切换资源(如预留RACH前导码、分配C-RNTI等)。当用户真正移动到C或D时,切换过程可以变得异常平滑和快速。
  • 轨迹反馈: 与负载均衡类似,gNB-B在用户离开后,也可以向gNB-A反馈该用户的实际移动轨迹,帮助gNB-A的轨迹预测模型进行持续的迭代和优化。

3. AI模型的部署与生命周期

11.2章节的讨论中,虽然没有像11.3 AI/ML management那样详细,但也明确了AI/ML在RAN中的两种基本部署模式。

For the deployment of AI/ML in NG-RAN, the following scenarios may be supported:

  • AI/ML Model Training is located in the OAM and AI/ML Model Inference is located in the NG-RAN node.
  • AI/ML Model Training and AI/ML Model Inference are both located in the NG-RAN node.
  1. 集中式训练,分布式推理: 这是目前最主流的模式。重量级的模型训练(Training)过程,在拥有强大算力的OAM(运营维护)中心或云端完成。训练好的模型,被下发到各个gNB上。gNB只负责轻量级的推理(Inference),即利用模型进行实时的预测和决策。
  2. 分布式训练与推理: 在未来,随着gNB边缘计算能力的增强,一些轻量级的模型训练或增量学习,也可能直接在gNB上完成,实现更快的模型迭代和对本地环境的更强适应性。

总结

3GPP TR 21.918的11.2章节,为5G无线接入网(RAN)的智能化演进,吹响了冲锋的号角。它通过构建一套标准化的、用例无关的数据收集与信令交互框架,成功地解决了AI/ML在RAN中应用的最基础、也是最关键的“数据通路”问题。

基于这套框架,网络节能、负载均衡、移动性优化这三大经典的RAN自优化场景,被注入了AI/ML的“智慧灵魂”:

  • 决策从**“被动响应”走向“主动预测”**。
  • 优化从**“单点最优”走向“跨节点协同”**。
  • 算法从**“静态配置”走向“闭环反馈、持续学习”**。

对于像高工这样的算法专家,Rel-18的这一系列标准化工作,意味着他们精心设计的AI模型,终于可以摆脱私有协议的束缚,在一个开放、标准的RAN生态系统中,与其他厂商的设备进行“可信的对话”,从而释放出更大的网络价值。

虽然RAN的全面智能化之路依然漫长,但11.2章节无疑已经为其铺设了第一块坚实的基石。一个更智能、更高效、更“懂你”的5G无线网络,正向我们走来。


FAQ - 常见问题解答

Q1:AI/ML for NG-RAN和上一章的AI/ML model transfer in 5GS有什么核心区别? A1:核心区别在于AI的应用主体和目标不同AI/ML model transfer in 5GS(11.1)关注的是网络如何“服务”于外部的AI应用,AI的主体是第三方应用(如自动驾驶平台),网络的目标是为其提供智能化的数据传输通道。而AI/ML for NG-RAN(11.2)关注的是网络自身的智能化,AI的主体是网络设备自身(gNB),网络的目标是利用AI来优化自身的性能和效率(如节能、负载均衡)。前者是“AI for Network”,后者是“AI in Network”。

Q2:Rel-18定义的这套RAN侧数据交互框架,是基于哪个接口实现的? A2:这套框架主要定义的是gNB与gNB之间的信息交互,因此它主要是对Xn接口(连接gNB-CU之间)和Xn-U/F1-U等相关接口的增强。通过在这些接口上定义新的信令流程(如Data Collection Reporting InitiationData Collection Reporting),实现了邻近基站之间AI/ML相关数据的标准化交换。

Q3:在AI驱动的负载均衡中,为什么“切换后的用户体验反馈”如此重要? A3:因为它构建了一个**“闭环学习”**的机制,这是AI模型能够持续进化的关键。传统的负载均衡,决策是一次性的:把用户切走,任务就结束了,至于这个决策是好是坏,源基站无从知晓。而有了反馈机制,源基站的AI模型就可以进行“复盘”:它会知道“上次我把一个正在玩游戏的用户,在小区负载80%的时候,切换到了那个信号覆盖边缘的小区,结果他的游戏时延飙升了30ms”。通过不断积累这样的“成功案例”和“失败教训”(即带有标签的数据),AI模型就能够持续地、自主地优化其决策逻辑,从而变得越来越“聪明”。

Q4:UE轨迹预测是如何实现的?会不会侵犯用户隐私? A4:实现方式:UE轨迹预测通常是gNB上的一个AI/ML模型,它基于该UE(或具有相似行为模式的UE群体)的历史移动数据进行学习。这些数据包括历史的服务小区序列、切换记录、测量报告等。模型通过学习,发现该用户每天早上8点,总是会沿着“小区A 小区C 小区F”这条路径移动。隐私保护:3GPP对此有严格的规定。1)数据匿名化:用于模型训练的数据通常是匿名的或经过假名化处理的,移除了用户的永久身份标识。2)数据本地化:轨迹预测通常只在RAN内部进行,预测结果也只在gNB之间(为了切换)短暂传递,不会随意暴露给核心网或外部应用。3)目的限制:规范严格限制了轨迹预测信息的使用目的,即仅用于优化移动性管理,不得用于其他目的。

Q5:这些RAN侧的AI功能,是由设备商提供,还是由运营商自己开发? A5:通常是由设备商提供,但由运营商来管理和配置。这些内嵌在gNB中的AI/ML引擎,其算法和模型通常是设备商(如华为、爱立信、诺基亚等)的核心技术和差异化优势所在。运营商购买的是包含了这些AI功能的“智能基站”。但是,AI模型的训练、部署、激活以及相关策略的配置,则是由运营商通过OAM(运营维护)系统来统一管理的。例如,运营商可以决定在哪些区域启用AI节能,可以为AI负载均衡设定一个总体的优化目标(是“最大化吞吐量”还是“保障公平性”),还可以为AI模型提供全局性的数据来进行集中式训练。这是一种设备商与运营商协同使能网络智能化的模式。