好的,我们继续深入5G网络“智慧大脑”NWDAF的能力清单。在前一篇文章中,我们探讨了‘洞察者’(Insight-AI)如何像一位“交通拥堵预测师”,从宏观上诊断网络的拥塞状况。然而,“不堵车”只是网络服务的基础要求。对于许多高价值的5G应用而言,它们的要求远不止于此,它们追求的是“持续的、可承诺的高品质服务”。

今天,我们将聚焦于一项直接关系到运营商能否兑现其SLA(服务等级协议)承诺的核心分析能力——QoS可持续性分析。

深度解析 3GPP TS 29.552:5.7.11 QoS Sustainability Analytics (QoS可持续性分析)

本文技术原理深度参考了3GPP TS 29.552 V18.7.0 (2024-12) Release 18规范中关于“5.7.11 QoS Sustainability Analytics”的核心章节,旨在为读者详细拆解NWDAF是如何扮演一位“SLA保障专家”,通过对端到端路径的深度剖析,来预测网络能否在未来一段时间内,持续满足特定的QoS要求。

前言:从“尽力而为”到“一诺千金”

QoS(服务质量)是通信网络的灵魂。5G相较于前几代移动通信技术,一个革命性的进步就是从提供“尽力而为(Best Effort)”的连接,迈向了能够提供“一诺千金(Deterministic)”的、可承诺的连接服务。这种能力,是支撑远程医疗、自动驾驶、工业控制等高价值URLLC(超可靠低时延通信)应用场景的基石。

然而,做出“承诺”容易,“兑现”承诺却很难。网络是一个动态、复杂的系统,无线信道的波动、背景流量的冲击、网络资源的竞争,都可能随时导致QoS的劣化。一个成功的远程手术,不允许在关键时刻出现哪怕10毫秒的额外时延;一队行进中的自动驾驶车队,无法容忍一次突发的丢包。

因此,网络需要的不仅仅是“当前”满足QoS,而是需要一种**“可持续性 (Sustainability)”**的保障。网络必须能够回答这样一个问题:“在未来的X分钟内,我能否持续稳定地为这个业务提供承诺的QoS(例如,低于5ms时延,低于10⁻⁵丢包率)?

这,就是“QoS可持续性分析”的核心使命。它将‘洞察者’(Insight-AI)的角色,从一个宏观的“拥堵预测师”,提升为一位精细的、面向具体业务流的“SLA保障专家”。

在“未来科技博览会”的“跨国远程手术”演示场景中,手术平台应用(AF)作为‘洞察者’的客户,它的需求是极致而明确的:“请为我的手术控制信令流(由IP五元组标识),持续监控其端到端的QoS可持续性。一旦预测到时延可能超过5ms,或可靠性可能下降,请在事情发生之前立刻向我预警!”

本文将深入5.7.11节的信令流程,看看‘洞察者’是如何完成这次事关“生命线”的、高精度的QoS预测任务的。


1. 任务简报:可持续性分析的“全链路体检”

这项分析的目标是,预测一个或一组QoS流,在一个特定的区域或沿着一条特定的路径,能否在未来一段时间内保持其所需的QoS水平。

规范原文引用 (Clause 5.7.11 Introduction):

This procedure is used by the NWDAF service consumer (maybe an NF, e.g. AF) to obtain the QoS Sustainability analytics, which are calculated by the NWDAF based on the information collected from the OAM, AMF, SMF, UPF, UDM and GMLC, for a path of interest or for an area of interest with coarse granularity (i.e. TAIs or Cell IDs) or fine granularity (e.g. smaller than a cell).

‘洞察者’解读道:“要做出‘一诺千金’的判断,我必须对业务流将要经过的‘全链路’进行一次彻底的、前瞻性的‘健康体检’。”

  • 分析对象: 不再是宏观的区域,而是精细到一个或一组QoS流。这些流可以通过用户的SUPI、应用的Application ID、或更精确的IP五元组+DNN+S-NSSAI来标识。

  • 分析维度:

    • 区域 (Area of Interest): 预测UE在某个区域内移动时,其QoS能否保持。

    • 路径 (Path of Interest): 预测当业务流沿着一条已知的网络路径(如从UE gNB UPF Application Server)传输时,其端到端QoS能否保持。

  • 情报来源: 这是迄今为止我们遇到的,数据来源要求最全面、最精细的分析之一。它几乎融合了之前所有分析的数据源:

    • OAM: 提供最核心的底层性能数据,如RAN侧UE吞吐量、QoS流保持率、端到端时延/丢包率(包括无线段和传输段)。

    • AMF/SMF/UDM: 提供UE和PDU会话的上下文,帮助识别和定位目标QoS流。

    • UPF: 提供用户面路径信息和性能数据。

    • GMLC: 提供高精度的UE位置,用于精细粒度的分析。

  • 分析ID: QOS_SUSTAINABILITY


2. 行动方案:解构QoS可持续性分析的信令流程

规范中的 “Figure 5.7.11-1: Procedure for QoS Sustainability Analytics” 描绘了‘洞察者’进行这次“全链路体检”的流程。

阶段一:任务启动与“体检预约” (步骤1)

手术平台AF向‘洞察者’发起订阅:“请为应用ID为‘RemoteSurgery-Control’的业务,监控其QoS可持续性,目标是时延<5ms,可靠性>99.999%。”

步骤1a-1c:AF发起订阅

AF通过Nnwdaf_EventsSubscription_Subscribe发起请求,analyticsIdQOS_SUSTAINABILITYeventFilter中包含了applicationId以及详细的qosRequirement(QoS要求)。

阶段二:多维度、多粒度的“体检项目” (步骤2 - 4)

‘洞察者’收到请求后,立刻启动了一系列并行的数据收集流程,从粗到细,从宏观到微观,对与该业务流相关的所有环节进行扫描。

步骤2:从OAM获取宏观性能“体检报告”

规范原文引用 (Step 2):

The NWDAF may collect “Performance measurement” to the OAM to get the RAN UE Throughput…, QoS flow Retainability information… If the “QoSSustainabilityExt_eNA” feature is supported, the NWDAF may collect the average UL/DL packet transmission delay through RAN part to the UE…

  • 动作: ‘洞察者’向OAM请求与QoS相关的性能测量数据。

  • 目的: 获取网络底层的、最真实的性能表现。

  • 关键指标 (体检项目):

    • QoS流保持率 (QoS flow Retainability): 有多少比例的QoS流能够从头到尾都保持其承诺的QoS等级而不被降级或中断。这是衡量QoS稳定性的核心指标。

    • RAN侧时延/吞吐量: 无线空口是时延和抖动的最大来源之一,必须精确测量。

    • 传输网性能: 从基站到核心网UPF的传输链路(N3接口)的性能同样关键。

步骤3a-3d:从核心网获取精细化“病例”

规范原文引用 (Step 3a-3b):

For the fine granularity data collection, the NWDAF may invoke Nnf_EventExposure_Subscribe service operations…to subscribe to related data collection event(s) exposure.

如果需要更精细的分析,‘洞察者’会向核心网的各个NF发起订阅。

  • 动作: 并行地向AMF, SMF, UDM, UPF等发起_EventExposure_Subscribe订阅。

  • 目的: 收集与目标QoS流相关的、实时的、个体化的上下文信息。

  • 信息流 (3c-3d): 例如,SMF可以上报该QoS流当前经过的UPF路径;AMF可以上报UE的移动性事件,因为移动可能导致UE切换到信号差的小区,从而影响QoS。

步骤4a-4d:利用GMLC进行“高精度CT扫描”

规范原文引用 (Step 4a-4b):

For the fine granularity data collection, the NWDAF may invoke Ngmlc_Location_ProvideLocation service operation…

如果分析需要精确到物理位置(例如,发现QoS问题只在展馆的某个特定角落出现),‘洞察者’会向GMLC请求高精度的UE定位信息,如同进行一次“高精度CT扫描”。

阶段三:综合诊断与“专家会诊” (步骤5 - 11)

规范原文引用 (Step 5):

The NWDAF calculates the QoS sustainability analytics based on the data collected from OAM for coarse granularity or based on the data collected from OAM, AMF, SMF, UDM and/or GMLC for fine granularity.

所有“体检报告”和“病例”都已汇集到‘洞察者’的“专家会诊室”。

  1. 数据融合与路径建模 (Step 5 & 10):

    • AnLF首先将所有数据进行关联,构建出该手术控制信令流的完整端到端路径:UE gNB-A Transport-Switch-1 UPF-2 Core-Router-X AF-Server。

    • 然后,它将从OAM、UPF等处收集到的性能数据(时延、丢包率、负载等),一一映射到这条路径上的每一个节点和每一段链路上

  2. 瓶颈分析与预测:

    • 当前状态评估: 模型发现,当前路径上所有环节的性能都非常好,端到端时延为2ms,满足要求。

    • 未来趋势预测: 模型同时引入了其他分析的结论,例如:

      • NF负载分析 (5.7.4) 预测:UPF-2在5分钟后负载将达到90%。

      • 用户拥塞分析 (5.7.10) 预测:gNB-A小区的无线资源即将饱和。

      • UE移动性分析 (5.7.6) 预测:UE(手术设备)即将移动到一个信号覆盖的边缘区域。

    • 综合会诊: “SLA保障专家”‘洞察者’综合所有信息,得出最终诊断:“虽然当前QoS良好,但由于预测到的UPF负载上升和无线环境恶化,预计在5分钟后,该业务流的端到端时延将有85%的概率超过5ms,QoS将不再可持续!

  3. 交付预警 (Step 6 & 11): ‘洞察者’立刻将这份包含了详细原因和预测时间的“病危通知”,通过_Notify服务,发送给手术平台AF。

闭环完成: 手术平台AF收到预警后,可以与网络协同,立即采取措施:

  1. 请求网络重路由: AF可以向PCF/SMF发起请求,要求将该业务流切换到一条备用的、更空闲的网络路径上(例如,通过另一个UPF-3)。

  2. 应用层冗余: 如果网络无法立即重路由,AF可以启动应用层的冗余传输机制,例如,通过另一条独立的路径(甚至另一张网络)同时发送一份控制信令,以确保至少有一路能够低时延到达。

通过这个“全链路体检-综合会诊-提前预警-主动干预”的闭环,一次可能导致手术失败的重大网络风险被成功化解。


总结:从“连接”到“承诺”的智能守护者

5.7.11节的QoS可持续性分析,是NWDAF能力体系中最精细、最复杂,也最能体现5G“确定性网络”价值的分析能力之一。

  • 端到端的全链路视角: 它不再孤立地看待无线、传输或核心网,而是将业务流经过的所有环节视为一个整体进行分析,这使得它能够发现单个网元监控无法发现的、跨域的、系统性的性能瓶颈。

  • 从“测量”到“预测”的升华: QoS可持续性分析的核心不在于测量过去的性能,而在于预测未来能否保持性能。这种前瞻性的能力,是实现主动SLA保障、从根本上区别于传统QoS监控的关键。

  • 多分析能力的融合与协同: 该流程是NWDAF各项分析能力的一次“大阅兵”。它需要综合利用移动性分析、拥塞分析、NF负载分析等多种能力的输出,作为其预测模型的输入。这完美诠释了NWDAF作为一个统一分析平台,而非单一功能点的设计理念。

QoS可持续性分析,使得运营商的SLA不再是一纸空洞的合同,而是由“AI哨兵”‘洞察者’7x24小时守护的、可量化、可预测、可主动保障的“军令状”。这项能力,是5G网络从提供“连接”服务,迈向提供“承诺”服务的真正基石。

在下一篇文章中,我们将探讨一个与空间分析相关的有趣话题——5.7.12 Dispersion Analytics (离散度分析),看看‘洞察者’是如何从用户的群体分布和移动模式中,挖掘出关于人群聚集、疏散等宏观趋势的洞察的。


FAQ 环节

Q1:QoS可持续性分析和业务体验分析(5.7.3)有什么区别?

A1:它们都关注业务质量,但视角和粒度不同。

  • 业务体验分析 (QoE): 更偏向于应用层和用户主观感受。它试图回答“用户用起来爽不爽?”。其输出是MOS分等体验指标,输入可以包含大量应用层数据(如帧率)。

  • QoS可持续性分析: 更偏向于网络层和SLA承诺。它回答的是“网络能否持续满足客观的QoS指标(如时延<5ms, 丢包率<10⁻⁵)?”。其分析过程更聚焦于网络内部的路径、节点和资源。

两者是强相关的。通常,QoS的可持续性是保障良好QoE的基础。一个NWDAF在分析QoE时,会将QoS可持续性分析的结果作为一个非常重要的输入。

Q2:这项分析的精度能达到多高?真的能预测毫秒级的时延变化吗?

A2:预测的精度是衡量NWDAF产品核心竞争力的关键,它取决于模型、数据和场景。

  • 数据精度: 预测的精度,首先受限于输入数据的精度。如果OAM和UPF只能提供秒级的性能数据,那么NWDAF就无法做出毫秒级的预测。这需要整个端到端的测量体系(如高精度时间同步PTP, iFIT/TWAMP等探针技术)的支持。

  • 模型能力: 需要极其复杂的AI模型,能够理解数据包在每一个网络节点(gNB调度器、UPF缓冲区等)的排队和处理时延,并将其叠加,才能做出端到端的时延预测。

  • 场景: 对于路径固定、流量模型相对稳定的业务(如工业控制),预测精度会较高。对于行为随机、路径多变的普通互联网业务,预测难度则大得多。

总的来说,实现毫秒级的精准预测是业界的终极目标,也是当前技术持续努力的方向。

Q3:什么是“QoS flow Retainability”(QoS流保持率)?为什么它很重要?

A3:“QoS flow Retainability”是3GPP定义的一个关键性能指标,它衡量的是一个QoS流在其整个生命周期内,能够保持其初始协商的QoS等级(如5QI)的时间比例。例如,一个5QI=1(要求极高的URLLC业务)的QoS流,由于网络拥塞,被PCF/SMF降级为了5QI=5(普通互联网业务),那么它的“保持”就失败了。

这个指标非常重要,因为它直接反映了QoS承诺的稳定性。即使网络的平均时延和吞吐量都很好,但如果QoS等级频繁地被降级和恢复,对于依赖确定性保障的业务来说是不可接受的。因此,它是QoS可持续性分析的一个核心输入。

Q4:消费者如何向NWDAF指定它关心的“Path of Interest”(路径)?

A4:消费者(如AF)通常不直接向NWDAF提供一个由网络节点组成的物理路径,因为应用层通常不感知底层的网络拓扑。相反,消费者会提供业务流的标识符,由NWDAF自己在网络中去“发现”这条路径。

  • AF提供: Application ID, 或更精确的IP五元组。

  • NWDAF的工作:

    1. 通过AF提供的标识符,向PCF/SMF查询,找到这个业务流对应的PDU会话和QoS流。

    2. 从SMF获取该会话当前使用的UPF路径(例如,从UE gNB I-UPF U-UPF)。

    3. 从OAM和RAN获取UE当前所在的小区。

    4. 通过这些信息,NWDAF就在内部重构出了这条业务流的端到端路径,并沿着这条路径去收集性能数据。

Q5:这项分析会消耗大量的网络和计算资源吗?

A5:是的,QoS可持续性分析是NWDAF所有分析能力中,对资源消耗最大的之一。

  • 数据量大: 它需要收集来自多个源头的、精细化的、高频的性能数据。

  • 计算复杂: 其背后的AI模型通常非常复杂,需要大量的计算来进行实时推理和预测。

因此,运营商通常不会为网络中的所有业务都开启这项分析。它会作为一种高级、按需开启的能力,专门用于保障那些价值最高、对QoS要求最严苛的关键业务,如远程手术、V2X车联网、智能电网差动保护等。