好的,我们继续深入5G Advanced(Rel-17及以后)引入的、面向高可靠通信场景的关键分析能力。在前文中,我们探讨了网络如何感知拥塞、评估体验。今天,我们将聚焦于一种为实现“永不掉线”的极致可靠性而设计的技术——冗余传输,以及‘洞- 察者’(Insight-AI)是如何扮演一位“可靠性审计师”,来精准度量这项技术的实际效果和成本的。

深度解析 3GPP TS 29.552:5.7.15 Redundant Transmission Experience Analytics (冗余传输体验分析)

本文技术原理深度参考了3GPP TS 29.552 V18.7.0 (2024-12) Release 18规范中关于“5.7.15 Redundant Transmission Experience Analytics”的核心章节,旨在为读者详细拆解NWDAF是如何评估冗余传输机制(如双PDU会话)对用户业务体验的实际增益,从而为策略制定和网络优化提供量化依据。

前言:为“零中断”体验上的一道“双保险”

对于工业自动化、远程驾驶、电网差动保护等URLLC(超可靠低时延通信)应用而言,99.999%甚至更高的可靠性是其生命线。任何一次微小的网络中断或数据包丢失,都可能导致生产事故或安全风险。

为了满足这种极致的可靠性需求,5G Advanced引入了冗余传输机制。其核心思想非常直观,就像为重要人物出行配备“备用路线”和“备用车辆”一样:网络会为同一个数据流,在用户面建立两条或多条相互独立的路径,并将数据包同时在这些路径上发送。接收端(UE或UPF)只要从任何一条路径上成功收到了数据包,通信就不会中断。

这种“双保险”机制,最典型的实现方式就是**“冗余PDU会话(Redundant PDU Session)”**。UE会同时建立两个PDU会话,这两个会话会被网络智能地映射到不同的物理路径上,例如:

  • 路径一: 经过基站A UPF-1 核心网-A 应用服务器
  • 路径二: 经过基站B UPF-2 核心网-B 应用服务器

理论上,这种机制能极大地提升连接的可靠性。但随之而来的问题是:

  • 效果如何?:在真实的网络环境中,这种“双保险”到底将丢包率降低了多少?为时延稳定性带来了多大的改善?
  • 成本多大?:维持两条路径同时传输,会消耗双倍的无线和传输资源。这种投入是否物有所值?
  • 何时需要?:是否所有时间都需要开启冗余?还是只在进入某个信号颠簸路段时才需要?

要回答这些问题,就需要一种能够量化评估冗余传输实际效果的分析能力。这,正是**冗余传输体验分析(Redundant Transmission Experience Analytics)**的使命。

在“未来科技博览会”的“自动驾驶接驳车队”演示场景中,为了确保车辆控制信令的绝对可靠,车队管理平台(AF)请求网络为所有车辆都开启了冗余PDU会话。为了评估这项高级功能的费效比,并决定是否需要对所有路段都开启该功能,平台向‘洞察者’(Insight-AI)发起了这项分析的请求。

本文将深入5.7.15节的信令流程,看看“可靠性审计师”‘洞察者’是如何对这次“双保险”策略进行全面“审计”的。


1. 任务简报:量化“双保险”的价值

这项分析的目标是,为消费者提供关于冗余传输对用户体验影响的分析,主要关注其在降低丢包率和时延抖动方面的增益。

规范原文引用 (Clause 5.7.15 Introduction):

This procedure is used by the NWDAF service consumer (may be an NF e.g. SMF) to obtain the Redundant Transmission Experience Analytics which are calculated by the NWDAF based on the information collected from the AMF, AF, SMF, UPF OAM and/or MDAF.

‘洞察者’解读道:“要审计这次‘双保险’的效果,我需要成为一名‘事故调查员’。我需要同时监控主、备两条路径,记录下每一条路径上发生的‘事故’(丢包、大时延),并最终统计出,因为有了备用路径,我们成功‘挽救’了多少次通信。”

  • 情报来源:
    • AMF: 提供UE的移动性信息,因为路径的改变往往与UE的移动相关。
    • SMF/UPF: 这是最核心的情报来源。SMF负责建立和管理两条冗余的PDU会话,UPF则是数据包收发的执行者。只有UPF才知道,某个数据包是在主路径丢了但在备用路径成功了,还是两条路径都丢了。
    • OAM/MDAF: 提供端到端的网络KPI,如RAN侧和传输网的丢包率、时延等,用于关联分析。
    • AF: 应用层可以上报其感知的最终丢包率,作为分析结果的交叉验证。
  • 分析ID: RED_TRANS_EXP (Redundant Transmission Experience)

2. 行动方案:解构冗余传输体验分析的信令流程

规范中的 “Figure 5.7.15-1: Procedure for Redundant Transmission Experience Analytics” 为我们展示了‘洞察者’进行这次“审计”的详细流程。

阶段一:任务启动与基础信息收集 (步骤1 - 5)

车队管理平台AF向‘洞察者’发起订阅:“请为我方车队(由GroupId标识),分析其冗余PDU会话的体验增益,重点关注端到端丢包率的改善情况。”

步骤1a-1c:AF发起订阅

AF通过Nnwdaf_EventsSubscription_Subscribe发起请求,analyticsIdRED_TRANS_EXPeventFilter中包含GroupId

步骤2a-5b:关联会话与移动性信息

  • 收集移动性信息 (2a-3b): ‘洞察者’向AMF发起Namf_EventExposure_Subscribe订阅,获取车辆的移动轨迹。这有助于将网络体验的变化与地理位置关联起来(例如,“在XX路段,主路径丢包率明显上升”)。
  • 收集会话信息 (4a-5b): ‘洞察者’向SMF发起Nsmf_EventExposure_Subscribe订阅,获取冗余PDU会话的详细信息。SMF的通知中会明确告知,哪两个PDU会话是绑定在一起的、互为冗余的,以及它们分别走了哪条用户面路径(即分别由哪个UPF处理)。

阶段二:深入用户面——“事故”现场的勘查 (步骤6)

这是整个流程最关键、技术含量最高的数据收集环节。

规范原文引用 (Step 6):

The NWDAF may collect data related to packet delay measurement information from UPF via the SMF by sending an HTTP POST request targeting the resource “SMF Notification Subscriptions”…, the SMF subscribes to the UPF on behalf of the NWDAF via N4 Session Reporting Rule…

  • 动作: ‘洞察者’通过SMF,向服务于这两条冗余路径的UPF(s) 下发一个非常特殊的N4会话报告规则
  • 报告内容: 这个规则会指示UPF去执行冗余会话的逐包比对和统计。UPF作为数据包的汇聚点(下行)或分发点(上行),是唯一能进行这种比对的网元。UPF需要统计:
    • NumSuccPackets: 最终成功交付给UE(或网络)的数据包数。
    • NumLostPacketsPath1: 仅在路径1上丢失的数据包数。
    • NumLostPacketsPath2: 仅在路径2上丢失的数据包数。
    • NumLostPacketsBothPaths: 在两条路径上都丢失了的数据包数(这才是最终对业务造成影响的丢包)。
  • UPF上报: UPF完成统计后,会将这些计数器通过N4上报给SMF,SMF再通过_Notify通知‘洞察者’。

阶段三:融合外部数据与“审计报告”生成 (步骤7 - 21)

规范原文引用 (Step 12):

The NWDAF calculates the Redundant Transmission Experience Analytics based on the data collected from AMF, AF SMF, UPF OAM and/or MDAF.

‘洞察者’拿到了来自UPF的第一手“事故勘查报告”。

  1. 融合其他数据 (Step 7-11):

    • ‘洞察者’还会从OAM收集RAN侧的丢包率、时延等数据(Step 7a),从MDAF获取管理域的分析结果(Step 7b)。
    • 同时,它也会向AF订阅应用层自己感知的体验数据(Step 8-11),用于交叉验证。
  2. “审计”计算 (Step 12 & 20): AnLF的“可靠性审计师”开始计算关键的“审计指标”:

    • 路径1的丢包率 = (NumLostPacketsPath1 + NumLostPacketsBothPaths) / 总包数
    • 路径2的丢包率 = (NumLostPacketsPath2 + NumLostPacketsBothPaths) / 总包数
    • 最终业务体验的丢包率 = NumLostPacketsBothPaths / 总包数
    • 冗余传输增益: (NumLostPacketsPath1 + NumLostPacketsPath2) / 总包数。这个指标量化了“有多少比例的丢包,被另一条路径成功挽救了”。
  3. 生成审计报告: ‘洞察者’生成了一份详尽的报告:

    • 结论: “在博览会园区北侧的隧道区域,由于多径效应,主路径(经过UPF-1)的丢包率高达5%,但备用路径(经过UPF-2)的丢包率仅为0.1%。通过冗余传输,最终业务感知的丢包率被成功控制在了0.1%,冗余传输带来了4.9%的可靠性增益。但在园区南侧的开阔区域,两条路径的丢包率均低于0.01%,冗余传输的增益不明显,但却消耗了双倍的无线资源。”
  4. 交付报告 (Step 13 & 21): ‘洞察者’将这份量化的“审计报告”交付给车队管理平台AF。

闭环完成: 车队管理平台AF收到报告后,可以做出基于数据驱动的、精细化的策略决策

  1. 动态策略: 平台可以制定一条动态策略:“当车辆进入园区北侧隧道区域时,自动向PCF请求开启冗余传输;当车辆驶出隧道,进入开阔区域时,则请求关闭冗余传输,切换为单路径模式。”
  2. 成本优化: 通过这种动态、按需开启的策略,既保障了关键路段的极致可靠性,又避免了在网络状况良好区域的资源浪费,实现了成本与性能的最佳平衡

总结:让“可靠性”可度量、可管理、可优化

5.7.15节的冗余传输体验分析,是NWDAF赋能URLLC场景精细化运营的关键能力。它首次为5G网络中最先进的可靠性保障机制,提供了一套标准化的、量化的**“效果评估”和“成本审计”**工具。

  • 深入用户面的微观洞察: 这项分析能力的核心,在于其深入到了N4接口和UPF的用户面处理逻辑,能够进行逐包级别的跨路径比对。这种微观的洞察力,是传统的、基于网络KPI统计的分析方法所无法比拟的。
  • 量化了可靠性增益: 它将“冗余传输更可靠”这样一个定性的概念,转化为了“可靠性增益达4.9%”这样可量化、可比较的指标。这为运营商评估URLLC服务的价值、制定商业套餐,提供了直接的数据支撑。
  • 驱动动态、智能的策略: 分析的最终目的是为了优化。通过识别出冗余传输“何时何地”最有效,NWDAF的分析结果可以直接驱动PCF/AF制定**动态的、基于上下文(如位置、无线环境)**的冗余策略,实现从“静态、永远在线”到“动态、按需激活”的智能化演进。

冗余传输体验分析,让5G的“双保险”机制不再是一个盲目开启的“黑盒”。它为网络管理者提供了一双“火眼金睛”,能够清晰地看到每一份资源投入所带来的真实价值,从而在追求极致可靠性的道路上,走得更智能、更经济、更高效。

在下一篇文章中,我们将继续5.7节的探索,转向另一个与应用层紧密相关的话题——5.7.16 DN Performance Analytics (DN性能分析)


FAQ 环节

Q1:冗余PDU会话和多宿主PDU会话(Multi-homed PDU Session)有什么区别?

A1:它们都是UE连接到多个UPF的方式,但目的和机制不同。

  • 冗余PDU会话: 核心目的是提高可靠性 (Reliability)。UE为同一个DNN建立两个PDU会话,数据包在两条路径上重复发送。它追求的是“两条路都能到,确保万无一失”。
  • 多宿主PDU会话: 核心目的是业务分流和边缘计算 (Traffic Offload & Edge Computing)。UE为同一个DNN建立一个PDU会话,但这个会话可以同时拥有两个或多个PDU会话锚点(PSA),即连接到两个或多个UPF。网络可以根据策略,将不同的业务流(QoS Flow)路由到不同的UPF。例如,将低时延的边缘计算业务路由到边缘UPF,将普通的互联网业务路由到中心UPF。它追求的是“不同的业务走不同的路,实现效率最优”。

Q2:冗余传输体验分析对UPF的性能要求高吗?

A2:是的,要求非常高。传统的UPF只需做好数据包的转发。而为了支持这项分析,UPF需要具备更强的“智能”:

  1. 深度状态检测: UPF需要识别出哪些数据包属于冗余会话,并为这些会话维护跨路径的上下文。
  2. 逐包比对: 对于上行数据,UPF需要对来自两条路径的数据包进行比对和去重;对于下行数据,在分发前也需要进行标记和统计。这需要额外的处理逻辑和计算资源。
  3. 精细化统计: UPF需要实现规范定义的、针对冗余传输的多种性能计数器,并能通过N4接口上报。 因此,支持这项高级分析,是衡量一个UPF产品是否面向5G Advanced演进的重要标志。

Q3:这项分析的消费者主要是AF吗?

A3:AF(如车队管理平台、工业控制平台)是其最直接的消费者,因为它们最关心其业务的可靠性。但其他NF也会消费这些结果:

  • PCF: 会根据分析结果,来决定是否要为某个业务激活冗- 余传输的用户面策略。
  • SMF: 可以利用分析结果,进行更智能的UPF选择。例如,它在为冗余会话选择两个UPF时,会尽量选择历史数据显示故障相关性最低(即不容易同时出问题)的两个UPF。
  • OAM/网络优化团队: 会利用分析报告,来评估冗余传输技术的整体网络成本和收益,并用于指导网络规划(例如,在哪些区域需要部署物理上相互隔离的双UPF)。

Q4:除了“双PDU会话”,还有其他实现冗余传输的方式吗?

A4:是的,3GPP定义了多种冗余传输的实现方式,工作在不同的网络层次:

  • RAN层冗余 (Dual Connectivity): 在无线侧,UE可以同时连接到两个基站(例如,一个宏站,一个微站),RAN层可以将数据包在两个基站上重复发送。
  • 核心网层冗余 (Redundant PDU Session): 即我们本文讨论的方式。
  • 传输层冗- 余 (MPTCP): 在TCP层,可以利用多路径TCP(MPTCP)在多个IP地址(可能来自5G和Wi-Fi)上同时建立连接并传输数据。 NWDAF的RED_TRANS_EXP分析,其核心逻辑和数据收集方法也可以扩展,用于评估其他层次的冗余机制的效果。

Q5:分析报告中的“可靠性增益”如果是负数,可能是什么原因?

A5:这是一个非常好的问题,揭示了分析的深度价值。“可靠性增益”理论上应该是正数或零。如果出现负数,则说明开启冗余传输后,最终的业务体验反而变差了。这可能暗示着一些深层次的网络问题:

  • 接收端处理瓶颈: 开启冗余后,到达UE或UPF的数据包速率翻倍,可能导致其接收缓冲区溢出或处理能力不足,从而丢弃了更多的包(两条路径的包都被丢了)。
  • 路径相关性过高: 网络在选择两条冗余路径时,没有做到真正的“物理隔离”。例如,两个UPF虽然是不同的实例,但它们都连接在同一个传输交换机上。当这个交换机出现拥塞时,两条路径会同时受到影响,导致“双保险”同时失效。 发现这种“负增益”的场景,是这项分析最有价值的地方之一,它可以帮助运营商找到并修复其高可靠方案中隐藏的设计缺陷。