好的,我们继续跟随5G基站工程师小雷,深入探索NG接口上那些为满足高级网络运维和用户体验保障而生的关键功能。这一次,我们将聚焦于一个如同“网络侦探”般的强大工具——Trace功能。

深度解析 3GPP TS 38.410:5.11 Trace function (Trace功能)

本文技术原理深度参考了3GPP TS 38.410 V18.2.0 (2024-06) Release 18规范中,关于“5.11 Trace function”的核心章节,并结合其在核心网(TS 23.501/502)和NGAP协议(TS 38.413)中的具体实现,为读者完整呈现5G网络中,端到端的Trace(跟踪/追踪)机制是如何通过NG接口进行激活和管理的。

引言:为“疑难杂症”配备的“随身听诊器”

我们的主角,基站工程师小雷,正面临着一个棘手的用户投诉。一位VIP用户反映,他在公司办公室内,手机信号明明满格,但视频会议却总是频繁卡顿,偶尔还会掉线。小雷查看了后台的KPI指标,一切正常;检查了gNB的告警记录,空空如也。问题到底出在哪里?

这种偶发的、针对特定用户的、难以通过常规KPI监控发现的“网络疑难杂症”,是所有网络运维工程师的噩梦。要解决这类问题,唯一的办法,就是对这位用户的信令交互和数据传输过程,进行一次全方位的、细粒度的“深度体检”

第5.11节“Trace功能”,正是3GPP为应对这类“疑难杂症”而设计的、一个极其强大的“网络随身听诊器”。它允许运维人员(如小雷)在需要时,远程地、非侵入式地“附着”在某个特定的UE或网络节点上,详细记录其在网络中经历的每一条关键信令、每一次状态变迁、每一个性能事件


1. “网络侦探”的使命:Trace功能概述

5.11 Trace function

The Trace function provides means to control trace sessions in the NG-RAN node.

深度解读:

这句话言简意赅,但指明了NG接口在Trace功能中的核心角色——“控制(control)”。

  • Trace Session (跟踪会话): 一次完整的Trace任务,被称为一个“Trace会话”。它有明确的开始、持续时间和结束
  • NG接口的职责: Trace任务的发起和决策,通常来自于核心网侧(由网管系统OAM触发,经由AMF)。NG接口的职责,就是将这些控制指令(如“开始跟踪”、“停止跟踪”),从AMF准确地传达给小雷的gNB,并由gNB来具体执行在无线侧的信令记录。

Trace的两种主要模式:

  1. Signalling Based Trace (基于信令的跟踪): 这是最常用的一种。运维人员通过网管系统,指定要跟踪一个特定的UE(通过SUPI或PEI)。无论这个UE移动到网络的哪个角落,只要它发起信令交互,相关的网络节点(gNB, AMF, SMF, UPF…)都会被“激活”,开始记录与这个UE相关的所有信令。
  2. Management Based Trace (基于管理的跟踪): 也称为Cell Traffic Trace。这种模式不针对特定UE,而是针对一个特定的网络区域(如一个或多个小区)。一旦激活,gNB会记录所有经过这些小区的信令事件。这对于分析某个区域的共性问题(如该区域所有用户都频繁掉线)非常有用。

2. “侦查行动”的部署:Trace信令流程

Trace功能的实现,在NGAP协议中主要由TRACE STARTDEACTIVATE TRACE这两个流程,以及在其他信令(如INITIAL CONTEXT SETUP)中“捎带”的Trace激活信息来共同完成。

场景设定: 小雷决定对那位VIP用户的手机(我们称之为UE-VIP),发起一次Signalling Based Trace,以找出视频会议卡顿的根源。

第一步:OAM下达“侦查令”

  1. 小雷在网络管理系统(OAM)的界面上,输入UE-VIP的标识符(SUPI),并配置好Trace的参数,例如:
    • Trace Depth: 跟踪深度(如“Vendor Specific - high detail”),决定了记录的详细程度。
    • Trace Collection Entity: 记录下来的Trace数据,应该上报到哪个“证据收集服务器”(TCE - Trace Collection Entity)的IP地址。
    • Trace Duration: 本次跟踪任务的持续时间,例如“30分钟”。
  2. OAM将这个“侦查令”,下发给AMF

第二步:AMF分发“协查通报”

AMF收到了来自OAM的指令,它立即开始向整个网络分发“协查通报”。

  • 通知核心网内部: AMF会通知SMF、UPF等其他相关的核心网NF,开始对UE-VIP的信令进行记录。

  • 通知RAN侧 (gNB): 这是NG接口发挥作用的关键时刻。AMF需要将Trace任务通知给当前为UE-VIP服务的gNB(小雷的gNB)。通知的方式有两种:

    • 方式A:主动启动 (TRACE START)

      • 如果UE-VIP当前正处于CONNECTED状态
      • AMF会立即向gNB发送一条TRACE START消息。
      • 核心内容: Trace Activation IE,其中包含了OAM配置的所有Trace参数(Trace ID, Trace Depth, TCE地址等)。
    • 方式B:随附激活 (Piggybacking)

      • 如果UE-VIP当前处于IDLE状态
      • AMF会先将Trace Activation IE“暂存”在UE的上下文中。
      • 当UE-VIP下一次因为发起业务而进入CONNECTED态时,AMF在向gNB发送INITIAL CONTEXT SETUP REQUEST消息(我们5.3节学过的)的同时,会将这个Trace Activation IE**“捎带”**在其中。

第三步:gNB执行“秘密监听”

小雷的gNB,无论是通过TRACE START还是“捎带”的方式,收到了针对UE-VIP的Trace激活指令。

  1. gNB立即启动对UE-VIP的深度监控
  2. 从这一刻起,UE-VIP在空口上与gNB进行的所有RRC信令交互每一次切换测量报告每一次无线链路失败事件……所有这些通常只在gNB内部处理的底层信令,都会被gNB详细地记录下来。
  3. 同时,gNB也会记录它与AMF之间,关于UE-VIP的所有NGAP信令
  4. gNB会将这些记录下来的、带有精确时间戳的Trace数据,按照指定的格式,实时或批量地发送到指令中指定的TCE服务器的IP地址。

第四步:“行动结束”与“证据分析”

  • 停止跟踪:
    • 当Trace任务的持续时间(30分钟)结束后,或者小雷在OAM上手动停止了任务。
    • AMF会向gNB发送一条DEACTIVATE TRACE消息,指令gNB停止对UE-VIP的监控。
  • 证据分析:
    • 小雷登录到TCE服务器上,下载了刚刚收集到的Trace日志。这份日志,就像是UE-VIP在网络中旅行的完整“黑匣子”
    • 他可以看到,在视频会议卡顿的时刻,UE-VIP是否上报了异常的无线信号质量?gNB是否向其下发了不合理的切换指令?RRC重建是否发生了失败?……
    • 通过对这份端到端、跨越了空口(RRC)、NG接口(NGAP)和核心网各接口的完整信令记录的关联分析,小雷最终定位到了问题的原因——原来是办公室内一个未知的Wi-Fi信号,对UE的上行链路造成了突发性干扰。问题迎刃而解。

总结:化繁为简,洞察网络脉搏的“显微镜”

通过对5.11节“Trace功能”的深度剖析,我们看到了5G网络在可维护性、可观测性方面的巨大进步。Trace功能,就是运维工程师手中的一把“瑞士军刀”和“高倍显微镜”。

  • 端到端的可见性: Trace机制贯穿了UE、RAN和核心网,能够提供一个全链路、多维度的信令视图,这是解决复杂跨域问题的关键。
  • 灵活的激活方式: 支持**基于信令的(按用户)基于管理的(按区域)**两种模式,满足了从“个案诊断”到“区域普查”的不同运维需求。
  • 标准化的控制接口: 通过NGAPTRACE START/DEACTIVATE TRACE等流程,在核心网与RAN之间,建立了一套标准化的、与厂商无关的Trace控制通道,极大地提升了运维的效率和便捷性。
  • 非侵入式的监控: Trace是一种被动式的信令记录,它不会改变网络的正常行为,对用户业务的性能影响微乎其微,实现了“无痛体检”。

对于基站工程师小雷来说,Trace功能是他从一名普通的“网络巡检员”,成长为一名能够精准定位、手到病除的“网络神医”的必备法宝。当KPI的宏观数据无法揭示真相时,Trace提供的微观信令洞察,就成为了他拨开迷雾、直达问题根源的唯一路径。


FAQ

Q1:Trace功能会记录用户的通话内容或上网数据吗? A1:绝对不会。Trace功能严格限定于记录信令(Signalling)事件(Event)。它只关心通信的“过程”和“状态”,例如“谁在什么时间发起了什么请求”、“网络在什么时间做出了什么响应”,而不关心通信的“内容”(用户数据)。所有Trace日志在上报前,都会对用户隐私信息(如IMSI)进行脱敏处理。这是电信网络运维严格遵守用户隐私保护法规的基本原则。

Q2:如果被跟踪的UE切换到了另一个gNB,Trace会中断吗? A2:不会。这是Signalling Based Trace的核心优势之一。当UE-VIP从gNB-A切换到gNB-B时:1. AMF作为移动性的“锚点”,知道这次切换的发生。2. 在向gNB-B建立UE上下文时(通过HANDOVER REQUESTINITIAL CONTEXT SETUP),AMF会像“捎带”其他信息一样,将针对UE-VIP的Trace Activation IE一并传递给新的gNB-B。3. gNB-B收到后,会自动地、无缝地接替gNB-A,继续对UE-VIP进行跟踪。整个过程,Trace会话是跟人(UE)走的,而不是跟节点(gNB)走。

Q3:Trace Collection Entity (TCE) 是核心网的一部分吗? A3:不一定。TCE是一个逻辑概念,代表了存储Trace数据的服务器。在实际部署中,TCE可以是一个集成在网管系统(OAM)中的功能模块,也可以是一个由运营商部署的、独立的、海量的大数据存储和分析平台。AMF和gNB只需要知道它的IP地址,并按照标准格式(定义在TS 32.423中)将Trace记录上报给它即可。

Q4:Management Based Trace(基于小区的跟踪)和Signalling Based Trace(基于UE的跟踪)有什么不同? A4:核心区别在于跟踪对象激活方式不同。

  • 基于UE的跟踪:对象是特定的UE,由AMF根据UE的ID来激活。它的优点是精准,只收集与该UE相关的信息,数据量小,易于分析。
  • 基于小区的跟踪:对象是特定的小区,由OAM直接向gNB下发指令(不通过AMF)来激活。它的优点是全面,可以收集该区域内所有UE的信令行为,用于分析该小区的共性问题,如信道质量、接入拥塞等。但它的数据量极其庞大,对TCE的存储和处理能力要求很高。

Q5:小雷可以在gNB上直接发起一次Trace吗? A5:不可以。根据3GPP的标准流程,Trace任务的发起和控制权,始终在核心网或网管侧(OAM)。gNB只扮演**被动的“执行者”**角色。它只能根据来自AMF的TRACE START指令来启动跟踪,根据DEACTIVATE TRACE指令来停止跟踪。这种中心化的控制模式,确保了Trace功能的安全、可控和权限管理。