本文技术原理深度参考了3GPP TS 38.413 V18.5.0 (2025-03) Release 18规范中,关于“8.11 Trace Procedures”的核心章节,旨在为读者提供一个关于5G网络如何通过Trace功能进行精细化信令追踪与故障诊断的全景视图。

深度解析 3GPP TS 38.413:8.11 Trace Procedures (Trace流程)

大家好,欢迎回到我们的3GPP规范深度解析系列。如果说网络管理是为庞大的5G系统“看病问诊”,那么我们今天要探讨的Trace(追踪)功能,就相当于为网络配备的“精准靶向MRI”。它是一种强大而精细的运维(O&M)工具,允许网络运维人员对特定用户(UE)的信令交互和数据流进行“贴身”监控和记录,是定位复杂网络问题、优化用户体验的终极武器之一。

当用户抱怨频繁掉话、上网卡顿,而常规的网络KPI指标又看不出明显异常时,Trace流程便能派上用场。它由核心网的AMF发起,指令gNB开启对特定UE的“记录模式”,捕获该UE在指定接口上的所有信令消息和事件,并将这些宝贵的数据发送到一个专门的服务器——Trace Collection Entity (TCE),供专家进行离线分析。

与之前讨论的接口管理流程不同,Trace流程是UE关联的,它的目标明确,就是单个UE。为了深入理解这一“网络侦探”的工作模式,我们将再次请出网络监控专家Morpheus和他的徒弟Neo。他们接到了一个棘手的投诉:公司的一位VIP高管Mr. Sterling反映,他每天在上下班高峰期驾车经过CBD区域时,VoNR通话总会莫名中断。

Morpheus决定对Mr. Sterling的手机启动一次Trace会话,以捕获故障发生瞬间的所有网络细节。我们将跟随他们的操作,来深度剖析本章定义的四个核心流程:

  • 8.11.1 Trace Start (启动Trace):Morpheus如何下达指令,让网络开始“盯梢”Mr. Sterling的手机。

  • 8.11.2 Trace Failure Indication (Trace失败指示):在启动Trace时遭遇突发状况(如切换),gNB如何向AMF“汇报情况”。

  • 8.11.3 Deactivate Trace (去激活Trace):在收集到足够数据后,如何“收网”,停止追踪。

  • 8.11.4 Cell Traffic Trace (小区流量Trace):gNB如何向AMF同步其内部为此次Trace任务分配的“档案编号”。


1. Trace Start (启动Trace)

这是整个Trace功能的入口,由AMF发起,用于命令gNB开启对特定UE的信令记录会话。

1.1 通用流程 (General)

8.11.1.1 General

The purpose of the Trace Start procedure is to allow the AMF to request the NG-RAN node to initiate a trace session for a UE. The procedure uses UE-associated signalling. If no UE-associated logical NG-connection exists, the UE-associated logical NG-connection shall be established as part of the procedure.

规范指出了几个关键点:

  1. 发起方与目标:AMF发起,目标是单个UE。

  2. UE关联信令:流程与特定UE绑定。

  3. 连接前提:如果UE当前处于IDLE状态,网络会先通过寻呼等方式将其恢复到CONNECTED状态,建立起UE关联的逻辑NG连接,然后才能启动Trace。

1.2 成功操作 (Successful Operation)

这是一个由AMF发起的单向指令流程,如图“Figure 8.11.1.2-1: Trace start”所示。

场景引入

Morpheus确认Mr. Sterling的手机正处于RRC_CONNECTED状态。他通过运维系统,向AMF-Alpha下达了针对Mr. Sterling的Trace启动指令。AMF-Alpha随即向正在为Mr. Sterling服务的gNB-CBD-01发送TRACE START消息。

The AMF initiates the procedure by sending a TRACE START message. Upon reception of the TRACE START message, the NG-RAN node shall initiate the requested trace session as described in TS 32.422.

1.2.1 TRACE START消息:一份详细的“侦察任务书”

TRACE START消息就像一份详细的任务书,告诉gNB要追踪谁、追踪什么、记录多详细、以及将记录发到哪里。其核心内容都封装在Trace Activation IE中。

  • NG-RAN Trace ID: AMF为本次Trace任务分配的唯一ID,就像案件编号,用于后续的识别和管理(如停止Trace)。

  • Interfaces to Trace: 这是一个位图(bitmap),用于指定需要追踪的接口。Morpheus可以选择追踪NG-C接口(AMF-gNB信令)、Xn-C接口(gNB间信令)或Uu接口(空口信令)等。对于Mr. Sterling的掉话问题,Morpheus勾选了Uu和Xn接口,希望观察空口质量和切换信令。

  • Trace Depth: 追踪的详细程度。可以是minimum(只记录关键事件)、medium(记录更多细节)或maximum(记录所有信令内容),还支持厂商自定义的扩展级别。Morpheus选择了maximum以获取最全面的信息。

  • Trace Collection Entity IP Address: “情报”的汇集点。gNB会将捕获到的所有Trace记录,实时或批量地发送到这个IP地址所指向的TCE服务器。

  • MDT Configuration: Trace功能可以与MDT(Minimization of Drive Tests)深度集成。AMF可以在启动Trace的同时,下发MDT配置,要求UE进行更详细的无线环境测量(如蓝牙、WLAN、传感器信息),并将这些信息也作为Trace记录的一部分。

场景演绎

Morpheus对Neo解释道:“我们发出的TRACE START消息告诉了gNB-CBD-01:‘现在开始,对AMF UE NGAP ID = 12345这个用户(Mr. Sterling)启动一次最高级别的追踪,案件编号是Trace ID = 789。重点记录Uu和Xn接口的所有信令。所有记录都实时上报给IP地址为10.20.30.40的TCE服务器。另外,顺便让他的手机上报一下周围的WLAN信号强度。’”


2. Trace Failure Indication (Trace失败指示)

在gNB尝试执行Trace任务时,可能会遇到一些阻碍,导致任务无法启动或被意外中止。这时,gNB需要向AMF报告失败。

2.1 通用流程 (General) & 成功操作 (Successful Operation)

8.11.2.1 General

The purpose of the Trace Failure Indication procedure is to allow the NG-RAN node to inform the AMF that a Trace Start procedure or a Deactivate Trace procedure or an ongoing trace has failed…

这个流程(如图“Figure 8.11.2.2-1: Trace failure indication”所示)用于gNB报告Trace启动、停止或执行过程中的失败。

Interactions with other procedures:

If the NG-RAN node is not able to initiate the trace session due to ongoing handover of the UE to another NG-RAN node, the NG-RAN node shall initiate a Trace Failure Indication procedure with the appropriate cause value.

场景引入

就在AMF-Alpha向gNB-CBD-01发送TRACE START消息的同一时刻,Mr. Sterling的汽车恰好驶入了一个十字路口,信号覆盖从gNB-CBD-01切换到了gNB-CBD-02。gNB-CBD-01正忙于处理切换流程,这是一个高优先级的移动性事件。

此时,gNB-CBD-01无法立即为这个即将离开的UE启动Trace会话。它不能默默地忽略这个指令,而是必须向AMF报告。

gNB-CBD-01会向AMF-Alpha发送一个TRACE FAILURE INDICATION消息,其中Cause IE会被设置为“handover triggered”或类似的原因。

场景演绎

Neo在监控屏幕上看到了TRACE FAILURE INDICATION告警。Morpheus解释说:“不用担心。这很正常。gNB-CBD-01告诉我们,因为它正在为Mr. Sterling办理‘转院’手续(切换),所以没法立即执行我们的‘MRI检查’(Trace Start)。AMF收到这个通知后,会明白情况,并在切换完成后,向新的服务基站gNB-CBD-02重新下发TRACE START指令。”


3. Deactivate Trace (去激活Trace)

当故障分析完成或数据采集足够时,运维人员需要停止Trace会话,以避免不必要的信令开销和数据存储。

3.1 通用流程 (General) & 成功操作 (Successful Operation)

8.11.3.1 General

The purpose of the Deactivate Trace procedure is to allow the AMF to request the NG-RAN node to stop the trace session for the indicated trace reference.

流程如图“Figure 8.11.3.2-1: Deactivate trace”所示,由AMF发起,向gNB发送DEACTIVATE TRACE消息。

Upon reception of the DEACTIVATE TRACE message, the NG-RAN node shall stop the trace session for the indicated trace reference in the NG-RAN Trace ID IE.

这个消息的内容非常简单,核心就是NG-RAN Trace ID。AMF通过这个ID,精确地告诉gNB需要停止哪一个Trace会话。gNB收到后,就会停止对该UE的所有信令记录和上报。

场景演绎

经过一段时间的追踪,Morpheus在TCE服务器上收集到了几次Mr. Sterling掉话前后的完整信令。他发现问题是由于某个特定邻区切换参数配置不当导致的。问题定位后,他立即通过AMF-Alpha向当前服务的gNB发送DEACTIVATE TRACE消息,NG-RAN Trace ID正是之前下发的789,成功停止了追踪。


4. Cell Traffic Trace (小区流量Trace)

这个流程的名字可能会引起一些误解。它虽然叫“Cell Traffic Trace”,但仍然是一个UE关联的流程。它的主要作用不是追踪整个小区的流量,而是由gNB在启动一个UE的Trace会话后,向AMF报告其内部为此Trace会话分配的资源标识

4.1 通用流程 (General) & 成功操作 (Successful Operation)

8.11.4.1 General

The purpose of the Cell Traffic Trace procedure is to send the allocated Trace Recording Session Reference and the Trace Reference to the AMF.

流程如图“Figure 8.11.4.2-1: Cell traffic trace”所示,由gNB发起,向AMF发送CELL TRAFFIC TRACE消息。

当gNB收到TRACE START后,它会在内部创建一个Trace会话,并为其分配一个Trace Recording Session Reference。这个Reference是gNB内部用于关联所有Trace记录的标识。gNB通过CELL TRAFFIC TRACE消息,将这个内部的Session Reference,连同从AMF收到的NG-RAN Trace ID(即Trace Reference),一起上报给AMF。

场景演绎

Morpheus向Neo解释了这个流程的意义:“这就像一个双向确认和档案关联的过程。我们(AMF)给了gNB一个案件编号(NG-RAN Trace ID)。gNB在内部立案后,会有一个自己的档案号(Trace Recording Session Reference)。它通过CELL TRAFFIC TRACE告诉我们:‘你交办的那个案件,我的内部档案号是XYZ’。这样,在AMF和gNB两侧,这个Trace任务就都有了明确的、可互相引用的标识,便于后续的管理和问题排查。”


FAQ

Q1: Trace功能会对用户的手机性能或电池续航产生影响吗?

A1:

对用户来说,Trace功能是完全透明和无感的。Trace的信令捕获和记录工作完全由网络侧的gNB完成。如果Trace包含了MDT配置,UE确实会执行一些额外的测量,但这通常也是UE标准行为的一部分,其额外的功耗影响微乎其微。因此,被追踪的用户不会感觉到任何速度变慢、延迟增加或电量消耗加快的现象。

Q2: Trace功能会捕获我的通话内容或上网数据吗?这是否存在隐私风险?

A2:

不会。Trace功能捕获的是**信令面(Control Plane)的消息和事件,以及与无线性能相关的测量数据。它记录的是“元数据”,即“谁在何时、何地、与谁、通过什么方式建立了连接、连接的质量如何”等信息,而不是用户面(User Plane)**的实际数据内容。你的通话语音、浏览的网页、发送的微信内容等都属于用户面数据,Trace流程不会也无权捕获这些内容。此外,规范还定义了Privacy Indicator IE,用于对Trace数据中的敏感身份信息进行匿名化处理,进一步保障用户隐私。

Q3: 既然Trace数据是发往TCE服务器,为什么AMF还需要知道gNB内部的Trace Recording Session Reference

A3:

这是一个很好的问题,涉及到运维管理的复杂性。虽然最终的详细数据在TCE,但AMF作为发起和管理Trace会话的节点,也需要对Trace的执行状态有一定的了解。通过CELL TRAFFIC TRACE,AMF可以将自己下发的NG-RAN Trace ID与gNB实际执行的Trace Recording Session Reference关联起来。当需要进行跨gNB、跨AMF的联合故障分析时,这个关联关系就变得非常重要,运维人员可以利用这两个ID,在AMF的信令日志和TCE的Trace数据之间快速建立索引,定位问题。

Q4: 如果被追踪的用户从一个gNB切换到了另一个gNB,Trace会话会中断吗?

A4:

不会中断,这正是5G Trace功能的强大之处。Trace会话的上下文信息是可以在切换过程中传递的。当Mr. Sterling的手机从gNB-CBD-01切换到gNB-CBD-02时:

  1. gNB-CBD-01会在向AMF发送的HANDOVER REQUIRED消息中,包含Trace激活的相关信息。

  2. AMF在向目标gNB-CBD-02发送HANDOVER REQUEST消息时,会再次包含Trace Activation IE。

  3. gNB-CBD-02在准备切换资源的同时,就会为Mr. Sterling的手机预先启动Trace会话。

这样,就实现了Trace会话的无缝“接力”,确保了跨gNB移动场景下的问题也能够被完整地记录下来。

Q5: Trace Depth设置为maximum会给gNB带来很大的性能压力吗?

A5:

是的,会有一定影响,所以Trace功能通常是按需、短期使用的。maximum深度意味着gNB需要解码并记录每一条与该UE相关的信令消息的完整内容,并将其格式化后发送给TCE。这会消耗gNB一定的CPU和传输资源。如果同时对大量用户开启高深度的Trace,确实可能对gNB的性能产生影响。因此,在实际运维中,Trace通常只针对少数有问题的用户,并且在问题定位后会立即通过DEACTIVATE TRACE流程停止,是一种“外科手术式”的精准诊断工具,而不是“普查”工具。