好的,我们继续跟随5G基站工程师小雷,深入探索NG接口上那些与网络运维和故障诊断息息相关的重要流程。这一次,我们将再次聚焦于那个强大的“网络侦探”工具——Trace功能,从流程的视角,详细拆解“侦查令”的下达与回收。
深度解析 3GPP TS 38.410:6.11 UE Tracing procedures (UE跟踪流程)
本文技术原理深度参考了3GPP TS 38.410 V18.2.0 (2024-06) Release 18规范中,关于“6.11 UE Tracing procedures”的核心章节,并结合其在NGAP协议(TS 38.413)中的具体实现,为读者完整呈现5G网络中,Trace任务从核心网发起、在基站执行、上报失败以及最终被停止的端到端信令视图。
引言:从“功能描述”到“侦探实战”
在之前的5.11节解读中,我们已经从“功能”的视角,理解了Trace功能“是什么”——它如同一个“网络随身听诊器”,能够对特定的UE或小区,进行全方位的、细粒度的信令监控,用于诊断“疑难杂症”。我们知道了它有“基于信令”和“基于管理”两种模式。
现在,我们将进入6.11节,从“流程”的视角,深入探索这场“侦探行动”是“怎么做”的。6.11节将5.11节的功能定义,分解为一系列具体的、可执行的NGAP信令流程。它不再是高层的概念描述,而是AMF这位“总指挥”与gNB这位“一线侦探”之间,那本详尽的“案件侦破操作手册”。
本篇文章,我们将聚焦于6.11节所定义的Trace流程“三件套”,通过一场模拟的“VIP用户投诉案”侦破过程,详细拆解**任务的启动(Trace Start)、失败的上报(Trace Failure Indication)和任务的终止(Deactivate Trace)**这三大核心流程。
1. 流程的“剧本”:Trace任务的“开始-异常-结束”
6.11 UE Tracing procedures
The following procedures are used to trace the UE:
- Trace Start;
- Trace Failure Indication;
- Deactivate Trace;
- Cell Traffic Trace.
6.11节为我们定义了Trace的核心操作流程。我们将重点解读前三个与**Signalling Based Trace(基于UE的跟踪)**密切相关的流程,它们共同构成了单个Trace任务的完整生命周期。Cell Traffic Trace(小区流量跟踪)是一个独立的、由OAM直接发起的流程,我们在此稍作区分。
2. “行动开始”:Trace Start Procedure (跟踪启动流程)
这是“侦探行动”的起点,由AMF向gNB下达“开始监视”的指令。
NGAP Procedure: Trace Start (AMF Initiated)
实战演练(一):锁定“嫌疑人”
-
触发: 运维工程师小雷在网管系统(OAM)上,针对那位投诉视频会议卡顿的VIP用户(UE-VIP),正式下达了Trace任务。该指令经由核心网,到达了为UE-VIP服务的AMF。此时,UE-VIP正处于CONNECTED状态,连接在小雷的gNB上。
-
AMF → gNB (TRACE START):
- 流程启动! AMF立即向小雷的gNB发送
TRACE START消息。 - 消息内容(“侦查令”):
AMF UE NGAP ID,RAN UE NGAP ID: 明确指出要跟踪的是哪一个UE。Trace ActivationIE: 这是消息的核心,包含了“侦查行动”的全部细节:Trace Reference: 本次Trace任务的唯一案件编号,由核心网生成。Trace Recording Session Reference: 本次Trace任务在gNB侧记录会话的内部参考号。Interfaces to Trace: 一个列表,明确gNB需要记录哪些接口上的信令,例如NG interface,Xn interface,F1 interface,E1 interface。Trace Depth: 侦查的详细程度,如minimum,medium,maximum。Trace Collection Entity IP Address: 至关重要。gNB需要将记录下来的“证据”(Trace日志),上报到这个指定的“证据收集服务器(TCE)”的IP地址。
- 流程启动! AMF立即向小雷的gNB发送
-
gNB的响应动作:
- 小雷的gNB收到这份详尽的“侦查令”后,并不会立即回复。
- 它会立即启动内部的Trace模块,开始对UE-VIP在指定接口上的所有信令交互,进行秘密的、详细的记录。
- gNB会将记录下来的数据,按照指定的格式(由TS 32.423定义),通过IP网络,发送给指定的TCE服务器。
- 注意:
TRACE START流程是一个**Class 2 (无响应)**的流程。gNB在成功启动Trace后,无需向AMF回复一个“启动成功”的响应。这种设计简化了信令交互,AMF默认gNB会成功执行。如果执行失败,则由后续的Trace Failure Indication流程来处理。
3. “意外情况”:Trace Failure Indication Procedure (跟踪失败指示流程)
在“侦查”过程中,可能会出现gNB无法正常执行任务的意外情况。
NGAP Procedure: Trace Failure Indication (NG-RAN node initiated)
实战演练(二):侦探“跟丢了”
-
触发: 小雷的gNB正在对UE-VIP进行跟踪。但由于某种内部故障(例如,Trace模块的缓冲区溢出,或者到TCE服务器的网络路径中断),gNB无法再继续记录或上报Trace数据。
-
gNB → AMF (TRACE FAILURE INDICATION):
- 流程启动! gNB作为发起方,主动向AMF发送
TRACE FAILURE INDICATION消息,报告“任务失败”。 - 消息内容(“异常报告”):
AMF UE NGAP ID,RAN UE NGAP ID: 报告是哪个UE的跟踪任务失败了。Trace Reference: 报告是哪个“案件编号”的任务失败了。Cause: 明确告知失败的原因,例如“未指明的异常”。
- 流程启动! gNB作为发起方,主动向AMF发送
-
AMF/OAM的响应动作:
- AMF收到这个“坏消息”后,会将其上报给网管系统(OAM)。
- 小雷会在OAM的告警界面上看到一条告警:“gNB-XYZ上,针对UE-VIP的Trace任务失败”。
- 他就可以据此去排查gNB的内部故障,或者检查gNB与TCE服务器之间的网络连接。
这个流程,为Trace任务的执行过程提供了可靠性监控,确保了运维人员能够及时发现并处理“侦测系统”自身的故障。
4. “行动结束”:Deactivate Trace Procedure (停止跟踪流程)
当“案件”侦破,或者预定的侦查时间结束时,需要明确地终止“监视”行动。
NGAP Procedure: Deactivate Trace (AMF Initiated)
实战演练(三):收队归档
-
触发: 预设的30分钟Trace任务时长结束,或者小雷通过分析已收集到的日志,提前找到了问题根源,在OAM上手动停止了任务。
-
AMF → gNB (DEACTIVATE TRACE):
- 流程启动! AMF向小雷的gNB发送
DEACTIVATE TRACE消息。 - 消息内容(“收队指令”):
AMF UE NGAP ID,RAN UE NGAP ID: 明确要停止哪个UE的跟踪。Trace Reference: 明确要停止的是哪个“案件编号”的任务。
- 流程启动! AMF向小雷的gNB发送
-
gNB的响应动作:
- gNB收到“收队指令”后,立即停止对UE-VIP的所有信令记录活动。
- 与
TRACE START一样,DEACTIVATE TRACE也是一个**Class 2 (无响应)**的流程。gNB在成功停止后,无需向AMF回复确认。
总结:一套完整、闭环的“网络侦察”作业流程
通过对6.11节核心流程的深度剖析,我们看到了5G网络是如何通过一套严谨、闭环的信令流程,来管理和控制强大的Trace功能的。
- 明确的生命周期:
Trace Start(启动)、Deactivate Trace(终止)和Trace Failure Indication(异常处理),共同定义了一个Trace任务从开始到结束的完整生命周期,确保了任务的可控性。 - 中心化的控制: 所有Trace任务的发起和停止,都由核心网侧(AMF/OAM)统一控制,gNB只扮演被动的执行者。这种中心化的模式,保证了Trace功能的安全、合规和权限管理。
- 高效的信令设计: 采用**无响应(Class 2)**的流程设计,简化了信令交互,降低了在已经很复杂的故障排查场景中,由Trace本身带来的额外信令负荷。
对于基站工程师小雷来说,这套流程,就是他手中那把“手术刀”的“开关”和“仪表盘”。当遇到疑难杂症时,他知道如何通过OAM,精确地按下Trace Start这个“开关”,对“病灶”进行细致的观察。当Trace Failure Indication告警传来时,他知道是他的“手术工具”本身出了问题。而当问题定位后,他也能干净利落地通过Deactivate Trace,关闭“手术灯”,让网络恢复到正常的监控状态。这套流程的熟练运用,是衡量一名高级网络优化工程师能力的重要标尺。