好的,我们继续进行系列的下一篇深度解读。
深度解析 3GPP TS 28.552:5.1.3 Split gNB Scenario (分离式gNB场景测量)
本文技术原理深度参考了3GPP TS 28.552 V18.10.0 (2025-03) Release 18规范中,关于“5.1.3 Performance measurements valid for split gNB deployment scenario”的核心章节,旨在为读者提供一个关于5G云化、分布式无线接入网(Cloud-RAN)架构下,CU与DU之间关键接口(F1)性能测量的全景解析。
引言:城市“大脑”与“触手”的协同之舞
“王哥,市中心CBD区域的5G网络升级为Cloud-RAN架构后,运维变得好复杂!”小林指着一张复杂的网络拓扑图,向老王求助,“以前一个基站就是一个整体,现在被拆成了CU(中央单元)和DU(分布单元)。CU像‘大脑’一样集中部署在机房,DU像‘神经网络末梢’一样分布在各个楼宇。它们之间通过F1接口连接,我该怎么判断问题是出在‘大脑’、‘末梢’,还是连接它们的‘神经’(F1接口承载网)上?”
老王点点头:“小林,你问到了Cloud-RAN运维的核心。CU-DU分离架构,带来了灵活、高效、易于扩展等诸多好处,但也引入了一个新的、潜在的故障点——F1接口。这条连接‘大脑’与‘触手’的‘中传网络’(Midhaul),它的时延、抖动和丢包,将直接影响整个无线网络的性能。”
他将TS 28.552翻到了5.1.3节。“你看,规范非常严谨,它专门用一个独立的小节,来定义仅适用于分离式gNB场景的性能测量。这一节的内容,就是我们为F1接口这根‘神经’量身打造的‘神经电图仪’。它将我们之前学过的丢包、时延等测量,进一步分解到了CU-UP、F1-U接口和DU这三个独立的环节上。通过它,我们就能精确地诊断出,性能瓶颈到底在哪一段。”
这篇文章,我们将化身为“Cloud-RAN架构师”,以CBD区域的网络运维为场景,深入剖析分离式gNB场景下的专属测量项,理解如何保障5G“大脑”与“触手”之间的协同之舞流畅、精准。
1. “神经通路”的可靠性:F1-U接口丢包与丢弃测量
在分离式架构下,用户数据包的旅程变得更长了。以下行为例,IP包从核心网UPF到达CU-UP,在这里进行PDCP层处理,然后被封装成GTP-U包,通过F1-U接口发送给DU。DU再进行RLC/MAC/PHY层处理,最终通过空口发送给UE。
1.1 大脑的“决策失误”:DL PDCP SDU Drop rate in gNB-CU-UP (5.1.3.2.1)
a) This measurement provides the fraction of PDCP SDU packets which are dropped on the downlink… in the gNB-CU-UP… A dropped packet is one whose context is removed from the gNB-CU-UP without any part of it having been transmitted on the F1-U… interface. c) This measurement is obtained as: 1000000*Number of dropped DL PDCP SDU packets… divided by Number of DL PDCP SDU packets for data radio bearers that have entered PDCP-SAP… e) DRB.PdcpPacketDropRateDl and optionally …QOS …SNSSAI
- 深度解析:
DRB.PdcpPacketDropRateDl衡量的是CU-UP内部的主动丢包率。- “Drop”的定义: 规范明确定义,一个被“Drop”的包,是在CU-UP内部就被丢弃,完全没有被发送到F1-U接口上。
- 发生场景: 这通常发生在CU-UP的发送缓冲区因为拥塞而溢出时。例如,核心网侧的流量洪峰瞬间涌入,而通往DU的F1-U接口带宽有限,或者DU通过DDDS反馈表示自己处理不过来,CU-UP为了防止更严重的拥塞,只能主动丢弃一部分数据包。
- 物理意义: 这个指标直接反映了 CU-UP的处理能力与F1-U接口的承载能力之间的匹配度。如果这个值很高,说明CU-UP成为了瓶颈,或者F1-U接口的带宽不足。
1.2 中传网络的“运输事故”:DL/UL F1-U Packet Loss Rate (5.1.3.1.2 & 5.1.3.1.3)
数据包在F1-U接口这条“神经通路”上的传输,也可能发生丢失。
5.1.3.1.3 DL F1-U Packet Loss Rate c) This measurement is obtained as: 1000000* Number of missing DL GTP sequence numbers… divided by Total number of DL GTP sequence numbers…
- 深度解析:
DRB.F1UpacketLossRateDl和DRB.F1UpacketLossRateUl通过检查F1-U接口上传输的GTP-U包的序列号,来统计双向的丢包率。- 测量方法: 与我们之前学习的N3接口丢包测量完全相同,通过GTP序列号的不连续来识别丢包。
- 物理意义: 这个指标直接反映了**承载F1-U接口的中传网络(Midhaul)**的传输质量。它与CU或DU自身的处理能力无关,纯粹是“路况”问题。
1.3 末梢的“无奈放弃”:DL RLC SDU Packet Drop Rate in gNB-DU (5.1.3.2.2)
数据包历经千辛万苦到达了DU,但在发送到空口前,仍可能被丢弃。
a) This measurement provides the fraction of RLC SDU packets which are dropped on the downlink… in the gNB-DU… A dropped packet is one whose context is removed from the gNB-DU without any part of it having been transmitted on the air interface.
- 深度解析:
DRB.RlcPacketDropRateDl衡量的是DU内部的主动丢包率。- “Drop”的定义: 在DU内部被丢弃,完全没有被发送到空口上。
- 发生场景: 通常发生在DU的RLC/MAC层缓冲区因为拥塞而溢出。例如,F1-U接口流量正常,但空口无线环境突然变得极差,导致大量数据积压在DU无法送出,最终只能主动丢弃。
- 物理意义: 这个指标直接反映了 DU的处理能力与空口(Uu接口)的传输能力之间的匹配度。
1.4 场景化故障定界:“神经电图”的威力
小林在CBD区域发现某个小区的下行丢包率很高。如果是以前的一体化基站,他可能只能笼统地判断“基站有问题”。但现在,他有了一套精密的诊断工具:
- 他首先查看**
DRB.RlcPacketDropRateDl** (DU丢弃率),发现值很高。 - 同时,他查看**
DRB.F1UpacketLossRateDl** (F1-U丢包率),发现值为0。 - 他又查看了**
DRB.PdcpPacketDropRateDl** (CU-UP丢弃率),值也为0。
“王哥,故障定位了!”小林兴奋地报告,“数据从核心网到CU-UP,再通过F1接口到DU,全程都没有问题。问题出在DU内部!大量的包在DU的缓冲区被主动丢弃了。”
洞察与行动: 这个结论,将排查范围从庞杂的传输网和核心网,精准地缩小到了DU设备和空口环境。小林进一步关联了该小区的无线指标,发现该DU下挂的几个小区都存在严重的外部干扰,导致空口发送效率极低,数据积压在DU无法送出。问题根源找到了——外部干扰。
2. “神经传导”的速度:F1-U接口时延测量
除了可靠性,F1接口的时延也是影响用户体验的关键。
2.1 三段式时延分解测量 (5.1.3.3)
规范将下行总时延,精细地分解为了三段进行测量:
5.1.3.3.1
Average delay DL in CU-UP(DRB.PdcpSduDelayDl) 衡量数据包在CU-UP内部的处理时延(从N3口进,到F1-U口出)。
5.1.3.3.2
Average delay DL on F1-U(DRB.PdcpF1DelayDl) 衡量数据包在F1-U接口上的单向传输时延。
5.1.3.3.3
Average delay DL in gNB-DU(DRB.RlcSduDelayDl) 衡量数据包在DU内部的处理和排队时延(从F1-U口进,到空口MAC层出)。
- 深度解析:
这三个测量项的平均值之和,近似等于一个数据包从离开UPF到准备在空口发送的总时延。通过对比这三段时延的大小,我们可以清晰地知道时延瓶颈在哪一环。
- **
CU-UP时延**高,说明CU-UP设备性能不足或负荷过重。 - **
F1-U时延**高,说明中传网络路径长或存在拥塞。 - **
DU时延**高,说明DU设备性能不足,或更常见的,空口拥塞导致数据在DU大量排队。
- **
2.2 场景化时延瓶颈分析
在智能摄像头AI分析的案例中,小林发现端到端时延不稳。他调出了时延三段论数据:
DRB.PdcpSduDelayDl(CU-UP时延): 稳定在0.5ms。DRB.PdcpF1DelayDl(F1-U时延): 在1ms到10ms之间剧烈抖动!DRB.RlcSduDelayDl(DU时延): 稳定在2ms。
“王哥,这次是时延问题,瓶颈在F1接口!”
洞察与行动: F1接口的时延抖动(Jitter),是导致实时业务(如视频分析、云游戏)体验劣化的元凶。这个问题明确地指向了中传网络。经过传输部门的排查,发现承载这条F1业务的光纤专线,被错误地与一些大流量的普通互联网业务复用在同一个端口,导致了QoS拥塞和抖动。在为其更换了独立的物理端口后,F1-U时延立刻恢复了稳定。
3. 其他关键测量
5.1.3节还定义了其他一些关键测量,共同构成了分离式gNB的完整监控视图。
- IP时延与分布 (
IP Latency measurements- 5.1.3.4): 专门测量“首包”时延,对于评估网页打开、视频首帧等体验至关重要。 - UE上下文释放 (
UE Context Release- 5.1.3.5): 分别统计由DU发起和由CU发起的UE上下文释放请求,及其原因。这有助于分析连接异常释放的根源是在“末梢”还是“大脑”。 - 数据量测量 (
PDCP data volume measurements- 5.1.3.6 & 5.1.3.10): 分别在CU-UP和DU统计PDCP/RLC层的数据包总量,用于精细化的流量统计和核算。 - 切换测量 (
Handovers measurements- 5.1.3.7): 为分离式架构下的Intra-gNB切换(可能涉及跨DU的切换)定义了专门的测量项,用于评估内部移动性的性能。
结论:分离式架构下的“分段式”诊断艺术
通过对CBD区域网络问题的层层剖析,我们掌握了5G Cloud-RAN架构下的核心运维方法论——分段式诊断。5.1.3节的测量体系,正是这一方法论的标准化体现。
- 三段式丢包/丢弃模型 (CU-UP Drop, F1-U Loss, DU Drop): 将端到端的丢包问题,精准地分解到“大脑”、“神经”和“触手”三个环节,实现了快速、精准的故障定界。
- 三段式时延模型 (CU-UP Delay, F1-U Delay, DU Delay): 将总时延进行分解,清晰地识别出时延瓶颈所在,为性能优化提供了明确的方向。
- 全面的生命周期管理: 从上下文释放到切换,再到流量统计,为分离式架构的每一个独特环节都提供了专属的测量工具,确保了端到端的可视、可控、可管。
这套“神经电图仪”,使得复杂的Cloud-RAN架构变得透明。它赋予了网络工程师如同外科医生般的精准洞察力,能够清晰地判断出,是“大脑”思考太慢,是“神经”传导不畅,还是“触手”执行不力,从而保障“大脑”与“触手”的协同之舞,永远优雅而高效。
FAQ 环节
Q1:为什么在分离式gNB场景下,需要同时测量“Packet Loss”和“Packet Drop”? A1:这是为了区分**“被动丢失”和“主动丢弃”。“Packet Loss”(丢包)通常发生在两个网元之间的传输链路上(如F1-U接口),是由于网络原因(如拥塞、误码)导致的被动事件,通常通过GTP序列号检测。而“Packet Drop”(丢弃)则发生在网元内部(如CU-UP或DU的缓冲区),是设备为了应对自身拥塞、防止缓冲区溢出而采取的主动**管理行为。区分这两者,对于故障定界至关重要:Loss高是传输问题,Drop高是设备处理能力或下游链路瓶颈问题。
Q2:F1接口的时延要求是多少?DRB.PdcpF1DelayDl这个指标的正常范围应该是多少?
A2:F1接口的时延要求非常严格,因为它直接计入端到端的无线传输总时延。3GPP TR 38.801中对中传网络(Midhaul)的时延有详细的讨论,对于一些低时延业务,单向F1时延通常要求在几毫秒甚至亚毫秒级别。DRB.PdcpF1DelayDl的正常范围取决于运营商的承载网技术和规划,但在一个良好的光纤网络环境下,这个值通常应该稳定在1-2毫秒以内。如果出现超过5ms的数值或剧烈的抖动,就需要引起高度警惕。
Q3:PDCP data volume (5.1.3.6) 和 RLC SDU Packets (5.1.3.10) 的统计有什么区别?
A3:它们统计的位置和协议层不同。PDCP data volume在CU-UP进行统计,统计的是PDCP层的用户数据量。而Total number of DL RLC SDU Packets则是在DU进行统计,统计的是经过F1接口传输后,在DU的RLC层收到的数据包数量。这两个指标可以用于交叉验证和分析:例如,通过对比CU-UP发送的PDCP PDU数量和DU接收到的RLC SDU数量(两者在没有分包的情况下应近似相等),可以间接验证F1-U接口的完整性。
Q4:分离式架构下的Intra-gNB切换(5.1.3.7)和一体化gNB的Intra-gNB切换(5.1.1.6.2)有什么不同? A4:在一体化gNB中,Intra-gNB切换通常是同一个设备内部不同扇区之间的切换,流程非常简单。而在分离式架构下,Intra-gNB切换可能有两种情况:1)Intra-DU切换: 切换发生在同一个DU下的不同小区之间,流程与一体化gNB类似。2)Inter-DU切换: 切换发生在由同一个CU控制的不同DU之间,这个流程就变得更复杂,需要CU-CP作为协调者,在两个DU之间进行信令和上下文的交互。5.1.3.7节的测量,正是为了监控这种更复杂的Inter-DU切换的性能。
Q5:这些分离式gNB的测量项,会显著增加设备的性能开销吗? A5:会增加一定的性能开销,但这是实现精细化运维所必需的。例如,时延测量需要设备在数据包进出协议栈的关键节点打上高精度的时间戳,丢包测量需要对GTP序列号进行持续的检查和缓存。这些操作都会消耗一定的CPU和内存资源。因此,设备商在设计CU和DU时,就需要将这些测量功能的性能开销考虑在内。运营商也可以根据实际的运维需求,选择性地开启或关闭某些过于精细的测量项,以在“可观测性”和“系统性能”之间取得平衡。