好的,我们继续进行系列的下一篇深度解读。
深度解析 3GPP TS 28.552:5.1.1.44 GTP Capacity & 5.1.2 PDCP Data Volume (非分离gNB场景下的流量测量)
本文技术原理深度参考了3GPP TS 28.552 V18.10.0 (2025-03) Release 18规范中,关于“5.1.1.44 GTP capacity”和“5.1.2 Performance measurements valid only for non-split gNB deployment scenario”的核心章节,旨在为读者提供一个关于5G一体化基站(non-split gNB)场景下,数据管道容量与流量的精细化测量解析。
引言:边缘计算节点的“最后一跳”瓶颈
在智慧城市的一个边缘计算(MEC)试点项目中,一个关键业务是为路口的智能摄像头提供AI视频分析服务。视频流从摄像头产生,上传到部署在gNB机房的MEC服务器进行处理,处理结果再下发给车辆。项目初期运行良好,但随着接入的摄像头数量增多,运维团队发现,AI分析的时延开始不稳定。
“王哥,奇怪了,”小林向老王汇报,“我们检查了MEC服务器的CPU和内存,资源充足。也检查了摄像头的无线信号,非常好。数据从摄像头到基站这一段(Uu接口)非常快。但数据从基`站到MEC服务器这‘最后一跳’,好像有瓶颈。”
老王在网络拓扑图上画出了数据流向:“小林,你看,在这个场景里,我们用的是一体化gNB(non-split gNB),CU和DU都集中在一起。视频流从UE上来,经过空口到达gNB,然后解封装到IP层,再通过N3接口(逻辑上)转发给本地的UPF,这个UPF可能就和MEC平台部署在一起。摄像头数据流的‘最后一跳’,就是gNB与本地UPF之间的GTP隧道。这条隧道的容量(Capacity)和流量(Volume),决定了MEC业务的性能上限。”
他将TS 28.552翻到了5.1.1.44和5.1.2节。“今天要学习的,就是如何为这种一体化基站的‘进出港’进行精确的流量审计。5.1.1.44的GTP容量测量,是评估gNB与核心网UPF之间数据管道的理论最大通行能力。而5.1.2节的PDCP数据量测量,则是统计在这条管道上,实际跑了多少‘纯货物’。通过对比理论容量和实际流量,我们就能判断出‘最后一跳’的瓶颈到底在哪。”
这篇文章,我们将化身为“MEC网络架构师”,通过分析GTP容量和PDCP数据量测量,揭示如何保障5G边缘计算业务的端到端数据路径性能。
1. 管道有多宽?:DL GTP capacity between UPF and NG-RAN (5.1.1.44.1)
在规划网络时,我们想知道gNB和UPF之间的数据通道,其下行方向最大能承载多大的数据速率。这就是GTP容量测量要回答的问题。
a) This measurement provides the DL GTP capacity between PSA UPF and NG-RAN. This measurement is split into subcounters per 5QI and subcounters per S-NSSAI.
b) DER (n=1).
c) The measurement is obtained by the following method: The gNB measures the maximum achievable GTP transmission rate between PSA UPF and NG-RAN for each 5QI or S-NSSAI, by counting the maximum achievable data volume for the measured 5QI or S-NSSAI for each time interval ([t, t + Δt]) during the collection period, taking the arithemetic peak value and then dividing it by Δt.
e) GTP.CapMaxDlPsaUpfNgran.5QI, where 5QI identifies the 5QI; GTP.CapMaxDlPsaUpfNgran.SNSSAI, where SNSSAI identifies the S-NSSAI.
1.1 深度解析
GTP.CapMaxDlPsaUpfNgran (GTP Capacity Maximum Downlink PSA UPF to NG-RAN) 是一个衡量N3接口理论下行容量的指标。
- 测量主体: gNB。
- 测量方法 (c项): 这是一种基于峰值速率采样的测量。gNB会将测量周期划分为很多个微小的时间窗
Δt。在每个Δt内,gNB会统计收到的GTP数据总量,从而计算出一个瞬时速率。在整个测量周期结束时,gNB会找出所有这些瞬时速率中的最大值,作为GTP Capacity上报。 - 物理意义: 这个值反映的是,在最佳条件下(例如,空口资源充足、承载网无拥塞),N3接口下行方向能够达到的峰值吞吐能力。它更多地代表了gNB设备处理GTP包的性能、以及承载网提供的峰值带宽,而不是用户的实际体验速率。
- 关键过滤维度:
5QI和S-NSSAI。这使得运营商可以评估网络为不同业务、不同切片提供的理论容量上限。
1.2 场景化应用:评估边缘UPF的下行服务能力
在智慧港口场景中,部署了本地化的UPF以降低时延。通过监控GTP.CapMaxDlPsaUpfNgran.SNSSAI_Video,运维团队可以了解到,这个边缘UPF为视频监控切片提供的最大下行GTP吞吐能力是多少。这个数据,是进行网络切片资源规划和SLA能力验证的重要依据。如果业务部门规划了1Gbps的下行视频分发需求,而这个测量值持续低于1Gbps,就说明gNB与UPF之间的连接或UPF自身的处理能力存在瓶颈。
2. 实际跑了多少货?:一体化gNB下的PDCP数据量 (5.1.2)
容量是理论值,而流量才是实际发生的数据量。5.1.2节专门定义了仅适用于一体化gNB(non-split gNB)场景下的数据量测量。在这种场景下,PDCP、RLC、MAC层都在同一个物理设备里,因此可以进行更直接的跨层数据统计。
2.1 下行流量的“发货量”:DL PDCP SDU Data Volume (5.1.2.1.1)
当AI分析结果从MEC服务器经由UPF,发送给路口的车辆时,这些数据就构成了下行流量。
5.1.2.1.1 DL PDCP SDU Data Volume Measurements a) This measurement provides the Data Volume (amount of PDCP SDU bits) in the downlink delivered to PDCP layer. The measurement is calculated per PLMN ID and per QoS level (mapped 5QI) and per S-NSSAI. c) This measurement is obtained by counting the number of bits entering the NG-RAN PDCP layers. The measurement is performed at the PDCP SDU level. e) The measurement name has the form DRB.PdcpSduVolumeDL_Filter.
2.1.1 深度解析
DRB.PdcpSduVolumeDL 统计的是gNB下行PDCP层接收到的总数据量。
- 统计点: 数据包从核心网侧(N3/NgU接口)进入gNB协议栈,到达PDCP层的入口处。
- 统计单位: bits,通常上报时会转换为Mbit。
- 统计粒度: PDCP SDU 级别。这意味着统计的是去除GTP头之后的、纯粹的用户IP包数据量,即“纯货物”的重量。
- 物理意义: 这个指标精确地衡量了,在下行方向,核心网总共向RAN“投喂”了多少业务数据。它是计算无线侧效率(如频谱效率)和进行流量分析的基础。
2.1.2 X2/Xn接口的分流统计
规范还进一步定义了在DC(双连接)场景下,经由X2接口(与4G eNB连接)和Xn接口(与其它5G gNB连接)分流的数据量。
5.1.2.1.1.2 DL Cell PDCP SDU Data Volume on X2 Interface (DRB.PdcpSduVolumeX2DL) 5.1.2.1.1.3 DL Cell PDCP SDU Data Volume on Xn Interface (DRB.PdcpSduVolumeXnDL)
这两个测量项,可以帮助我们精确地了解在双连接场景下,主站(MN)向辅站(SN)分流了多少数据,是评估和优化双连接分流策略的关键。
2.2 上行流量的“收货量”:UL PDCP SDU Data Volume (5.1.2.1.2)
当智能摄像头将视频流上传给MEC服务器时,这些数据构成了上行流量。
5.1.2.1.2.1 UL Cell PDCP SDU Data Volume a) This measurement provides the Data Volume (amount of PDCP SDU bits) in the uplink delivered from PDCP layer to higher layers. c) This measurement is obtained by counting the number of bits delivered from PDCP layer to higher layers. e) The measurement name has the form DRB.PdcpSduVolumeUL_Filter.
2.2.1 深度解析
DRB.PdcpSduVolumeUL 统计的是gNB上行PDCP层成功处理并向核心网转发的总数据量。
- 统计点: 数据包经过空口、PHY、MAC、RLC层解封装后,在PDCP层的出口处,即将被封装成GTP包发往UPF之前。
- 物理意义: 这个指标精确衡量了RAN总共向上层网络交付了多少有效业务数据。
2.3 场景化诊断:“最后一跳”瓶颈的确认
回到“幻影”的云游戏卡顿案例。小林调取了电竞酒店gNB的相关数据(假设为一体化gNB)。
- GTP容量 (
GTP.CapMaxDl...): 测量值为1Gbps,远高于游戏所需的带宽,说明gNB与UPF之间的理论通道宽度足够。 - PDCP下行数据量 (
DRB.PdcpSduVolumeDL): 小林发现,在“幻影”抱怨画面冻结的时间点,这个指标的瞬时速率出现了明显的、短暂的跌零! - N3接口丢包 (
GTP.InDataPktPacketLossN3gNB): 与此同时,N3接口的GTP丢包计数急剧增加。
最终结论:
“王哥,证据链完整了!”小林兴奋地总结道,“1. 理论容量足够,排除带宽瓶颈。2. GTP丢包与业务卡顿强相关。3. PDCP层收到的数据量(PdcpSduVolumeDL)在丢包时刻跌零,证实了丢包直接导致了数据流的中断。问题百分之百出在gNB与UPF之间的承载网!”
3. “最后一公里”的交付成功率:UL PDCP SDU Success Rate (5.1.2.2.1)
5.1.2节还定义了一个非常重要的、衡量上行无线传输质量的KPI。
a) This measurement provides the fraction of PDCP SDU packets which are successfully received at gNB. It is a measure of the UL packet delivery success including any packet success in the air interface and in the gNB. c) This measurement is obtained as: Number of successfully received UL PDCP sequence numbers… divided by Total number of UL PDCP sequence numbers of a bearer… e) The measurement name has the form DRB.PacketSuccessRateUlgNBUu…
- 深度解析:
DRB.PacketSuccessRateUlgNBUu(Packet Success Rate Uplink gNB Uu) 是一个上行PDCP SDU成功率指标。- 测量方法: PDCP层会对上行数据包进行序列号管理。gNB通过比较“期望收到的PDCP序列号总数”和“实际成功接收并无误地送到上层的PDCP序列号数量”,来计算成功率。
- 物理意义: 这个指标衡量了从UE的PDCP层,到gNB的PDCP层的端到端(空口+gNB内部处理)的交付成功率。它比物理层的BLER更贴近业务层,因为它包含了所有重传(HARQ+RLC)后的最终结果。如果这个成功率低,则明确表示无线侧存在严重的、连RLC重传都无法完全恢复的丢包问题。
结论:流量审计,端到端性能保障的基石
通过对GTP容量和PDCP数据量测量的学习,我们掌握了对gNB与核心网之间数据管道进行“健康检查”的全套方法。
- GTP容量测量 (
GTP Capacity):评估了N3接口的理论峰值能力,是网络规划和SLA能力验证的“天花板”指标。 - PDCP数据量测量 (
PDCP Volume):精确统计了在PDCP SDU层级的实际业务流量,是进行流量分析、计费和效率计算的“地基”数据。 - 丢包测量 (
Packet Loss):通过区分N3接口丢包和Uu接口丢包,成为故障域定界(承载网 vs 无线网)的“黄金标准”。 - PDCP成功率 (
PDCP Success Rate):从比物理层更高的维度,评估了上行无线链路的最终可靠性。
这一系列测量,共同构成了一套完整的流量审计体系。它使得运营商能够清晰地看到,数据在从核心网到无线网,再从无线网返回核心网的整个闭环中,每一段关键路径的容量、流量和损耗情况。这对于保障云游戏、MEC等对端到端路径质量高度敏感的新兴5G业务,具有不可替代的重要价值。
FAQ 环节
Q1:为什么5.1.2节的PDCP数据量测量,要特别强调“仅适用于non-split gNB”?
A1:因为在分离式gNB (split gNB) 架构中,PDCP层在CU-UP,而RLC/MAC/PHY层在DU。数据从UPF过来,先到CU-UP处理PDCP,再通过F1-U接口的GTP-U隧道发给DU。在这种架构下,DRB.PdcpSduVolumeDL只能在CU-UP测量,它反映的是CU-UP接收到的数据量。而DU侧的实际无线传输情况,以及F1-U接口本身的流量和丢包,都需要单独的测量项来衡量(在5.1.3节中有定义)。因此,为了避免歧义,5.1.2节明确其适用范围为CU和DU合一的一体化gNB。
Q2:GTP.InDataOctNgUgNB(GTP字节数)和 DRB.PdcpSduVolumeDL(PDCP SDU比特数)有什么区别?
A2:主要区别在于统计点和包含的协议开销。GTP.InDataOctNgUgNB是在GTP-U协议栈的入口处统计,它包含完整的GTP-U包,即GTP头+用户IP包。而DRB.PdcpSduVolumeDL是在PDCP协议栈的入口处统计,它统计的是经过GTP解封装后的PDCP SDU,即纯粹的用户IP包。因此,前者的数值必然会大于后者,多出来的部分就是GTP/UDP/IP的协议头开销。
Q3:GTP Capacity测量的是gNB的处理能力,还是传输链路的带宽?
A3:GTP Capacity测量的是一个端到端(UPF-gNB)的综合能力,其瓶颈可能出现在多个环节。它可以是:1)UPF侧的GTP封装和发送能力;2)gNB侧的GTP接收和解封装能力;3)中间承载网提供的峰值带宽。这个测量项本身无法区分瓶颈具体在哪一环,但它提供了一个“系统天花板”的基准值。如果实际业务速率远达不到这个容量值,就需要进一步分析是空口受限还是其他原因。
Q4:上行PDCP SDU成功率低,和PHR(功率余量)为负,哪个问题更严重? A4:它们之间有很强的关联性,但反映的问题阶段不同。PHR为负是“因”,是底层物理问题的直接体现,说明UE已经功率受限,无法保证物理层传输的可靠性,这将导致iBLER和rBLER升高。而上行PDCP SDU成功率低是“果”,是业务层面的最终结果。它表明,即使经过了物理层的HARQ和RLC层的ARQ等多层重传机制的“抢救”,数据包最终还是丢失了。因此,PDCP SDU成功率低的问题更严重,因为它直接意味着用户业务数据的丢失。在排查时,我们通常会先看PDCP成功率,如果发现问题,再下钻到BLER、PHR等物理层指标去寻找根源。
Q5:这些测量项在排查MEC(边缘计算)业务问题时有什么特别的价值?
A5:价值非常大。MEC的核心是将计算能力下沉到网络边缘,以实现超低时延。这意味着UPF也被下沉到gNB机房或汇聚站点。GTP Capacity和GTP Packet Loss等N3接口测量,实际上就衡量了gNB与这个边缘UPF之间“最后一跳”的连接质量。对于MEC业务来说,这一跳的性能至关重要。通过这些测量,我们可以:1)确保边缘UPF与gNB之间的传输链路带宽足够、质量可靠;2)在多个MEC节点间进行负载均衡时,可以将GTP容量和时延作为决策依据;3)当MEC业务出现性能问题时,可以快速判断瓶颈是在RAN侧、MEC平台侧,还是在两者之间的连接上。