深度解析 3GPP TS 28.552:一文读懂5G网络性能测量天书
本文技术原理深度参考了3GPP TS 28.552 V18.10.0 (2025-03) Release 18规范,旨在为读者提供一个5G网络性能测量全景视图。
引言:老王的“秘密武器”
凌晨两点,城市早已沉睡,但运营商网络优化中心的灯火依旧通明。资深网优工程师老王正紧锁眉头,盯着屏幕上一条条不断滚动的告警和用户投诉。
“城南高新区,多个企业用户反馈视频会议卡顿严重,尤其是晚高峰时段。” “地铁10号线,上班族抱怨进入隧道后游戏延迟飙升,频繁掉线。” “新开的智慧工厂,AGV小车调度成功率未达标,偶有‘趴窝’现象。”
这些看似孤立的问题,背后却指向了同一个复杂的根源——5G网络性能。面对这张由成千上万个网元、无数条数据流交织而成的巨网,如何精准定位问题?是无线侧资源紧张,还是承载网抖动过大?是核心网信令处理不过来,还是网络切片配置有误?
老王深吸一口气,熟练地打开了一个文档。这个文档没有酷炫的图形界面,只有密密麻麻的文字、表格和定义,它的名字叫“3GPP TS 28.552”。这,就是老王和全球所有网络优化工程师的“秘密武器”和“共同语言”。
TS 28.552,全称为“5G performance measurements”,是3GPP定义的一部堪称“天书”的规范。它事无巨细地规定了5G网络中各个网元(从基站到核心网)应该如何、以及应该测量哪些性能指标。可以说,没有它,5G网络的维护和优化将寸步难行,如同医生没有了听诊器和化验单。
这篇文章,将作为我们深度拆解系列的第一篇,带领大家对这部“天书”进行一次全面的鸟瞰。我们将跟随老王的视角,理解这部规范的宏大框架,看看它到底为我们描绘了一幅怎样精细的5G网络性能“CT扫描图”。这不仅是对规范的解读,更是对现代通信网络“可观测性”这一核心理念的深度探索。
1. 规范的基石:为何需要一本性能测量的“法典”? (TS 28.552 概览及第1-4章核心思想)
在深入探索这座宝库之前,我们首先要明白它的地基是什么。TS 28.552的前四章——“Scope (范围)”、“References (参考文献)”、“Definitions, abbreviations and measurement family (定义、缩写和测量族)”以及“Concepts and overview (概念和概述)”——共同构成了理解整部规范的基石。
1.1 统一语言的重要性 (第1-3章)
想象一下,如果全球的医生对“发烧”的定义各不相同,有的认为37.5℃算,有的认为38℃才算,那将是怎样的混乱场面?通信网络也是如此。
Scope (范围): This document specifies the performance measurements for 5G networks including network slicing. Performance measurements for NG-RAN are defined in this document (clause 5.1)… The performance measurements for 5GC are all defined in this document (clause 5.2 to 5.6).
规范开宗明义,它的管辖范围覆盖了整个5G网络,包括无线接入网(NG-RAN)和5G核心网(5GC),并且特别提到了网络切片。这意味着,无论是哪个设备商提供的gNB、AMF、UPF,在性能测量这件事上,都必须遵循同一套标准。
第2章的参考文献和第3章的定义、缩写,看似枯燥,却是实现“统一语言”的关键。它们确保了当我们谈论一个术语,例如“PDU Session”或“Conditional Handover”,我们所指的都是3GPP体系下唯一且明确的概念。
老王对此深有感触:“想当年,做跨厂商的网优,A厂的‘切换成功率’和B厂的定义可能就差一个统计触发点,为了拉齐口径,光是沟通和数据清洗就得花掉大半天。现在好了,28.552就是我们的‘度量衡’,一切以它为准。”
1.2 解读数据的“语法”:测量类型、过滤器与命名规则 (第4章)
如果说第1-3章定义了“单词”,那么第4章就定义了如何将这些“单词”组合成有意义的“句子”——即具体的性能测量项。
1.2.1 性能指标 (Performance indicators)
规范指出,性能指标(PI)通常是从一个或多个网元收集的性能测量(Performance Measurement)数据聚合而成的。例如,单个gNB的“下行PRB利用率”是一个测量值,而整个区域所有gNB的平均“下行PRB利用率”则可以构成一个性能指标,用以评估该区域的整体无线资源负载。
1.2.2 过滤器 (Filters) 和子计数器 (sub-counters)
这是TS 28.552中最核心、最精妙的概念之一。单纯的总量统计往往会掩盖问题的本质。
Filters: Performance measurements may be sub-divided by use of applicable filters to form new Performance measurements (or sub counters). Any applicable Filter(s) are identified in each performance measurements definition.
规范允许使用“过滤器”对测量进行细分。常见的过滤器有哪些?
- 5QI/QCI: QoS Class Identifier,标识了业务的服务质量等级。
- S-NSSAI: Single Network Slice Selection Assistance Information,标识了网络切片。
- PLMN ID: 标识了运营商网络。
老王举了个例子:“一个基站总的空口时延是10ms,看起来不错。但用了过滤器之后,我发现5QI为1(例如VoNR语音业务)的包时延只有2ms,而5QI为9(默认互联网业务)的包时延高达18ms。这样我就能精准定位到是普通上网用户的体验在恶化,而不是所有业务都出了问题。同样,通过S-NSSAI过滤器,我可以独立评估我们为智慧工厂提供的eMBB切片和uRLLC切片的性能是否都达标。”
1.2.3 测量命名规则 (Measurement type naming)
规范还定义了一套严格的命名规则,使得每一个测量项的名字都包含了丰富的信息。
Measurement type naming: The measurement type is constructed as follows:
<familyName>.<measurementName>.<Subcounter(s)>_<Filter(s)>
这个结构就像一个地址,能精确地告诉你这个测量项的“籍贯”和“属性”。例如,DRB.UEThpDl.SNSSAI 这个名字,我们就能解读出:
DRB: 属于数据无线承载(Data Radio Bearer)这个测量族。UEThpDl: 测量的是下行UE吞吐率。SNSSAI: 这个测量值是按S-NSSAI进行了过滤细分的。
这套“语法”让自动化处理和大数据分析成为可能,工程师和AI平台都能准确无误地理解每一个数据的含义。
2. 5G网络的“CT扫描”:深入各大网元性能测量域 (第5章核心内容概览)
第5章是整部规范的主体和灵魂,占据了绝大部分篇幅。它就像一台精密的CT扫描仪,从无线到核心,逐层、逐个网元地定义了需要监控的性能“切片”。我们将以功能域为线索,进行一次快速的巡览。
2.1 无线前线:gNB的性能万花筒 (第5.1节)
作为直接与用户终端交互的设备,gNB的性能测量项最为繁多和复杂,几乎占据了规范的一半内容。它全面覆盖了无线侧的方方面面。老王的工作80%都围绕着这些测量展开。
-
数据传输质量 (Packet Delay, Packet Loss/Drop Rate - 5.1.1.1, 5.1.3.1, 5.1.3.2等): 这是用户最直观的感受。规范定义了空口、F1-U接口、gNB内部处理等各个环节的时延和丢包测量。老王排查游戏卡顿时,会重点关注“空口时延分布”,看是否存在突发的高时延。
-
无线资源利用率 (Radio resource utilization - 5.1.1.2): 这关乎网络的容量和效率。规范定义了上/下行PRB(物理资源块)利用率、PDCCH CCE利用率、MIMO层数分布等。老王做网络扩容规划时,PRB利用率是他最重要的依据之一。如果一个小区连续一周在忙时PRB利用率都超过80%,那么扩容就迫在眉睫了。
-
用户吞吐率 (UE throughput - 5.1.1.3): 这是衡量用户速率体验的核心。规范不仅定义了平均吞吐率,还定义了吞吐率的分布,这对于评估多少比例的用户达到了预期的速率至关重要。
-
移动性管理 (Mobility Management - 5.1.1.6): 这是保障网络连续覆盖的关键。规范详细定义了各种场景下的切换测量,包括:
- Inter-gNB/Intra-gNB handovers (gNB间/内切换): 切换准备、执行的请求次数、成功次数、失败次数,并且对失败原因进行了细分。
- Handovers between 5GS and EPS (5G与4G间切换): 这对于保障5G初期覆盖不足区域的业务连续性至关重要。
- Conditional/DAPS handovers (条件切换/双激活协议栈切换): 这些是R16及以后引入的新特性,旨在提升切换的可靠性和无缝性,规范也为其定义了专属的测量。
老王在处理地铁隧道内的掉话投诉时,就会调取沿线基站的切换测量数据,分析是“切换判决太晚”还是“目标小区资源不足”导致的失败。
-
连接管理 (RRC connection number/management - 5.1.1.4, 5.1.1.15等): 这反映了网络的接入能力和用户状态。RRC连接建立成功率、RRC连接用户数(平均/峰值)等是评估网络可接入性的基本盘。
除此之外,5.1节还包含了TB传输、DRB(数据承载)、CQI(信道质量指示)、MCS(调制编码方案)、RACH(随机接入)等海量测量项,它们共同构成了一幅详尽的gNB健康状态图。
2.2 网络大脑的脉搏:核心网各NF的性能监控
当数据包离开基站,就进入了5G核心网的广阔天地。TS 28.552对核心网各个关键网元(NF)的性能也做了明确的规定。
-
AMF (Access and Mobility Management Function - 5.2节): 作为移动性管理的“大脑”,AMF的性能关乎用户能否“进得来、找得到”。
- 注册管理 (Registration procedure): 初始注册、移动性注册、周期性更新的请求数、成功数、失败数、平均/最大时长。老王关注这些数据来判断用户的附着网络过程是否顺畅。
- 寻呼管理 (Paging): 寻呼次数、成功率。这决定了当用户处于空闲态时,网络能否及时将他“唤醒”以接收数据。
- 切换管理 (Inter-AMF handovers): 跨AMF切换时的PDU会话和QoS流建立情况。
-
SMF (Session Management Function - 5.3节): 作为会话管理的“指挥官”,SMF的性能决定了用户的数据通路能否“建得好、管得住”。
- PDU会话管理 (PDU Session Management): PDU会话的建立/修改/释放的请求数、成功数、失败数、建立时长。这是评估用户能否正常上网的关键。
- QoS流监控 (QoS flow monitoring): QoS流的创建/修改/失败次数。这反映了网络对不同业务的差异化服务保障能力。
-
UPF (User Plane Function - 5.4节): 作为数据转发的“高速公路”,UPF的性能直接影响用户的最终速率和时延。
- 接口流量统计 (N3/N6/N9 interface related): 进出GTP数据包的数量、字节数、丢包率、乱序率。
- 时延测量 (Packet Delay): GTP包在UPF内部的处理时延、跨N3/N9接口的往返时延(RTT)。老王分析端到端时延时,UPF的这些测量值是剖析核心网段时延贡献的重要部分。
-
其他核心网NF (PCF, UDM, NRF, NSSF, SMSF等 - 5.5至5.12节): 规范同样没有遗漏这些“配角”,它们各自的性能也至关重要。
- PCF (Policy Control Function): 策略关联的建立/更新,反映策略控制的效率。
- UDM (Unified Data Management): 用户数据管理的请求/成功/失败,关乎用户签约信息的获取。
- NRF (Network Repository Function): NF服务注册/发现的性能,是服务化架构(SBA)正常运转的基础。
- NSSF (Network Slice Selection Function): 网络切片选择的请求/成功/失败,直接影响切片业务的可用性。
-
边缘计算与分析智能 (ECS, EES, NWDAF - 5.14, 5.15, 5.18节): 随着5G向智能化和边缘化发展,规范也与时俱进,为这些新兴网元定义了性能测量。
- ECS/EES (Edge Computing): 边缘应用的注册、发现等性能。
- NWDAF (Network Data Analytics Function): 这是5G智能化的核心,规范甚至定义了对NWDAF本身提供分析服务的性能测量,如“提供分析服务信息的时间消耗”,以及ML模型训练相关的测量。这体现了3GPP对网络内生智能运维的重视。
3. 超越单个节点:端到端与切片性能的宏观视角 (第6章)
第5章提供了对单个网元的微观检查,而第6章则将视野提升到了一个更高的维度。
Measurements related to end-to-end 5G network and network slicing (与端到端5G网络和网络切片相关的测量)
虽然本章目前内容不多,且将一些具体测量定义为“Void”(空),但它指明了方向。特别是 6.2 Virtualised resource usage measurement (虚拟化资源使用测量),它定义了对虚拟化NF(如vCPU, vMemory, vDisk)资源使用率的测量。
在网络全面云化的今天,这一节意义重大。老王分析问题时,不仅要看通信层面的性能,还要看承载这些NF的底层云平台的资源使用情况。“有时候,某个AMF的注册成功率下降,查半天信令没问题,最后通过这里的测量发现是承载它的虚拟机CPU使用率达到100%了。这就是典型的‘车没问题,路堵了’。”
4. 理论联系实际:提供实战指南的附录
如果说正文部分是“教科书”,那么附录A“Use cases for performance measurements (性能测量用例)”就是一本“习题解析与实战指南”。
它以用例(Use Case)的形式,将正文中定义的枯燥测量项串联起来,应用于解决实际问题。例如:
A.1 Monitoring of UL and DL user plane latency in NG-RAN(监控NG-RAN的上/下行用户面时延)A.17 Monitoring of handovers(监控切换)A.72 Monitoring of network slice selection(监控网络切片选择)
这些用例为像老王这样的工程师提供了极佳的参考,告诉他们在面对特定性能问题时,应该关注哪些测量项,以及如何组合分析这些测量项。
结论:一部持续进化的网络运维“活字典”
从统一的测量语言,到精细的网元CT扫描,再到面向未来的端到端、切片化和智能化监控,3GPP TS 28.552为我们构建了一个完整、严谨且不断演进的5G网络性能可观测体系。
它不仅仅是一份技术文档,更是全球运营商、设备商和优化工程师们协同工作的基石。对于老王而言,深夜里的每一次精准定位,每一次成功优化,背后都离不开对这部“天书”日复一日的钻研和应用。
这篇概览文章只是一个开始,我们仅仅是在这座宝库的门口窥探了一下它的宏伟。从下一篇文章开始,我们将正式步入殿堂,从第一章第一节开始,逐字逐句,结合更具体的场景,去拆解和吸收这部规范的每一个知识点。敬请期待!
FAQ 环节
Q1:为什么3GPP TS 28.552对于5G网络运维如此重要? A1:TS 28.552的重要性体现在“标准化”和“全面性”上。首先,它为全球所有设备商和运营商提供了统一的性能测量标准,确保了在多厂商环境下网络性能的可比性和管理的统一性,这是高效运维的基础。其次,它全面覆盖了从无线接入网到核心网的几乎所有网元和关键流程,提供了一个完整的、端到端的性能视角,使得工程师能够系统性地监控、分析和优化网络,而不是盲人摸象。
Q2:这份规范中定义的“性能测量(Performance Measurement)”和我们常说的KPI(关键性能指标)有什么关系? A2:它们是“原材料”和“成品”的关系。TS 28.552中定义的是基础的“性能测量”,也被称为“计数器(Counter)”,它们是网络设备直接采集的原始数据,例如“成功切换的次数”或“下行发送的总字节数”。而KPI(在3GPP中通常由TS 28.554定义)是基于这些原始测量值通过特定公式计算得出的、更能直观反映网络性能好坏的指标,例如“切换成功率”(= 成功切换次数 / 尝试切换总次数 * 100%)。简单来说,28.552告诉设备该“数什么”,28.554告诉我们该“算什么”。
Q3:gNB部分的测量项(5.1节)非常庞杂,作为一名无线网络工程师应该如何着手学习? A3:学习5.1节确实需要耐心和方法。建议采用“自顶向下、结合场景”的方式。首先,不要一开始就陷入某个具体测量的定义细节,而是先掌握其宏观分类,如时延、资源利用率、吞吐率、移动性、可接入性等。然后,将这些分类与日常工作中的实际问题相结合。例如,当遇到“用户投诉速率慢”的场景时,就去专门学习“UE Throughput (5.1.1.3)”相关的测量项;遇到“掉话”问题时,就去深入研究“Mobility Management (5.1.1.6)”下的各种切换测量。通过这种问题驱动的方式,学习将更有目的性,也更容易理解和记忆。
Q4:TS 28.552是否只适用于5G SA(独立组网)网络?NSA(非独立组网)架构下的性能测量是如何处理的? A4:规范主要基于5G SA架构进行定义,但它也兼容和覆盖了NSA场景。例如,在gNB的测量中,规范会明确指出某些测量适用于NR Option 3(即EN-DC,一种典型的NSA架构)。在NSA下,部分控制面信令(如RRC)仍然由LTE侧处理,因此相应的RRC测量需要参考4G的性能测量规范(如TS 32.425)。而与5G NR相关的数据面性能,如PDCP数据量、吞吐率等,则由TS 28.552来定义。工程师在分析NSA网络性能时,需要结合4G和5G的测量规范一起看。
Q5:作为一名RAN(无线接入网)工程师,是否有必要了解核心网部分的性能测量(5.2节及以后)? A5:非常有必要。现代通信网络是一个有机的整体,很多问题是端到端性质的。RAN工程师如果只懂无线侧,在排查问题时视野会受限。了解核心网的测量,至少能帮助RAN工程师判断问题是否出在无线侧。例如,用户无法建立PDU会话,RAN侧检查RRC连接和无线质量都正常,如果此时懂得去查看SMF的“PDU会话建立失败”计数器,并发现失败原因是“用户数据订阅问题”,那么就能快速地将问题定位到核心网的UDM,从而大大提高故障排查效率。具备端到端视野是优秀高级工程师的必备素质。