好的,我们继续进行系列的下一篇深度解读。
深度解析 3GPP TS 28.552:5.1.4 Measurements for NSOEU & 5.14 Measurements for ECS (行业专网测量:能源与边缘计算)
本文技术原理深度参考了3GPP TS 28.552 V18.10.0 (2025-03) Release 18规范中,关于“5.1.4 Performance measurements for NSOEU”和“5.14 Performance measurements for ECS”的核心章节,旨在为读者提供一个关于5G如何深入垂直行业,为能源互联网和边缘计算等关键应用提供可度量、可保障的连接服务的性能测量解析。
引言:从“连接万物”到“赋能万业”
“王哥,我们最近接了一个非常有挑战性的新项目,”小林兴奋地向老王展示着一份蓝图,“市电力公司希望我们为他们构建一张覆盖全市的5G智能电网专网。这张网上要跑两种核心业务:第一,连接数百万个智能电表,进行数据采集;第二,连接成千上万个配电站的自动化开关(FTU/DTU),实现故障区域的‘秒级’隔离和恢复。”
“这张网,对可靠性的要求,比我们之前保障的所有业务都要高,”小林面色凝重,“一个区域的电表数据采集失败,只是经济损失。但如果一个关键的变电站开关失联,导致故障隔离失败,就可能引发大面积停电事故!”
老王点点头,表情严肃:“小林,你说得对。我们正在从‘连接万物’的消费互联网时代,迈向‘赋能万业’的产业互联网时代。5G网络不再仅仅是‘信息高速公路’,更是社会关键基础设施的‘神经网络’。对于电力、交通、工业这些垂直行业,网络的性能不再仅仅是‘体验’问题,更是‘安全生产’问题。”
他将TS 28.552翻到了两个特殊的章节——5.1.4和5.1.4。“你看,3GPP早已预见到了这一天。5.1.4节,Performance measurements for NSOEU(能源公用事业网络和服务运营测量),就是专门为智能电网这种场景量身打造的‘高可靠性SLA监测仪’。而5.1.4节,Performance measurements for ECS(边缘计算支持功能测量),则是为支撑像AR导航、AI质检这类边缘智能应用而设计的‘边缘大脑体检报告’。今天,我们就来学习,5G是如何通过标准化的测量,来兑现对垂直行业‘高可靠、高智能’的承诺的。”
1. “永不掉线”的承诺:NSOEU测量 (5.1.4)
NSOEU (Network and Service Operations for Energy Utilities) 是3GPP为满足能源行业(特别是电网)对通信网络极端可靠性需求而定义的一套框架。其核心,就是对网络可用性的极致监控。
Measurements related to cell service status (5.1.4.1) - 小区服务状态的“心电图”
5.1.4.1节定义了一组测量,用于从gNB-DU的视角,对小区的服务状态进行分钟级的精确监控。
1.1 服务与中断的总时长:Total Durations
5.1.4.1.1
Total cell In-Service duration(OEU.CellInServiceTotal.NCGI) a) This measurement provides the total time duration for which an active cell in a gNB-DU remains In-Service. c) …summing up all these time intervals of a cell which fall within the desired observation time frame…
5.1.4.1.2
Total cell outage duration(OEU.CellOOSTimeTotal.NCGI) a) This measurement provides the total time duration for which a cell in a gNB remains out of service.
- 深度解析:
OEU.CellInServiceTotal和OEU.CellOOSTimeTotal(Operations for Energy Utilities) 是一对互补的计数器。它们通过gNB-DU向gNB-CU上报的GNB DU CONFIGURATION UPDATE消息中的“Service Status”字段,来判断一个小区是处于“In-Service”(服务中)还是“Out-Of-Service”(中断服务)状态。In-Service Total累加了小区在测量周期内(如一天)所有处于“服务中”状态的时长,单位是分钟。Outage Total则累加了所有处于“中断服务”状态的时长,单位是秒。 这两个指标是计算小区可用性的基础。
1.2 中断事件的深度剖析:Average Duration & Availability
5.1.4.1.3
Average cell outage duration(OEU.CellOOSTimeAverage.NCGI) c) This measurement is obtained by dividing the measurement OEU.CellOOSTimeTotal.NCGI (clause 5.1.4.1.2) with Noutage where Noutage is the number of occurrences of outage…
5.1.4.1.4
Cell AvailabilityNRCellDU(CellAvailNRCellDU) a) This measurement provides the percentage of time that the NRCellDU part of the cell is available to provide service to UEs… d) …The CellAvailNRCellDU measurement is computed as the ratio of the cumulative count (in seconds) over the granularityPeriod (in seconds) X 100.
- 深度解析:
Average outage duration: 衡量的是平均每次中断事件的持续时长。它是用“总中断时长”除以“中断次数”得出的。Cell Availability: 这就是最终的可用性KPI,计算公式为:(测量周期总时长 - 总中断时长) / 测量周期总时长 * 100%。它直接回答了“在整个周期内,小区有多大比例的时间是可用的?”
1.3 场景化应用:智能电网的“5个9”可靠性考核
电力公司与运营商签订的SLA中,最核心的条款就是网络可用性必须达到“5个9”,即99.999%。
这意味着,在一个年度(365天 x 24小时 x 60分钟 = 525,600分钟)内,一个关键区域小区的总中断时长,不能超过 525,600 * (1 - 0.99999) = 5.256 分钟!
“小林,看到了吗?”老王严肃地说,“对于普通手机用户,小区中断半小时可能只是少刷一会儿短视频。但对于智能电网,每年超过5分钟的中断就是一次严重的SLA违约!OEU.CellOOSTimeTotal这个以秒为单位的计数器,就是悬在我们头上的‘达摩克利斯之剑’。”
此外,OEU.CellOOSTimeAverage(平均中断时长)也同样关键。即使总中断时长达标,但如果是由一次长达5分钟的中断造成的,其影响也远大于10次30秒的短暂中断。这个指标,驱动着网络运维团队追求**MTTR (Mean Time To Repair,平均修复时间)**的极致缩短。
洞察: NSOEU测量体系,通过对小区服务状态的超高精度、全时域监控,将一个模糊的“高可靠”概念,量化为一系列可测量、可考核、具有法律效应的KPI。这是5G网络能够承担起社会关键基础设施使命的标准化基石。
2. “边缘大脑”的健康体检:ECS/EES测量 (5.1.14 & 5.1.15)
(注:规范原文中,5.14节描述ECS测量,5.15节描述EES测量,两者逻辑紧密,故合并解读。)
在AR手术教学、智慧港口AGV调度等场景中,低时延的实现依赖于MEC(边缘计算)。3GPP定义了ECS (Edge Computing Support Function) 和 EES (Edge Enabler Server) 等功能实体,来共同实现边缘应用和用户的发现、注册与管理。可以简单地将ECS理解为核心网侧的“边缘服务协调员”,而EES则是边缘侧的“应用商店和注册中心”。它们的性能,决定了边缘应用能否被用户顺利地“找到”和“用上”。
2.1 应用的“上架与发现”:EAS Discovery & Registration
5.1.15.1
EAS Discovery procedure related measurements(EAS发现流程测量)
- 5.1.15.1.1
Number of discovery requests(DIS.EasDisReq)- 5.1.15.1.2
Number of successful discovery request(DIS.EasDisSucc)- 5.1.15.1.3
EAS discovery failure(DIS.EasDisFail.Cause)
- 深度解析:
EAS (Edge Application Server) 即边缘应用服务器。这组测量监控的是**用户(EEC)发现边缘应用(EAS)**的流程。当AR导航应用启动时,它需要向EES查询“我附近有哪些可用的导航渲染服务器?”
EasDisReq:统计EES收到了多少次发现请求。EasDisSucc:统计EES成功返回了可用EAS列表的次数。EasDisFail.Cause:统计发现失败的次数,并按原因(如位置无效、应用类型不支持等)细分。 EAS发现成功率,是衡量边缘生态系统“可用性”的基础。
5.1.15.3
EAS Registration procedure related measurements(EAS注册流程测量) (包含请求数、成功数)
- 深度解析: 这组测量监控的是**边缘应用(EAS)向EES“上架”**的流程。一个新部署的AR导航服务器,需要先向EES注册自己,告诉EES“我在这里,我能提供什么服务”。这个注册流程的成功率,决定了边缘应用能否被纳入整个生态系统。
2.2 用户的“注册与接入”:EEC & Service Provisioning
5.1.15.2
EEC Registration procedure related measurements(EEC注册流程测量) (包含请求数、成功数、更新数、去注册数)
- 深度解析: EEC (Edge Enabler Client) 是UE上使能边缘计算的客户端。这组测量监控的是用户终端向EES进行注册、更新、注销的全过程。注册成功,是UE能够使用边缘服务的前提。
5.1.14.2
Service provisioning procedure related measurements(服务开通流程测量) (由ECS提供,包含请求数、成功数)
- 深度解析:
当用户(EEC)请求使用一个服务时,ECS会扮演“协调员”,处理这个服务开通(provisioning)请求,并与EES、核心网等进行交互。服务开通成功率 (
SP.SerProvSucc/SP.SerProvReq),是衡量用户从“看到应用”到“用上应用”这个转化过程是否顺畅的关键KPI。
结论:从标准化测量到行业化赋能
通过对NSOEU和ECS/EES这两个典型行业场景的测量解读,我们看到了5G性能管理体系的深刻演进:
- 从通用走向专用: 规范不再满足于提供一套“放之四海而皆准”的通用指标,而是开始为电力、边缘计算等关键垂直行业,量身打造专用的、与行业SLA强相关的测量体系。
- 从连接质量到服务可用性: 测量的焦点,从底层的无线信号质量(RSRP/CQI),上升到了端到端的服务可用性。对于NSOEU,是“一分钟都不能断”的小区可用性;对于ECS/EES,是“一次都不能错”的应用发现与注册成功率。
- 为“高可靠”和“高智能”提供量化标尺:
- NSOEU的系列测量,通过对中断事件的精确度量,为智能电网追求的“5个9”甚至“6个9”的极致可靠性,提供了标准化的考核依据。
- ECS/EES的系列测量,通过对边缘生态系统中“应用上架”、“用户注册”、“服务发现”等关键流程的监控,为MEC边缘智能的落地和性能保障,提供了完整的诊断工具链。
这不仅仅是测量项的增加,更是3GPP标准体系从一个纯粹的通信技术标准,向一个深度融合、赋能千行百业的“数字底座”标准演进的有力证明。
FAQ 环节
Q1:NSOEU测量和我们之前学的RRC连接掉线、DRB掉线有什么关系? A1:它们是从宏观和微观两个不同层面来衡量网络可靠性。RRC掉线、DRB掉线等,是微观的、基于单次连接事件的统计,它们告诉你“有多少次通话/数据会话中断了”。而NSOEU的小区可用性测量,是宏观的、基于时间的统计,它告诉你“在一年中,有多长时间小区是完全无法提供服务的”。对于电网等行业,他们更关心宏观的可用性,因为即使单次连接掉线率很低,但如果基站因为断电、传输中断等原因整个“瘫痪”了5分钟,那带来的影响是灾难性的。
Q2:Cell Availability这个指标,它的统计数据来源是什么?
A2:根据规范描述,Cell Availability的计算基础是gNB-DU上报给gNB-CU的“Service Status”(服务状态)。这个状态的改变,通常与OAM(操作维护管理)系统的操作有关。例如,当一个DU下的某个小区因为硬件故障、传输中断或人为闭站时,它的operationalState会变为disabled,administrativeState可能变为locked,这些状态最终会映射为“Out-Of-Service”。这个测量实际上统计的是小区从管理层面的可用时间,而不是无线信号的瞬时好坏。
Q3:ECS和EES在边缘计算架构中具体是什么角色? A3:可以做一个简单的类比。EES(Edge Enabler Server) 就像一个“区域应用商店”,它部署在网络边缘,负责管理该区域内所有可用的边缘应用(EAS)的列表、能力和状态。开发者需要将他们的应用在EES上“上架”(注册)。ECS(Edge Computing Support Function) 则更像是核心网里的“边缘服务总调度”。当一个用户(通过PCF)被策略允许使用边缘服务时,ECS会负责协调AMF、SMF和EES,为用户找到最合适的EES,并触发后续的服务发现和流量路由策略的下发。
Q4:为什么ECS/EES的测量大部分是请求数和成功数,而没有像无线侧那样复杂的时延、吞吐率测量?
A4:因为ECS/EES主要处理的是控制面/管理面的信令流程,其核心性能是流程的成功率和可靠性。例如,应用能否成功注册、用户能否成功发现服务,这些是“0或1”的问题,因此用请求/成功数来衡量最为直接。而边缘业务的数据面性能(时延、吞-吐率),则是由数据路径上的各个网元(UE, gNB, 边缘UPF, EAS)共同决定的,它们的性能由我们之前学过的Packet Delay、UE Throughput、N3/N6接口测量等一系列数据面指标来综合衡量。
Q5:学习这些行业专网测量,对一个普通的网络优化工程师有什么意义? A5:意义深远。它标志着网优工程师的角色转型。在未来,你面对的可能不再仅仅是抱怨“上网慢”的普通手机用户,而可能是要求“绝对不能断”的电网公司,或是要求“时延必须低于5毫秒”的汽车制造商。理解这些行业的需求,并懂得如何通过5.1.4, 5.1.14等专用测量项,去量化和保障他们的SLA,将是你从一个“通用网络工程师”成长为“行业解决方案专家”的关键一步。这不仅是技术的提升,更是价值的跃迁。