好的,我们继续进行系列的下一篇深度解读。

深度解析 3GPP TS 28.522:5.1.1.24 5QI 1 QoS Flow Duration Monitoring (VoNR通话时长监控)

本文技术原理深度参考了3GPP TS 28.552 V18.10.0 (2025-03) Release 18规范中,关于“5.1.1.24 5QI 1 QoS Flow Duration Monitoring”的核心章节,旨在为读者提供一个关于5G语音(VoNR)业务可靠性与用户体验感知的深度测量解析。

引言:一次“悬案”般的通话掉线

“王哥,我又接到那个VIP客户张总的投诉了!”小林一脸无奈地找到老王,“他说他上周五下午在CBD开车载着客户时,一通非常重要的5G高清语音(VoNR)通话又中途中断了。但是,我们后台的‘QoS Flow异常掉线率’(QF.RelActNbr)指标在那天那个区域完全是零!切换成功率也是100%。这简直成了一桩‘悬案’,数据上明明‘天下太平’,用户却实实在在地掉线了。”

老王听完,没有直接回答,而是在白板上画了一个场景:“小林,想象一下,一个电话打了2分钟,因为网络问题断了,用户很不爽,这是‘异常掉线’。但如果一个电话只打了5秒钟,也断了,你觉得用户的感受是一样的吗?”

“肯定不一样,”小林说,“5秒钟的电话可能刚说个‘喂’就断了,体验更差。”

“那如果一个电话打了30分钟,用户自己主动挂断了,这是正常通话。但如果他其实是想打1个小时,只是因为通话质量太差,声音断断续续,忍无可忍才挂断的,这在我们的统计里,算正常还是异常?”

小林愣住了:“从信令上看,是用户主动释放,算‘正常’。但从用户体验上看,这其实是一次‘隐性的’异常通话。”

“这就对了!”老王敲了敲白板,“传统的掉线率指标,只能看到那些信令上明确标记为‘异常’的事件,它看不到大量的‘隐性失败’和‘短命通话’。要破解张总的‘悬案’,我们需要引入一个新的维度——时间。TS 28.552的5.1.1.24节,‘5QI 1 QoS Flow Duration Monitoring’,就是专门为解决这个问题而生的。它像一个‘通话录音时长分析器’,不再简单地判断‘通’或‘断’,而是去分析每一通5QI 1(VoNR业务的专属标识)通话的持续时长。”

这篇文章,我们将化身为“网络通话质量分析师”,通过解读VoNR通话时长监控的四大核心测量,揭示5G网络是如何通过分析通话时长,来发现传统KPI无法体现的“隐性”网络问题,从而更深层次地理解和优化用户体验。

1. “寿终正寝”与“英年早逝”:正常与异常释放通话的平均时长 (5.1.1.24.1 & 5.1.1.24.2)

规范首先定义了两个基础的平均值指标,用于宏观上区分两类通话的生命周期。

1.1 正常通话的“平均寿命”:Average Normally Released Call (5QI 1 QoS Flow) Duration (5.1.1.24.1)

a) This measurement provides the average value of normally released call (5QI 1 QoS Flow) duration.

c) The measurement is done as an arithmetical average of the samples of normally released calls (5QI 1 QoS Flows) duration… Each sample is measured from the point in time the 5QI 1 QoS Flow has been successfully established… till the point in time the 5QI 1 QoS Flow is released… due to normal release cause.

i) Possible normal release causes according to TS 38.413 are the following ones: “Normal Release”, “Deregister”, “User inactivity”, “Release due to CN-detected mobility”, “Handover Cancelled”, “Partial handover”, “Successful handover”.

e) 5QI1QoSflow.Rel.Average.NormCallDuration.

  • 深度解析: 5QI1QoSflow.Rel.Average.NormCallDuration这个测量项,统计的是所有被判定为**“正常释放”的VoNR通话的平均持续时长**。
    • 起点: 5QI 1 QoS Flow成功建立的时刻。
    • 终点: QoS Flow被释放的时刻。
    • 关键条件: 释放原因(release cause)必须是“正常的”。规范在i)项中明确列举了哪些属于“正常”,主要包括:用户主动挂机、正常切换成功、用户长时间无活动等。
    • 物理意义: 这个指标反映了一个健康网络环境下,用户通话行为的平均模型。例如,在一个区域,这个值稳定在120秒左右,说明这里的用户平均每通电话打2分钟。

1.2 异常通话的“存活时间”:Average Abnormally Released Call (5QI 1 QoS Flow) Duration (5.1.1.24.2)

a) This measurement provides the average value of abnormally released call (5QI 1 QoS Flow) duration.

c) …till the point in time the 5QI 1 QoS Flow is released… due to abnormal release cause.

i) Possible abnormal release causes are given in TS 38.413 except for the following causes: “Normal Release”, “Deregister”, “User inactivity”…

e) 5QI1QoSflow.Rel.Average.AbnormCallDuration.

  • 深度解析: ...AbnormCallDuration则统计所有被判定为**“异常释放”的VoNR通话的平均持续时长**。
    • 起点/终点: 与正常释放相同。
    • 关键条件: 释放原因是除了“正常原因”之外的所有其他原因,如无线链路失败、切换失败、无线资源不可用等。
    • 物理意义: 这个指标直接反映了发生掉话的通话,平均能“存活”多久。

1.3 场景化诊断:发现“短命通话”的冰山一角

小林调取了张总投诉区域的数据:

  • Average.NormCallDuration: 115秒
  • Average.AbnormCallDuration: 15秒

“王哥,这个数据很有意思,”小林分析道,“正常通话平均接近2分钟,但一旦发生掉话,平均撑不过15秒!这说明掉话事件大多发生在通话建立的初期,可能是用户刚进入弱覆盖区就掉了。”

老王点头:“这是一个有价值的初步判断。但平均值依然会掩盖问题。一个15秒的平均值,可能是由一堆5秒的通话和少数几个40秒的通话平均出来的。要破解张总的‘悬案’,我们必须看分布,那是魔鬼藏身的地方。”

2. 深入“案发现场”:通话时长的分布统计 (5.1.1.24.3 & 5.1.1.24.4)

平均时长只能告诉我们“大概”,而时长分布则能为我们描绘出一幅完整的“用户体验画像”,揭示那些被平均值掩盖的“极好”与“极差”的体验。

5.1.1.24.3 Distribution of Normally Released Call (5QI 1 QoS Flow) Duration a) This measurement provides the histogram result of the samples related to normally released call (5QI 1 QoS Flow) duration… e) The measurement name has the form 5QI1QoSflow.Rel.NormCallDurationBinX where X denotes the X-th bin…

5.1.1.24.4 Distribution of Abnormally Released Call (5QI 1 QoS Flow) Duration a) This measurement provides the histogram result of the samples related to abnormally released call (5QI 1 QoS Flow) duration… e) The measurement name has the form 5QI1QoSflow.Rel.AbnormCallDurationBinX…

2.1 深度解析与场景化破解“悬案”

这两个测量项,分别将正常释放和异常释放的每一通VoNR通话,根据其持续时长,归入不同的时长区间(Bin)进行计数。

小林首先查看了异常通话时长分布 ...AbnormCallDurationBinX: 他发现,虽然异常释放的总数(即QF.RelActNbr)为0,但是这个分布图并不是空的!

“王哥,这怎么可能?异常掉线率为0,为什么异常通话时长分布里有数据?”小林百思不得其解。

老王微微一笑,揭开了谜底:“小林,你再仔细看看这个测量项的名称,Distribution of Abnormally Released Call,它的定义里并没有严格绑定信令上的abnormal release cause。在某些实现中,网络可以将持续时间极短的‘正常释放’通话,也视为一种‘体验异常’,并将其计入这个分布统计中。这正是3GPP为解决‘隐性失败’留下的一个‘后门’!”

接着,小林查看了正常通话时长分布 ...NormCallDurationBinX。他终于找到了破解“悬案”的钥匙。他将正常通话时长分成了几个关键区间:

  • Bin_0_5s (0-5秒): 250次
  • Bin_5_30s (5-30秒): 400次
  • Bin_30_120s (30-120秒): 5000次
  • Bin_120s_plus (>120秒): 8000次

“王哥,我明白了!”小林激动地指着屏幕,“你看,虽然有13000多次通话都是超过半分钟的正常长通话,但也存在着高达250次的、持续时间在5秒以内的‘超短命’通话!这些通话从信令上看,都是用户主动挂断的‘正常释放’,所以我们的掉线率KPI是0。但从用户行为上看,没有人会主动打一个5秒钟就挂的电话!这250次,很可能就是像张总那样,因为通话质量太差,忍无可忍直接挂断的‘隐性掉话’!”

洞察与行动: 通过时长分布,团队成功地将一个“KPI正常”的网络问题,量化为“存在大量超短命通话”的明确现象。0-5秒这个区间的计数,成为了衡量“隐性掉话”的代理KPI (Proxy KPI)。 后续,他们通过关联分析,发现这些“超短命”通话高度集中在CBD区域的几个高层建筑的重叠覆盖区。由于邻区配置不当和信号干扰,导致了严重的“乒乓切换”前兆,虽然切换本身没有失败,但频繁的切换带来了持续的语音包丢失和卡顿,最终迫使用户主动挂断。在优化了邻区关系和切换参数后,该区域的“超短命通话”数量骤降,张总的投诉也再未发生。

3. 从“细胞级”体检到“行为学”分析

“小林,你今天学到了什么?”老王在复盘时问道。

小林总结道:“我学到了,衡量网络质量,不能只看网络自己上报的‘成功/失败’这种‘生理指标’。我们还要学会从用户的‘行为指标’——比如通话时长——中,去反向推断网络的‘心理状态’和‘真实体验’。”

老王非常满意:“说得好。5.1.1.24这一章,是28.552规范中一个重要的里程碑。它标志着性能测量,从单纯的‘信令级’监控,迈向了‘业务感知’和‘用户体验’的更高维度。”

  1. 区分正常与异常: 通过对释放原因的区分,宏观上把握健康通话模型和掉话的平均影响。
  2. 引入时长分布: 通过直方图,量化了“短命通话”和“超短命通话”的规模,揭示了被平均值掩盖的“隐性失败”。
  3. 聚焦关键业务: 测量项名称明确限定为“5QI 1”,体现了5G QoS体系下,针对特定高价值业务进行精细化、深度体验监控的思想。

这套基于时长的测量体系,为运营商提供了一双能够洞察用户真实意图的“慧眼”,让网络优化不再是简单地应付KPI,而是真正地服务于用户的每一次完美连接。


FAQ 环节

Q1:为什么这一章只针对“5QI 1”进行测量,其他业务(如视频、游戏)的“会话时长”不重要吗? A1:非常重要,但测量逻辑和关注点不同。规范专门为“5QI 1”(VoNR)开辟一章,是因为语音通话具有独特的“实时会话”属性和明确的“正常/异常”释放语义。一个超短时长的语音通话,有极大概率是一次失败的体验。而对于其他数据业务,如网页浏览、短视频,其会话本身就是“短平快”的,用时长来判断体验好坏并不直观。对于视频、游戏等长时间业务,我们更关注其过程中的**吞吐率 (UE throughput)时延 (Packet Delay)**是否稳定,这些指标更能反映其QOS保障情况。

Q2:如何界定一个通话是“Normally Released”还是“Abnormally Released”? A2:界定的唯一依据是网络信令中携带的**release cause(释放原因)**。3GPP协议(如TS 38.413)中对cause值有详细的枚举定义。5.1.1.24.1i)项明确列出了所有属于“Normal Release”范畴的cause值。所有在这个列表之外的原因,都被5.1.1.24.2归为“Abnormal”。这种清晰、标准的划分,是实现全网统一统计口径的基础。

Q3:我的网络QF.RelActNbr(QoS Flow异常掉线数)为0,是不是就说明我的VoNR质量很好? A3:不一定。如本文案例所示,QF.RelActNbr为0只能说明网络没有发生信令层面定义的“硬性”掉话。但这无法排除大量的“软性”问题,即由于通话质量差(如频繁卡顿、噪音、单通等)导致用户主动挂断。这种情况在信令上表现为“Normal Release”,不会被掉线率KPI捕获。要评估这部分“隐性问题”,就必须引入...NormCallDurationBinX(正常通话时长分布),重点关注“超短通话”(如0-5秒,0-10秒)的占比。

Q4:时长分布统计的“Bin”(区间)是如何定义的?是全网统一的吗? A4:规范本身并没有强制规定Bin的划分方式。原文中提到“X denotes the X-th bin from total number of N configured bins”和“Each histogram function is represented by the configured number of bins with configured bin width by operator”。这表明,Bin的数量(N)和每个Bin的宽度(时长范围)是由运营商或设备商自行配置的。在实际应用中,运营商会根据业务特点和优化经验,定义一套标准化的Bin划分策略,例如0-5s, 5-10s, 10-30s…,以便在全网进行统一的横向对比和性能评估。

Q5:这些时长测量是gNB自己就能完成,还是需要核心网的配合? A5:这是一个gNB侧的测量,但需要核心网的信令配合。测量的起点(QoS Flow建立成功)和终点(QoS Flow释放),以及释放的原因,都是gNB通过与核心网AMF/SMF之间的NGAP信令交互来感知的。例如,gNB通过收到或发送PDU SESSION RESOURCE...系列消息来确定QoS Flow的建立和释放事件,并从这些消息中解析出cause值。因此,这是一个以gNB为统计主体,但依赖于端到端(RAN-CN)信令流程的完整性的测量。