好的,我们继续进行系列的下一篇深度解读。
深度解析 3GPP TS 28.552:5.12 SMSF Measurements (5G时代的“短信新篇章”)
本文技术原理深度参考了3GPP TS 28.552 V18.10.0 (2025-03) Release 18规范中,关于“5.12 Performance measurements for SMSF”的核心章节,旨在为读者提供一个关于5G网络如何承载和管理短信业务(SMS over NAS)的性能测量全景解析。
引言:验证码短信的“最后一秒”使命
“王哥,快看这个工单!”小林拿着一份紧急工单找到老王,“‘未来银行’App反映,他们有大量用户在昨晚的高峰期,无法收到登录和交易的5G短信验证码,导致用户无法操作,投诉量激增。他们要求我们立刻给出解释!”
老王看了一眼工单,神情严肃:“短信验证码,这是典型的A2P(Application-to-Person)短信,是现代数字生活的‘身份认证’基石。虽然我们现在都用即时通讯App聊天了,但短信,特别是这种承载着‘信任’和‘安全’的行业短信,其可靠性和实时性,比任何时候都重要。”
“在5G时代,短信的承载方式发生了根本性的变化,”老王解释道,“它不再依赖于传统的电路域,而是以一种更高效、更融合的方式,通过NAS (Non-Access Stratum) 信令来传输。负责管理这一切的,就是5G核心网中一个专门的网元——SMSF (SMS Function)。”
他将TS 28.552的屏幕切换到5.12节。“这一节,‘Performance measurements for SMSF’,就是我们为5G短信服务量身打造的‘质量检测报告’。它监控着每一条短信,从‘注册’、‘发送’到‘接收’的全生命周期。‘未来银行’的这次事故,我们就要通过这些测量项,来还原案发现场,看看问题到底出在了哪个环节。”
这篇文章,我们将化身为“5G短信侦探”,通过分析SMSF的性能测量,深入了解SMS over NAS的运作机制,并侦破“消失的验证码”之谜。
1. “短信通行证”的申请与审批:Registration procedure (5.12.3)
在5G网络中,一个UE想要收发短信,首先需要向网络“表明身份”,声明自己具备SMS over NAS的能力,并获得网络的许可。这个过程由AMF和SMSF协同完成。
5.12.3.1
Number of registration requests(SMSF.ActivateReq.SNSSAI) c) SMSF receives the registration (PUT) operation request sent by AMF for the ” /ue-contexts/{supi}” resource URL…
5.12.3.2
Number of successful registrations(SMSF.ActivateSucc.SNSSAI) c) SMSF returns “201 Created” or “204 No Content” response message…
5.12.3.3
Number of de-registration requests(SMSF.DeactivateReq.SNSSAI) 5.12.3.4Number of successful de-registrations(SMSF.DeactivateSucc.SNSSAI)
1.1 深度解析
这组测量SMSF.Activate... 和 SMSF.Deactivate... 监控的是UE短信服务的激活与去激活流程。
-
激活流程 (
Activate): 当UE在注册(Registration)过程中,向AMF表明自己支持“SMS over NAS”时,AMF会向SMSF发起一次PUT请求,为该UE在SMSF上创建一个上下文,相当于为它办理一张“短信通行证”。Req(请求数): 统计SMSF收到了多少次办理“通行证”的请求。Succ(成功数): 统计SMSF成功创建上下文,并返回成功响应的次数。 短信服务激活成功率 = Succ / Req,是衡量一个网络中有多少比例的用户能够使用5G短信服务的基础KPI。
-
去激活流程 (
Deactivate): 当UE去注册(Deregistration)时,AMF会向SMSF发起DELETE请求,注销该UE的“短信通行证”。这组测量用于监控资源回收的效率。 -
按S-NSSAI细分: 这些测量支持按S-NSSAI细分。这在某些场景下很有用,例如,一个物联网切片可能被策略设定为不允许使用短信功能,通过这个子计数器就可以验证该策略是否被正确执行。
1.2 场景化应用:评估短信服务的用户覆盖面
通过SMSF.ActivateSucc的总数,运营商可以了解到,在自己的5G网络中,总共有多少用户成功激活了SMS over NAS功能。这个数据是评估5G短信服务用户渗透率的基础。如果这个数字远低于注册用户总数,可能意味着大量存量终端不支持SMS over NAS,或者网络侧的配置存在问题。
2. 从手机到世界:MO SMS Delivery (5.12.1)
MO-SMS (Mobile Originated SMS),即手机发送短信,是用户主动发起通信的过程。
5.12.1.1
Number of MO SMS delivery procedure requests(SMSF.MoReq.SNSSAI) c) SMSF receives the MO SMS delivery procedure (POST) operation request sent by AMF…
5.12.1.2
Number of successful MO SMS delivery procedures(SMSF.MoSucc.SNSSAI) c) SMSF returns “200 OK” response message…
2.1 深度解析
这组测量SMSF.Mo...监控的是上行短信的处理流程。
- UE → AMF: UE将短信内容封装在一条
NAS TRANSPORT消息中,发送给AMF。 - AMF → SMSF (
Req触发点): AMF收到后,将这条NAS消息通过一次HTTPPOST请求,转发给SMSF。SMSF收到这个POST请求时,SMSF.MoReq计数器加1。 - SMSF → SMS-GMSC: SMSF解析出短信内容后,将其递交给传统的短信网关(SMS-GMSC),由后者完成后续的转发。
- SMSF → AMF (
Succ触发点): SMSF在成功将短信递交给短信网关后,会向AMF回复一个200 OK的HTTP响应。AMF收到这个响应,就代表流程在5G核心网内部处理成功(注意:这不代表短信最终送达了接收方手机)。此时,SMSF.MoSucc计数器加1。
MO-SMS成功率 = Succ / Req,衡量的是5G核心网(AMF+SMSF)处理上行短信的能力。
3. 从世界到手机:MT SMS Delivery (5.12.2) & “验证码”迷案的侦破
MT-SMS (Mobile Terminated SMS),即手机接收短信,是验证码、通知类短信的核心流程,也是这次“未来银行”事故的“案发现场”。
5.12.2.1
Number of MT SMS delivery procedure requests(SMSF.MtReq.SNSSAI) c) SMSF receives “Forward MT SM” … from SC/SMS-GMSC.
5.12.2.2
Number of successful MT SMS delivery procedures(SMSF.MtSucc.SNSSAI) c) SMSF returns ” Delivery Rpt ” message … to SC/SMS-GMSC.
3.1 深度解析
这组测量SMSF.Mt...监控的是下行短信的处理流程。
- SC/SMS-GMSC → SMSF (
Req触发点): 当外部应用(如银行系统)通过短信网关(SC/SMS-GMSC)发送一条短信给5G用户时,短信网关会向该用户签约的SMSF发送一个Forward MT SM请求。SMSF收到这个请求时,SMSF.MtReq计数器加1。 - SMSF → AMF: SMSF向AMF发起寻呼,或直接下发NAS消息,请求AMF将短信内容递交给UE。
- UE → AMF → SMSF: UE成功收到短信后,会向AMF回复一个确认,AMF再将这个确认信息通知给SMSF。
- SMSF → SC/SMS-GMSC (
Succ触发点): SMSF在收到了来自UE侧的成功接收确认后,会向最初的短信网关回复一个“Delivery Report”(投递报告),告知“短信已成功送达”。这个动作触发SMSF.MtSucc计数器加1。
MT-SMS成功率 = Succ / Req,衡量的是从短信进入5G核心网,到最终被用户手机确认接收的端到端成功率。
3.2 场景化诊断:“消失的验证码”
小林立刻调出了昨晚高峰时段SMSF的性能数据,真相浮出水面。
SMSF.MtReq(MT请求数): 在20:00-20:05之间,有高达10,000次的MT-SMS请求涌入SMSF,远超平时。SMSF.MtSucc(MT成功数): 成功数只有6,000次。- MT-SMS成功率: 只有60%!
“王哥,问题出在MT流程上!高达40%的验证码短信,在核心网内部就‘蒸发’了!”小林找到了方向。
“很好。现在,我们需要知道,这4000次失败,是卡在了哪个环节?”老王引导道,“是SMSF处理不过来?还是AMF找不到用户?或是空口寻呼失败了?”
虽然SMSF.MtFail(规范中未直接定义,但可由Req-Succ得出)没有按cause细分,但通过关联分析,小林发现,在同一时间段,AMF上报的MM.Paging5GSucc(5G寻呼成功率)指标也出现了大幅下滑。
最终结论:
“王哥,我推断是这样,”小林在白板上画出了故障链,“1. 银行在高峰期发起了海量验证码,导致MT-SMS请求激增。2. 大量请求在同一时间涌向AMF,要求对处于Idle/Inactive状态的用户进行寻呼。3. AMF发起的寻呼在无线侧(可能是PDCCH或寻呼信道拥塞)发生了大量的失败。4. 由于寻呼失败,AMF无法将短信送达UE,因此也无法向SMSF返回成功确认。5. SMSF迟迟等不到UE的确认,最终判定这些MT-SMS流程超时失败,没有向短信网关回复Delivery Report。最终,体现在SMSF.MtSucc计数上不去,成功率暴跌。”
洞察: SMSF的测量,就像是整条短信收发链路的“总票房”统计。它本身可能无法告诉你失败的具体原因,但它能以极高的精度,告诉你“问题发生了”,并指明了调查的方向(MO还是MT)。通过将其与AMF的寻呼测量、gNB的RACH测量等其他指标进行关联分析,就能构建起一个完整的故障诊断链条。
结论:短信虽老,使命弥新
通过对“消失的验证码”案件的侦破,我们看到,即使在5G这个以数据业务为主的时代,对短信这一“古老”业务的精细化性能监控,依然具有不可替代的价值。
- 激活流程测量 (
Activate):评估了5G短信服务的用户基础和渗透率。 - MO流程测量 (
MoReq/MoSucc):监控了用户上行短信在核心网的处理能力。 - MT流程测量 (
MtReq/MtSucc):监控了用户下行短信的端到端送达成功率,是保障行业短信(如验证码、告警通知)SLA的“生命线”指标。
SMSF的这套测量体系,虽然简洁,但却完整地覆盖了SMS over NAS的“注册-上行-下行”三大核心场景。它确保了这条承载着“信任”与“安全”的信道,在5G时代能够继续以一种更可靠、更高效的方式,完成它的“最后一秒”使命。
FAQ 环节
Q1:5G中的SMS over NAS和4G中的SMS over SGs/IMS有什么区别? A1:主要区别在于承载方式和网络架构。SMS over SGs是4G初期的一种过渡方案,UE在LTE网络下,通过SGs接口“借用”传统2G/3G的电路域(CS)来收发短信。SMS over IMS则是将短信封装成SIP消息,通过IMS(IP多媒体子系统)来传输,是VoLTE下的主流方案。而SMS over NAS是5G的原生方案,它将短信直接封装在核心的NAS(非接入层)信令中,通过AMF和SMSF进行传输,无需依赖CS域或庞大的IMS系统。这种方式更轻量、更高效,与5G的SBA架构结合更紧密。
Q2:SMSF.MoSucc(MO成功)和SMSF.MtSucc(MT成功)的“成功”标准有什么不同?
A2:成功标准有本质的不同。SMSF.MoSucc的成功,仅代表SMSF成功地将上行短信递交给了下一跳的短信网关(SMS-GMSC)。它是一个网络内部的成功标志,并不保证接收方手机最终能收到短信。而**SMSF.MtSucc的成功**,则要求SMSF必须收到来自UE侧的最终确认,表明用户手机已经成功接收到短信。因此,MtSucc是一个端到端(从5GC到UE)的成功标志,更能反映用户的真实体验。
Q3:为什么SMSF.ActivateReq.SNSSAI要按S-NSSAI细分?切片和短信有什么关系?
A3:这主要是为了实现对特定网络切片的策略控制和行为审计。在某些场景下,运营商或行业客户可能不希望某个切片下的UE(特别是物联网终端)能够收发短信,以节约资源或出于安全考虑。通过将短信激活请求按S-NSSAI细分,运维人员可以验证这个策略是否生效。例如,如果发现“物联网切片”的SMSF.ActivateReq计数不为零,就说明可能存在配置漏洞,允许了不该使用短信的终端激活了该功能。
Q4:如果MT-SMS成功率低,除了寻呼失败,还可能有哪些原因? A4:MT-SMS成功率低是一个综合性问题,除了寻呼失败,还可能包括:1)SMSF自身过载: 短信洪峰导致SMSF处理不过来,请求超时。2)AMF-SMSF接口问题: 两者之间的N17接口(如果存在)或服务化接口通信异常。3)UE侧问题: UE处于覆盖盲区、关机、或其NAS层出现软件故障,无法响应AMF的下行NAS传输。4) UDM/UDR问题: SMSF在处理MT-SMS时,可能需要查询UDM获取用户的路由信息或服务权限,如果UDM响应超时或返回错误,也会导致失败。需要多网元指标的关联分析来定界。
Q5:这些SMSF测量项的数据,对银行等行业客户有价值吗?
A5:非常有价值。虽然这些是网络内部的性能测量,但运营商可以将它们加工成面向行业客户的服务质量报告。例如,运营商可以向“未来银行”提供一份报告,清晰地展示:“贵公司在昨晚20:00-20:05期间,总共向我网用户发起了10,000次短信请求(SMSF.MtReq),由于当时发生了XXX原因(如无线寻呼拥塞),最终成功送达6,000次(SMSF.MtSucc),端到端送达率为60%。经过我方优化后,目前成功率已恢复到99.9%。” 这种透明、有数据支撑的报告,是建立和维护运营商与垂直行业客户之间信任关系的关键。