深度解析 3GPP TS 23.527:6.8 漫游风暴中的自愈术 (Home Routed会话恢复)
本文技术原理深度参考了3GPP TS 23.527 V18.5.0 (2024-09) Release 18规范中,关于“6.8 Restoration Procedures for Home Routed PDU Sessions or PDU sessions with an I-SMF”的核心章节,旨在为读者揭示在复杂的漫游或多SMF场景下,5G网络如何通过一套精密的协同机制,实现对关键控制节点故障的无感恢复。
前言:当你的“本地向导”与“大本营”失联
我们的老朋友,“美美”,一位热爱旅行的5G用户,正身处异国他乡,享受着“Visited Mobile”网络提供的无缝漫游服务。她正在进行一场高清视频通话,向家人分享美丽的风景。这个看似简单的场景,背后却是一条横跨两大运营商的复杂数据链路。
为了保证美美的业务策略和计费仍然由她的归属运营商“Home Telecom”控制,她的PDU会话采用了**Home Routed(归属地路由)模式。这意味着,在漫游网络中,有一个V-SMF(Visited SMF,拜访地SMF)作为她的“本地向导”,负责处理与本地AMF和UPF的交互;而在她的归属网络中,有一个H-SMF(Home SMF,归属地SMF)**作为“大本营”,是会话的最终锚点,掌握着所有核心策略。V-SMF与H-SMF之间,通过N16服务化接口紧密协作。
现在,一场“漫游风暴”正在酝酿:
- 风暴一:如果作为“本地向导”的V-SMF突然崩溃,远在千里之外的“大本营”H-SMF和本地的AMF该如何应对?美美的视频通话会立即中断吗?
- 风暴二:如果问题更严重,是远端的“大本营”H-SMF突然失联,“本地向导”V-SMF会陷入混乱吗?
这正是3GPP TS 23.527中第6.8章要解决的核心挑战。本文将深入这套“漫游风暴中的自愈术”,看看5G网络是如何通过一套基于“能力协商”的智能恢复机制,确保美美的跨国视频通话如丝般顺滑,不受底层网络动荡的影响。
1. “信任的握手”:恢复机制的通用准则 (基于TS 23.527 6.8.1)
在深入故障场景之前,我们必须先理解整个恢复机制的基石——一套在V-SMF、H-SMF和AMF之间建立的“信任握手”协议。这个握手的核心是两个在SupportedFeatures属性中定义的特性旗标。
6.8.1 General During a PDU session establishment and update procedure, the V/I-SMF or the (H-)SMF shall:
- set the “Peer NF SET based Reselection”(PSETR) feature bit… if it supports the (re)selection of an alternative peer SMF…
- set the “Deployed Local SMF Set” (DLSET) feature bit… if the PDU session resource is not bound exclusively to the specific… NF service instance, i.e. if there is at least one alternative SMF service instance… that can take it over…
这两个旗标是整个恢复逻辑的“开关”:
-
DLSET (Deployed Local SMF Set):这个旗标代表了自身的高可用能力。当一个SMF(比如V-SMF)在建立会话时设置了
DLSET=1,它等于在向伙伴宣告:“请放心,我不是一个人在战斗,我隶属于一个高可用的SMF Set。如果我倒下了,我的兄弟们可以无缝接管我的工作。” -
PSETR (Peer NF SET based Reselection):这个旗标代表了对伙伴故障的恢复能力。当一个SMF(比如H-SMF)设置了
PSETR=1,它等于在向对方承诺:“如果你和你的兄弟们(一个SMF Set)出了问题,我具备足够的智能,能够从你的Set中重新选择一个健康的成员来继续合作。”
信任链的传递
在美美的PDU会话建立过程中,这条信任链是这样传递的:
- V-SMF和H-SMF在彼此的N16接口交互中,互相通告自己的
PSETR和DLSET能力。 - V-SMF在与AMF的N11接口交互中,不仅要告诉AMF自己是否支持
DLSET,还必须将H-SMF是否支持PSETR的信息(通过anchorSmfPsetrSupportInd字段)传递给AMF。
为什么AMF必须知道这一切?因为AMF是UE接入和移动性的总控,当风暴来临时,它需要根据手中掌握的V-SMF和H-SMF的能力情报,做出最终的、正确的决策——是尝试无缝恢复,还是只能遗憾地通知美美“连接已断开”。
2. “本地向导”消失:V-SMF故障恢复 (基于TS 23.527 6.8.2)
风暴场景:美美正在视频通话,位于漫游地的V-SMF突然崩溃。
检测方:H-SMF(通过N16服务接口调用超时)和AMF(通过N11服务接口调用超时)会几乎同时或先后检测到V-SMF失联。它们的后续动作,完全取决于之前“信任握手”的结果。
When the H-SMF detects the failure of the V-SMF… When the AMF detects the failure of the V-SMF…
让我们来分析不同能力组合下的恢复策略:
情况一:理想世界 (H-SMF支持PSETR, V-SMF支持DLSET)
这是最高级别的可靠性保障。
- AMF的决策:AMF知道V-SMF隶属于一个Set (
DLSET=1),并且H-SMF有能力处理对端重选 (PSETR=1)。因此,AMF会保持PDU会话,并立即向NRF查询,从V-SMF所在的Set中寻找一个新的、健康的V-SMF实例(比如V-SMF-Beta)。 - H-SMF的决策:H-SMF同样知道V-SMF有备份,并且自己有能力重选。它也会保持PDU会话,并准备好与AMF选出的新V-SMF-Beta进行对接。
- 结果:AMF将美美的会话上下文(UE与核心网的信令连接)切换到新的V-SMF-Beta。V-SMF-Beta利用其Set共享的会话信息,与H-SMF和本地UPF重建关联。整个过程对美美完全透明,视频通话可能只是出现了微不足道的、几乎无法感知的瞬间抖动。
情况二:“本地向导”孤军奋战 (V-SMF不支持DLSET)
V-SMF是一个独立的节点,没有备份。
- AMF和H-SMF的决策:无论H-SMF多有能力(
PSETR=1),它都找不到一个可以重选的备用V-SMF。因此,唯一的选择就是释放PDU会话。 - 结果:AMF会清理会话,并可能通过NAS信令通知美美的终端,PDU会话已被释放。她的视频通话中断,需要手机自动或手动重新发起数据连接。
情况三:其他组合情况
如果H-SMF不支持PSETR,即使V-SMF有备份,H-SMF也无法智能地处理切换,它会单方面地认为会话已死并进行清理,最终同样导致会话释放。
结论:在V-SMF故障场景下,能否实现无感恢复,同时取决于V-SMF自身的冗余部署(DLSET)和H-SMF的智能重选能力(PSETR)。
3. “大本营”坍塌:H-SMF故障恢复 (基于TS 23.527 6.8.3)
风暴场景:位于归属网络的H-SMF突然崩溃。
检测方:V-SMF(通过N16服务接口调用超时)。它的决策逻辑与上述场景对称。
When the V-SMF detects the failure of the H-SMF, it shall retrieve all PDU sessions associated with the failed H-SMF and perform the following procedure…
情况一:理想世界 (V-SMF支持PSETR, H-SMF支持DLSET)
- V-SMF的决策:V-SMF检测到H-SMF失联,但它从之前的“握手”中得知,H-SMF隶属于一个Set (
DLSET=1),并且自己具备重选能力 (PSETR=1)。因此,V-SMF会保持PDU会话,并向NRF查询,从H-SMF所在的Set中寻找一个新的、健康的H-SMF实例(比如H-SMF-Zeta)。 - 结果:V-SMF成功地将N16接口的对端切换到了H-SMF-Zeta。由于H-SMF Set内部共享会话数据,H-SMF-Zeta能够无缝接管,继续为美美的会话提供策略和计费控制。整个过程对美美完全透明。
情况二:“本地向导”能力不足 (V-SMF不支持PSETR)
即使H-SMF有备份,但V-SMF没有能力去发现和切换到备份上。
- V-SMF的决策:V-SMF发现“大本营”失联,并且自己束手无策。它只能认为会话已无法管理,因此会启动PDU会话释放流程,通知AMF和UE。
- 结果:美美的视频通话中断。
情况三:“大本营”孤军奋战 (H-SMF不支持DLSET)
H-SMF是一个独立的节点。
- V-SMF的决策:无论V-SMF多么智能(
PSETR=1),它都找不到一个可以重选的备用H-SMF。唯一的选择是释放PDU会话。 - 结果:美美的视频通话中断。
结论:在H-SMF故障场景下,能否实现无感恢复,同时取决于H-SMF自身的冗余部署(DLSET)和V-SMF的智能重选能力(PSETR)。
4. 总结
5G核心网针对漫游和多SMF场景的恢复机制,是一场由AMF、V-SMF和H-SMF共同参与的、基于能力协商的精准舞蹈。它不再是简单的故障检测和重启,而是进化为一套智能的、有状态的恢复决策系统。
- 能力是前提:
DLSET(自身冗余)和PSETR(对端重选能力)这两个特性旗标,是实现无缝恢复的入场券。任何一方能力的缺失,都可能导致恢复“降级”为简单的会话释放。 - 协同是关键:故障恢复不再是单个网元的行为。它要求检测方(如AMF或V-SMF)和对端伙伴(如H-SMF)必须基于共同协商好的能力集,采取一致的行动(是“保持会话”还是“释放会话”),避免出现状态不一致的“脑裂”情况。
- AMF是最终裁决者:在V-SMF故障时,AMF作为最接近UE的控制节点,它掌握了最全的“情报”,并根据这些情报做出最终的恢复决策,体现了其在接入和会话联动中的核心地位。
对于正在享受无忧漫游的美美来说,她可能永远不会知道,在她进行视频通话的短短几分钟内,核心网的后台可能已经经历了一场甚至数场无声的风暴。正是这套精密、智能的自愈术,将网络的复杂性和不确定性在内部消化,最终呈现给用户的,是如磐石般稳固的连接体验。
FAQ
Q1:DLSET和PSETR这两个特性,是强制要求5G设备都支持吗?
A1:不完全是。3GPP规范中的很多高级特性,在初期都是作为“可选(Optional)”能力来定义的,这两个特性也不例外。但是,对于追求高可靠性、希望提供电信级(Carrier-Grade)服务的运营商和设备商来说,支持DLSET(通过部署NF Set)和PSETR是构建健壮网络的事实标准。不支持这些特性的网络,在面对SMF故障时,只能通过中断用户业务来恢复,这在很多场景下是不可接受的。
Q2:在V-SMF故障且成功恢复的场景中,AMF是如何找到一个新的V-SMF实例的?
A2:AMF会利用NRF的服务发现机制。因为它在会话建立时已经知道故障的V-SMF隶属于哪个NF Set。因此,它会向NRF发起一次NFDiscovery请求,请求的参数就是这个NF Set ID以及所需的服务名称(如Nsmf_PDUSession)。NRF会返回该Set中所有当前状态为“可用(Available)”的V-SMF实例列表,AMF再根据负载均衡等策略,从中选择一个作为新的服务实例。
Q3:I-SMF(Intermediate SMF)是什么?本章的恢复机制也适用于它吗?
A3:I-SMF通常用于非漫游场景,但PDU会话需要经过多个UPF,并且由不同的SMF控制。一个典型的例子是ULCL(Uplink Classifier,上行分类器)场景,数据流在网络边缘被一个I-UPF/I-SMF分流。此时,会话链就变成了 UE ->...-> I-SMF ->...-> SMF(Anchor)。这个架构与漫游场景的 V-SMF -> H-SMF 在逻辑上是等价的。因此,本章定义的DLSET和PSETR恢复机制完全适用于I-SMF场景。只需将V-SMF替换为I-SMF,H-SMF替换为作为锚点的SMF即可。
Q4:在恢复过程中,会话的计费信息会丢失吗?
A4:不会。这得益于NF Set的共享上下文机制。无论是V-SMF Set还是H-SMF Set,所有实例都连接到同一个高可用的后端数据库或状态存储。会话的计费信息作为上下文的一部分,被实时地记录在共享存储中。当一个新的SMF实例(如V-SMF-Beta)接管会话时,它会从共享存储中读取到最新的计fen信息,并在此基础上继续累加,从而保证了计费的准确性和连续性。
Q5:为什么AMF需要知道远端H-SMF的能力(anchorSmfPsetrSupportInd)?它只和V-SMF交互,关心V-SMF的能力不就行了吗?
A5:因为AMF需要对整个会话管理链的端到端可靠性有一个完整的评估。想象一下,如果V-SMF崩溃了,AMF知道V-SMF有备份(DLSET=1)并且自己也准备好去重选。但如果它不知道远端的H-SMF是否具备配合重选的能力(PSETR=0),那么AMF即使选出了新的V-SMF,这次切换也注定会失败,因为H-SMF会单方面释放会话。为了避免这种徒劳的尝试和潜在的状态不一致,AMF必须提前了解链路上所有关键角色的能力,以便做出一个全局最优、不会失败的恢复决策。