深度解析 3GPP TR 23.700-28:6.7 错峰的智慧 (不连续覆盖等待定时器)

本文技术原理深度参考了3GPP TR 23.700-28 V18.1.0 (2023-03) Release 18规范中,关于“第六章 Solutions”的 6.7 节 “Solution #7: Utilizing discontinuous coverage wait timer for satellite discontinuous coverage scenario” 的核心章节,旨在为读者深度剖析一种旨在解决“惊群效应”的、基于NAS层随机化接入的拥塞控制方案。

在前一篇文章中,我们见证了Solution 6如何通过“休眠契约”(Unreachability Period)的签订,在UE与网络之间建立起一种优雅而智能的“失联”默契。这份契约完美地管理了单个UE的休眠行为,并使能了网络侧精准的数据缓存。然而,当契约的有效期结束,当黎明的第一缕阳光(卫星信号)普照大地时,一个更为严峻的集体性挑战浮出水面——“惊群效应”。

成百上千个遵守着同一份“契约”的设备,在同一时刻被唤醒,如潮水般涌向网络,瞬间便能冲垮卫星那本就宝贵的接入资源。Solution 6虽然预知了这场“潮汐”,却并未提供疏导“潮水”的闸门。

这道“泄洪闸门”,正是我们今天要深入剖析的Solution #7——不连续覆盖等待定时器 (Discontinuous Coverage Wait Timer, DCW timer)。这个方案的核心思想,可以概括为四个字:“错峰接入”。它不再关注单个UE如何睡得更香,而是专注于教会成千上万个苏醒的UE,如何以一种文明、有序的方式,排队进入网络。

为了演绎这场“数字世界的交通疏导”,我们的场景将聚焦于“生态站阿尔法”所在的整片雨林区域。这片方圆数百公里的区域,由一颗先进的、具有波束驻留能力的LEO卫星提供服务。这意味着,整个区域内的所有设备——包括伊芙琳博士的GeoLink-1和她部署的上千个环境传感器——都将在同一时刻失去信号,又在同一时刻恢复信号。一场可预见的“数字交通大拥堵”,即将在每个覆盖窗口开启的瞬间上演。Solution 7将化身为一位智慧的“交通警察”,为我们展示疏导之道。


1. 核心哲学:从“同时唤醒”到“随机排队” (解读 6.7.1 Description)

Solution 7直面Key Issue 1b所描述的“信号雪崩”问题,其哲学根基在于引入**“随机化”**来打破“同时性”。

6.7.1 Description

This is a candidate solution for part of Key Issue #1 and Key Issue #2. For KI#1, the solution aims to solve the scenario when the UEs have to remain with no service until the coverage recovers… how to reduce the impact on the target system… Signalling overload will occur.

方案开宗明GINIA地指出了问题的根源:当大量处于同一地理区域的UE,在经历了一个共同的、确定的覆盖空窗期后,它们会在覆盖恢复的瞬间,不约而同地发起接入请求(如周期性注册更新、业务请求等),从而导致信令过载。

6.7.1 Description

This solution proposes to introduce a new timer, named discontinuous coverage wait (DCW) timer, to address both the signalling overload situation and the power saving situation…

为了解决这个问题,方案提出了一件全新的“武器”——DCW定时器。这个定时器有两个作用:一是解决信令过载(主要目标),二是在等待期间也能节省UE功耗(次要收益)。

1.1 DCW定时器的精妙构成

这个定时器的“总时长”,并非一个简单的随机值,而是一个由三部分构成的、经过精密设计的复合体。

DCW timer = (T2-T1) + DCW value (i.e. random value in DCW range) + offset (optional)

让我们逐一拆解这个公式,看看这位“交通警察”是如何设置“红绿灯”的:

  • 第一部分:(T2-T1) - 确定的“禁行”时段

    • T1是当前覆盖窗口结束的时间(信号消失)。
    • T2是下一次覆盖窗口开始的时间(信号恢复)。
    • (T2-T1)就是整个“覆盖空窗期”的确定时长。
    • 作用: 这是定时器的“基础时长”。它确保了在整个没有信号的期间,UE都处于“等待”状态,不会进行任何无效的接入尝试。
    • 伊芙琳的场景: 雨林中的所有传感器,通过接收卫星广播的星历,都计算出,从UTC时间14:00 (T1) 到 18:30 (T2),将有长达4.5小时的覆盖中断。那么,所有设备的DCW定时器的基础时长,都是这4.5小时。
  • 第二部分:DCW value - 随机的“通行”时延

    • DCW range:这是一个由网络(核心网AMF)配置并下发给UE的“随机范围”,例如 [0, 60 seconds]
    • DCW value:UE在收到这个范围后,自己生成的一个位于该范围内的随机数。
    • 作用: 这是实现“错峰接入”的核心机制。它将所有UE在T2时刻的“同时”接入行为,均匀地分散在了T2之后的DCW range这个时间窗口内。
    • 伊芙琳的场景: AMF在之前的注册流程中,已经告诉了雨林中的所有传感器:“你们的DCW range是[0, 60秒]”。当UTC时间18:30 (T2) 信号恢复的那一刻:
      • 伊芙琳的GeoLink-1,可能随机到了一个 DCW value = 12.5秒。
      • 旁边的一号温度传感器,随机到了 48.2秒。
      • 河边的二号湿度传感器,随机到了 3.7秒。 于是,它们的实际接入时间,就被自然地错开了。
  • 第三部分:offset (optional) - 预留的“优先”通道

    • offset:这是一个由AMF提供给特定UE的、可选的、固定的时间偏移量。
    • 作用: 这是为了实现**业务优先级(QoS)**管理。对于高优先级的用户,可以给予一个较小的(甚至为0)的offset;而对于低优先级的用户,则可以分配一个较大的offset,让它们“稍等片刻”。
    • 伊芙琳的场景: 运营商为伊芙琳博士的GeoLink-1(用于关键任务通信)配置了offset = 0。而为那上千个非实时的环境传感器,则统一配置了offset = 5 seconds
    • 最终结果: 假设GeoLink-1随机到了12.5秒,它的总等待时间是4.5h + 12.5s + 0s。而一号温度传感器随机到了5.2秒,它的总等待时间是4.5h + 5.2s + 5s = 4.5h + 10.2s。即使传感器随机到了一个很小的值,这个固定的offset也确保了它总会比同样随机到小值的GeoLink-1要晚一点接入,从而为高优先级设备“让路”。

Figure 6.7.1-1: Random 5G NAS signalling with DCW timer 直观地展示了这一效果:在T2时刻之后,原本会垂直叠加在一起的信令峰值,被“摊平”成了一个在DCW range内均匀分布的、平缓的接入坡。


2. 操作流程:规则的制定与遵守 (解读 6.7.2 Procedures)

Figure 6.7.2-1: High-level Procedure for utilizing DCW timer 为我们展示了这套“交通规则”是如何下发并被遵守的。

2.1 步骤 0a & 0b:规则的“广播”与“密告”

这是一个并行的准备阶段,网络需要向UE下发两种不同的信息。

0a. The NTN RAN broadcasts its satellite ephemeris data, from which UE can determine when the coverage will lose (i.e. T1) and when the coverage will recover (i.e. T2).

  • 步骤0a:公开广播“封路时间”。 RAN(卫星)通过广播信道(如SIB),向其覆盖范围内的所有UE公开广播星历数据。所有UE都可以据此计算出共同的T1和T2。这就像交通电台向所有司机广播:“前方道路将于14:00至18:30进行施工。”

0b. The AMF determines the DCW range based on the operator policy and provides the DCW range to the UE via Registration procedure or UE Configuration Update procedure.

  • 步骤0b:私下告知“通行规则”。 AMF根据运营商的策略(例如,根据该区域的UE密度、网络容量等),决定一个合适的DCW range(和可选的offset)。然后,它通过UE个体的、加密的NAS信令(如Registration AcceptUE Configuration Update),将这个“通行规则”私下告知给每一个UE。这就像交警在你办理车辆注册时,在你的行车电脑里预设好:“遇到施工结束,你的随机等待范围是60秒。”

2.2 从计算到等待:UE的“自觉”遵守

1. The UE generates DCW value based on the received DCW range and determines the DCW timer based on both the generated DCW value and satellite ephemeris data.

  • 步骤1:UE的“自我规划”。 UE在“大脑”中,将公开的“封路时间”、私下的“通行规则”和自己的“优先级”结合起来,计算出自己的、唯一的“总等待时间”。

2a. The discontinuous coverage period starts , the UE and/or RAN may release the AN resources. 2b. When the UE detects the discontinuous coverage starts, the UE triggers the DCW timer.

  • 步骤2:启动倒计时。 当UTC时间14:00 (T1) 到来,信号消失,UE便启动它那独一无二的DCW倒计时。

3. The DCW timer expires. 4. The UE initiates to send the 5G NAS signalling to the AMF.

  • 步骤3 & 4:“绿灯”亮起,有序通行。 在漫长的等待之后,DCW定时器终于超时。只有在这一刻,UE才会“被允许”向AMF发起NAS信令(如Periodic Registration UpdateService Request),正式开始其网络接入流程。

3. 系统影响分析:一次NAS层的精巧变革 (解读 6.7.3 Impacts on services, entities and interfaces)

NTN RAN:

  • Broadcast satellite ephemeris data that includes e.g. time information on when the ongoing satellite is to end serving the area (e.g.T1) and when the incoming satellite is to start serving the area (e.g. T2).

RAN的影响: 职责单一,只需扮演好**“信息广播员”**的角色,确保T1和T2信息的准确下发。

AMF:

  • Send DCW range to the UE via Initial Registration procedure or UE Configuration Update procedure.
  • Determine the DCW range based on the operator policy.

AMF的影响: 成为**“策略制定者”**。它需要新增一项能力:根据网络状况和运营策略,动态或静态地配置DCW rangeoffset,并通过NAS信令下发给UE。

UE:

  • Receive the DCW range.
  • Receive satellite ephemeris data.
  • Generate DCW value within the range of DCW range.
  • Calculate DCW timer…
  • Run the DCW timer.

UE的影响: 成为**“规则的自觉遵守者”**。它需要新增一套完整的逻辑:接收并存储DCW range,结合星历计算总等待时间,并在定时器运行期间,严格抑制任何发起NAS信令的冲动。


4. 方案评估:釜底抽薪,优雅治堵 (解读 6.7.4 Solution evaluation)

6.7.4 Solution evaluation

The proposed solution introduces a “wait range” for the UEs that experience discontinuous coverage by the MEO/LEO satellite(s)… The non-steerable beam offering MEO/LEO, whose beam sweeps on the earth surface is considered to provide sufficient randomization… However, the steerable beam offering MEO/LEO that provides fixed beam foot print may not produce randomization for the UEs, which needs the “wait range” to reduce the overload impact…

评估部分首先精准地指出了本方案的“靶向场景”:它并非为所有LEO/MEO卫星设计,而是专门针对那些采用“波束驻留”(steerable beam, fixed footprint)技术的卫星系统。因为那些采用“扫描波束”(sweeping beam)的卫星,其波束在地球表面高速扫过,不同位置的UE恢复覆盖的时间点天然就是错开的,自带“随机性”。而波束驻留技术,则会导致一个固定区域的UE“同生共死”,因此急需DCW这样的“人为随机化”机制。

Existing solutions for randomizing access are supported, e.g. when IDLE UEs start AS level random access procedure, which results in throttling of UE access attempts on AS level before NAS messages can be sent. The NAS level “wait range” will randomize the UEs when accessing the same MEO/LEO satellite coverage…

这是评估中最具洞察力的部分,它揭示了DCW机制的根本先进性

  • 传统治堵(AS层): 传统的随机接入退避机制,发生在AS(接入层),即UE已经开始向RAN发送信号(RACH前导码)之后。这就像所有车辆都已冲到路口,交警在路口指挥它们“碰撞了就后退再试”。这虽然能缓解拥堵,但路口的混乱和碰撞本身,已经造成了空口资源的浪费。
  • DCW治堵(NAS层): DCW机制,则发生在NAS(非接入层)。它在UE发起任何空口通信之前,就通过定时器,命令UE“原地等待”。这就像交警在每个小区门口就设置了不同的出发时间,从源头上就避免了所有车辆同时涌向路口。这是一种**“釜底抽薪”**式的治堵,效率更高,对RAN的冲击更小。

总结:从个体智能到集体智慧

如果说前序的解决方案,教会了UE如何在孤立的环境中,成为一个聪明的“个体”,那么Solution 7则将我们的视野,提升到了“集体”的层面。它所引入的DCW定时器,不仅仅是一个技术工具,更是一种“社会契约”的体现。它通过网络下发的统一规则(DCW range)和个体执行的随机行为(DCW value),在成千上万个独立的UE之间,建立起了一种无需相互通信的“集体智慧”和“社会公德”。

这场由DCW定时器精心指挥的“错峰接入”之舞,优雅地化解了“惊群效应”这一5G NTN商用道路上的关键障碍。它以一种对RAN冲击最小、对UE功耗友好的方式,将可预见的信令风暴,疏导成了平缓的业务细流。

然而,Solution 7的智慧,主要体现在“回归”覆盖的时刻。那么,在UE“离开”覆盖的前一刻,是否还有文章可做?如果一个UE的行为不可预测,它在IDLE状态下悄悄地飞出了覆盖区,网络该如何知晓,从而避免后续的无效寻呼?

这正是Solution #8——“离开覆盖通知”(Leaving Coverage Notification)——将要为我们讲述的故事。一场关于UE主动“告别”的机制,即将在下一篇文章中展开。敬请期待。


FAQ

Q1:DCW定时器和传统的RACH随机接入退避(backoff)机制有什么根本区别? A1:根本区别在于拥塞控制发生的层面不同。RACH退避发生在AS(接入层),是UE在物理信道上尝试发送接入请求(Preamble)失败后,由MAC层执行的一种“事后”补救措施。而DCW定时器发生在NAS(非接入层),它在UE的上层协议栈,决定是否要发起一次NAS流程(如注册更新)时,就进行了一次“事前”的延迟。DCW是从源头上阻止了UE在同一时间去“敲门”(尝试RACH),而RACH退避是在大量UE同时“敲门”并发生“踩踏”后,再让它们排队重试。显然,DCW的方式对RAN的冲击更小,更为主动和高效。

Q2:网络(AMF)是如何决定DCW range的大小的? A2:这是一个由运营商根据策略配置在AMF中的参数。AMF在决定DCW range时,可能会综合考虑以下因素:1) 该区域的UE密度: 预估在该卫星波束下,同时有多少UE会苏醒。UE越多,range就需要设置得越大。2) RAN的接入容量: 卫星的随机接入信道(RACH)容量是多少?网络希望将接入速率控制在这个容量之下。3) 业务类型: 如果该区域主要是延迟不敏感的物联网业务,range可以设置得大一些;如果有对接入时延敏感的业务,则需要权衡,不能设置得过大。

Q3:如果UE在DCW定时器运行时,移动到了另一个有覆盖的网络(比如地面网络),它会怎么做? A3:这是一个重要的例外处理场景。规范在评估部分明确指出:“if the UEs leave this satellite coverage area during the discontinuous period and the DCW timer is running, the UEs should disable the DCW timer to access a new target system.” 这意味着UE需要具备场景感知能力。如果它在等待期间,通过小区搜索,发现了一个新的、可用的网络,它应该立即“作废”当前的DCW定时器,并尝试接入这个新网络。DCW定时器的约束,仅限于“等待原网络恢复”这一特定场景。

Q4:为什么这个方案对采用“扫描波束”的卫星系统不是必需的? A4:采用“扫描波束”的LEO卫星,其波束像一个巨大的“手电筒光斑”,在地球表面高速(约7km/s)扫过。对于地面上不同位置的UE来说,被这个“光斑”扫到的时间点是天然就错开的。例如,A点的UE可能在10:00:01恢复信号,而几公里外的B点的UE可能在10:00:02才恢复信号。这种物理层面的时间差,已经在大尺度上实现了接入的“随机化”,因此不太需要NAS层再引入一个额外的人为随机化机制。

Q5:offset这个优先级机制,会破坏接入的随机性吗? A5:不会破坏随机性,而是在随机性之上叠加了确定性的优先级。它实现的是“分组随机”。例如,所有高优先级用户的offset为0,它们将在[T2, T2 + DCW range]这个时间窗口内随机接入。所有低优先级用户的offset为5秒,它们将在[T2+5s, T2+5s + DCW range]这个窗口内随机接入。这样,既保证了每个组内部的接入是随机的,从而避免了组内拥塞,又保证了高优先级组整体上会比低优先级组更早开始接入,实现了业务的差异化服务。