好的,我们继续解读TR 21.918的后续章节。
深度解析 3GPP TR 21.918:17.1 Enhanced Multiparty RTT (增强的多方实时文本) & 17.3 Next Generation Real Time Communication services and IMS Data Channel (DC) (下一代实时通信服务与IMS数据通道)
本文技术原理深度参考了3GPP TR 21.918 V18.0.0 (2025-03) Release 18规范中,关于“17.1 Enhanced Multiparty RTT”和“17.3 Next Generation Real Time Communication services and IMS Data Channel (DC)”的核心章节。本文将合并解读这两个高度相关的章节,旨在为读者深入剖析5G-Advanced如何对其核心的多媒体通信引擎——IMS(IP多媒体子系统)进行现代化改造,通过引入“数据通道”(Data Channel)这一革命性能力,为未来的实时、交互式、沉浸式通信奠定基础。
长期以来,IMS一直是运营商网络中语音(VoLTE/VoNR)和富媒体通信(RCS)的核心。然而,随着AR/VR、远程协作、元宇宙等新应用的兴起,传统的、以“音视频流”为中心的IMS架构,在支持实时的、低时延的、任意数据交互方面,显得力不从心。
想象一下,在一个多方AR远程协作会议中,工程师们不仅需要看到彼此的音视频,还需要在共享的3D模型上进行实时的标注、拖拽、测量等交互操作。这些“标注”、“拖拽”的信令数据,量小、突发、且对时延要求极高。如果为这些数据单独建立一条WebSocket连接,会带来额外的信延和管理复杂性;如果将其与音视频流混在一起,又会破坏媒体流的同步。
为了解决这一痛点,3GPP在Release 18中,为IMS引入了一项意义深远的增强——IMS数据通道(IMS Data Channel, DC)。它旨在音视频通话的基础上,并行地建立一条通用的、低时延的、可靠或不可靠的数据传输“辅路”。
今天,我们的主角,是一家领先的协同办公软件公司的产品架构师,林工。他正在为其公司的AR远程指导产品,设计下一代的通信方案。17.1和17.3章节的出现,让他看到了将专业AR协作能力,与运营商级的电信网络深度融合的曙光。
1. 变革的起点:引入IMS数据通道 (解读 17.3)
林工首先关注的是IMS数据通道的核心架构。
1. Enhanced IMS architecture to support IMS Data Channel The enhanced IMS architecture introduces signalling function,i.e. Data Channel Signalling Function (DCSF), and media function, i.e. Media Function (MF), supporting data channel services. DCSF provides data channel policy control and data channel media control. The MF provides media capabilities in support of IMS DC and Augmented Reality.
17.3章节的核心,就是对IMS架构进行“手术刀”式的改造,引入了两个全新的功能实体:
- DCSF (数据通道信令功能): 这是数据通道的“大脑”。它负责DC的建立、修改、释放等信令控制流程,并与PCF等策略控制实体交互,为DC申请和管理QoS资源。
- MF (媒体功能): 这是数据通道的“媒体网关”。它在用户面终结DC的媒体流(基于SCTP协议),并提供数据包的路由、转码(如果需要)等功能。它还可以为AR等应用,提供更高级的媒体处理能力,例如场景合成、空间定位等。
规范中的Figure 1: Enhanced IMS architecture to support IMS Data Channel清晰地展示了这两个新网元是如何融入现有IMS架构的。通过引入DCSF和MF,IMS第一次拥有了原生的、独立于音视频之外的、通用的数据传输能力。
2. 数据通道(DC)的能力与协商
2. DC capability negotiation The UE supporting IMS data channel includes the media feature tag in the initial REGISTER request… 3. Procedures of IMS DC management The IMS network supports the end-to-end procedures supporting establishment, modification and termination for bootstrap DC and application DC management…
- 能力协商: 支持DC能力的终端,会在IMS注册时,通过携带一个特殊的“媒体特征标签”,向网络“宣告”自己的能力。
- 两种DC类型:
- 引导DC (Bootstrap DC): 在IMS会话建立之初,随音视频流一同建立的一条“基础”数据通道。它可以用于传输后续建立更多DC所需的信令。
- 应用DC (Application DC): 在会话过程中,由应用程序按需动态创建的数据通道。例如,当林工的AR应用需要共享一个3D模型时,可以临时创建一个专用的DC来传输模型数据。
- 灵活的传输特性: 在创建DC时,应用可以指定其传输特性,例如是需要像TCP一样可靠、有序的传输(适用于文件传输),还是像UDP一样不可靠、但允许乱序的传输(适用于对实时性要求极高的游戏或交互信令)。
3. “老树发新芽”:RTT在数据通道上的重生 (解读 17.1)
有了IMS数据通道这条“辅路”,许多过去难以在IMS上实现的实时交互应用,都找到了新的家园。其中一个最典型的应用,就是实时文本(Real-time Text, RTT)。RTT允许用户在通话的同时,像发短信一样,逐字逐句地看到对方正在输入的内容,对于听障人士或在嘈杂环境下的通信至关重要。
980007 Enhanced Multiparty RTT (MP_RTT) …summarized the market needs of multiparty real-time text featuresand triggered the creation of this WID, which resulted in the following:
- Both Multiparty RTT over RTP Solution and over IMS Data Channel Solution were developed;
17.1章节的核心,就是将传统的、基于RTP的RTT方案,演进为支持多方(Multiparty)的、并且可以运行在IMS数据通道之上的增强版RTT。
- 为何选择DC?: 传统的RTT将文本数据打包在RTP流中,与音频流混合传输,处理复杂且不灵活。而IMS DC提供了一条天然的、与音视频并行的文本传输通道。
- 多方能力: 通过IMS的会议(CONF)功能和新引入的MF(媒体功能),可以轻松地将多个参与方的RTT数据流进行混流和分发,从而实现多方实时文本聊天室的功能。
RTT在IMS DC上的成功应用,仅仅是一个开始。它像一个“样板间”,向业界展示了IMS DC的巨大潜力:任何需要与主通话并行的实时数据交互,都可以被“迁移”到这条通用的数据通道上。
4. 迈向沉浸式:AR通信在数据通道上的实现
林工最关心的AR远程协作,正是IMS DC的“杀手级”应用。
5. AR telephony communication The IMS network supports procedure enhancements to support AR telephony communication under both UE rendering mode and network rendering mode, on top of DC architecture.
- UE渲染模式: 这是基础模式。A、B两地的工程师进行AR通话。A将其看到的真实世界视频流,以及其手势、标注等AR元数据(通过DC传输),都发送给B。B的终端在本地,将这些AR元数据,叠加渲染到A的视频流上。
- 网络渲染模式: 这是更高级的云渲染模式。A和B都将自己的视频流和交互元数据(通过DC)发送到网络中的MF(媒体功能)。MF作为一个强大的“云端渲染引擎”,负责将两人的视图和交互进行三维空间的合成,生成一个统一的AR场景视图,再分别推流给A和B。这种模式对终端要求低,能实现更复杂、更一致的AR体验。
无论是哪种模式,IMS数据通道都扮演着不可或缺的角色——它就是那条承载着所有AR交互“灵魂”(姿态、标注、模型同步等元数据)的**“神经通路”**。
5. 计费的演进:为数据通道“定价” (解读 17.4)
任何新业务的成功,都离不开清晰的商业模式。既然IMS DC能够承载从简单的文本到复杂的AR元数据等各种流量,那该如何对其计费?TR 21.918中的17.4 Charging Aspects of IMS Data Channel章节(虽然内容简短,但指明了方向),为此提供了指导。
1000008 Charging Aspects of IMS Data Channel (IDC_CH) The duration-based charging and volume-based charging for IMS data channel are introduced…
规范为此定义了两种基本的计费维度:
- 基于时长(Duration-based): 类似于传统通话,按照数据通道的“占用时长”来计费。这适合于RTT、在线游戏等持续交互的应用。
- 基于流量(Volume-based): 按照数据通道上传输的“数据量”来计费。这由SMF收集,并上报给计费系统。这适合于文件传输、模型共享等应用。
通过这两种方式的组合,运营商可以为基于IMS DC的各种创新应用,设计出灵活而公平的计费策略。
总结
3GPP TR 21.918的17.1和17.3章节,共同宣告了IMS的一次深刻“蝶变”。通过引入革命性的IMS数据通道(DC),并在此之上成功实践了多方RTT和AR通信等标杆应用,IMS正在从一个传统的“音视频通话系统”,演进为一个面向未来的、通用的**“实时通信与数据协作平台”**。
- 架构的现代化: 通过引入DCSF和MF,IMS拥有了原生的、服务化的数据处理和信令控制能力,为其未来的功能扩展奠定了坚实的基础。
- 能力的通用化: IMS DC提供了一条与媒体流并行的、可靠或不可靠的通用数据传输通道,能够承载从文本、信令到复杂的AR/VR元数据等任意信息,想象空间巨大。
- 应用的沉浸化: AR通信在DC上的实现,标志着IMS正式吹响了进军“元宇宙”通信的号角,为运营商在未来的沉浸式社交、远程协作等领域,提供了一个强有力的、电信级的解决方案。
对于像林工这样的应用架构师,IMS DC的出现,意味着他们终于可以在一个全球互通、有QoS保障、运营商级的电信网络上,去构建需要低时延数据交互的复杂应用,而无需再完全依赖于不可靠的、尽力而为的公共互联网。IMS这棵“老树”,正在5G-Advanced的浇灌下,绽放出前所未有的“新芽”。
FAQ - 常见问题解答
Q1:IMS数据通道(Data Channel)和我们平时Web应用中使用的WebSocket有什么区别? A1:可以理解为“电信级”与“互联网级”的区别。WebSocket是一种基于HTTP的、在应用层建立的双向通信协议,它运行在“尽力而为”的公共互联网之上,网络无法为其提供任何原生的QoS保障。而IMS DC是3GPP原生定义的、IMS会话的一部分。它的核心优势在于:1)与音视频会话强绑定:它的生命周期与主通话会话同步管理。2)电信级QoS保障:DCSF可以直接与核心网的PCF交互,为这条数据通道申请专用的QoS Flow,获得低时延、有保障带宽等电信级服务质量。3)全球互通:基于IMS的全球互通框架,理论上可以实现跨运营商的DC互通。
Q2:什么是引导DC(Bootstrap DC)和应用DC(Application DC)?为什么需要两种类型? A2:这是为了实现灵活性和效率的平衡。Bootstrap DC是在IMS会话建立时,随着SDP协商就默认建立的一条基础数据通道。它的好处是“开箱即用”,会话一接通,这条通道就可用了,可以立即用于传输一些基础的信令和应用内“握手”信息。Application DC则是由应用在会话过程中按需动态创建的。它的好处是“灵活高效”。例如,一个多功能协作应用,可能需要文件传输、白板同步、3D模型交互三项功能,它可以为这三项功能分别创建三条独立的Application DC,并为它们配置不同的传输特性(如文件传输用“可靠”模式,白板同步用“不可靠”模式),从而实现资源的精细化管理。
Q3:实时文本(RTT)为什么对听障人士如此重要?它和我们用的微信/短信有什么不同? A3:RTT的核心价值在于**“实时性”和“会话感”。微信/短信是“消息传递”,你必须完整地输入一句话,点击“发送”,对方才能看到。这个过程是异步的。而RTT是“字符流传输”,你输入的每一个字符**,几乎在你按下键盘的瞬间,就会实时地显示在对方的屏幕上。这对于听障人士来说,能够让他们像正常人“听”电话一样,实时地“看”到对话的流动,完整地感受到对方的语气、停顿和思考过程,从而获得一种远超短信的、真正的“对话”体验。
Q4:在AR通信的网络渲染模式中,新引入的MF(媒体功能)扮演了什么关键角色? A4:MF扮演了**“云端AR渲染中心”和“多方媒体混合器”**的关键角色。在网络渲染模式下,所有参与者的终端都只负责采集本地的视频和姿态数据,并将它们上传到MF。MF这个强大的网络功能,会负责:1)空间锚定与场景融合:将来自不同参与者的、基于各自坐标系的AR数据,在一个统一的虚拟三维空间中进行对齐和融合。2)实时渲染:根据融合后的场景,为每一个参与者,从他/她各自的视角,实时地渲染出最终的AR画面。3)媒体分发:将渲染好的个性化视频流,再分别发送给每一个参与者。MF将最耗费计算资源的渲染和融合工作,从终端转移到了网络边缘,从而使轻薄的AR眼镜也能实现复杂的的多方沉浸式协作。
Q5:IMS DC的引入,对运营商的IMS网络需要进行哪些改造?成本高吗? A5:需要进行软件和硬件的升级,是一次重要的架构演进。1)引入新网元:运营商需要在其IMS网络中,新增部署DCSF和MF这两个全新的逻辑网元。这些可以是虚拟化的软件,部署在通用的云平台上。2)现有网元升级:核心的IMS网元,如CSCF、AS(应用服务器)、MRF(媒体资源功能)等,都需要进行软件升级,以能够理解和处理与DC相关的SDP协商和SIP信令流程。3.)与5GC的接口:DCSF需要能够通过5GC的N5/Nnef等接口,与PCF/NEF进行交互,以实现QoS策略的申请。总的来说,这是一次重要的网络升级,初期会有一定的投资,但它为运营商开辟了从“卖话音”到“卖实时数据协作能力”的全新商业蓝海,具有长远的战略价值。