从“连接”到“对话”,对话式AI开启实时互动产业新蓝海
北京日报客户端 | 记者 孙奇茹

2025-11-03 20:23 语音播报

经济

由声网与RTE开发者社区联合主办的Convo AI暨 RTE 2025 第十一届实时互联网大会近日在京开幕。记者从会上获悉,RTE(实时互动)技术已成为不可或缺的关键基础设施,然而在基础设施日趋完善的同时,产业依然面临着从“连通”到“对话”的挑战。

所谓RTE,指实时互动,该技术的核心目标是让人们在互联网上也能像“打电话”一样,进行几乎没有延迟的音视频通话、数据交换和互动,过去人们所熟悉的网络视频会议、直播连麦等场景都离不开RTE。而今它也成为AI(人工智能)实现自然智能交互的重要技术支撑,有望在情感陪伴、AI智能服务等领域大显身手。声网创始人兼CEO赵斌在会上透露,声网年度服务分钟数首次突破1万亿分钟,RTE技术已成为不可或缺的关键基础设施。

然而,当交互对象从“人与人” 扩展到 “人与AI”,实时互动在环境感知与交互自然度上仍存在明显缺陷。赵斌举例道,AI客服热情礼貌但答非所问,已读乱回;导航提示音正在播报路况,一旁的AI助手却“不知趣”地继续正常音量与用户交流……行业数据显示,仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到“不可接受”。究其根源,人类对话中仅有7%的信息来自语言内容,超过90%的信息感知依赖于语调、表情和肢体语言等非语言要素。要实现真正的“类人对话”,企业必须系统性攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战。

多模态大语言模型(LLM)的出现让计算机具备了类人的实时语音对话能力,为解决这些挑战带来了全新路径。赵斌表示,对话式AI正驱动RTE从能够 “正常对话” 到 “声情并茂”的关键跃迁,为RTE行业带来一个不可估量的全新市场。Deepgram和 Opus Research调研显示,67%的企业已将语音 AI 智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入。在开发者生态中,全球范围内也正掀起一场实时语音技术的新浪潮,对话式 AI与语音智能体创业公司呈现爆发式增长态势。Y Combinator近期的孵化团队中,语音智能体公司占比显著提升;ARK Invest预测AI陪伴赛道有机会从3000万美元上涨到700亿到1500亿美元;声网对话式AI相关用量在2025年第三季度实现151%的环比增长,都展现出强劲的市场需求。

赵斌提出,在众多应用场景中,对话式AI将在情感陪伴、智能硬件、在线教育三大场景中率先实现规模化落地。


编辑:孙奇茹

打开APP阅读全文
APP内打开