声网(Agora, Inc.)作为全球实时互动云领域的先行者,近期动作频频,其对线的推出,以及在 ConvoAI&RTE 2025 第十一届实时互联网大会上的亮相,都预示着其在交互领域的战略布局。 结合星空体育登录入口 星空体育在线官网“趣解商业”的报道,以及声网在过去多年持续攻坚“听到、听懂、理解”三大难题的实践,本文将深入探讨声网的技术优势、市场机遇与挑战。
大语言模型(LLM)、自动语音识别(ASR)、文字转语音(TTS)以及实时互动(RTE)等技术的融合。而RTE技术,作为实现低延迟、高稳定语音传输的关键,是对话式AI得以流畅运行的基石。声网凭借其在RTE领域的深厚积累,构建了全球性的网络,确保全球任意两点之间的传输效率。根据“趣解商业”的了解,声网对线%的环比增长,展现了市场对高质量语音交互的强烈需求。
声网的商业模式,可以被视为AI浪潮中的“卖铲人”。它并不直接参与AI模型的开发,而是专注于提供底层语音交互技术,为AI产品提供稳定、低延迟的实时传输支持。 随着对话式 AI 技术的快速发展,VoiceAgent 是目前市场上极具代表性的产品形态。声网通过推出对线、对话式 AI 开发套件、对话式 AI 模型评测平台和对话式 AI Studio,加速对话式 AI 在实时互动行业的应用创新。声网的对话式 AI 引擎已经落地多个案例,例如为豆神 AI 的互动课提供实时语音交互支撑,为赋之家庭陪伴机器人打造情感化语音交互,以及为珞博智能的 AI 宠物 Fuzozo 优化 AI 交互的实时性和稳定性。
AI语音领域取得了显著进展,但仍面临诸多技术挑战。低延迟响应、自然打断、上下文管理、情感理解与表达等,都是对话式 AI 产品需要攻克的难关。人类对线毫秒左右;当语音 AI 的响应延迟超过 500 毫秒时,用户体验会显著下降。声网在RTE技术上的优势,能够有效降低延迟,提升用户体验。 此外,AI产品的防干扰能力也很关键,如何识别哪些打断的指令来自用户,哪些是嘈杂的环境音,被用户打断补充后仍能流畅地给出回应,这既需要语音识别有声学基础,也要有足够的上下文记忆和理解能力。声网在解决这些挑战的过程中,不断提升其技术实力。从长远来看,随着多模态AI应用的普及,那些星空体育登录入口 星空体育在线官网能够提供低延迟、高稳定性、自然交互体验的技术平台,将在下一轮竞争中占据更加有利的位置。
AI语音技术市场。 从 Agora,Inc.(NASDAQ:API)的财报来看,声网的对话式AI业务收入贡献尚不明显,这需要声网在技术创新和市场拓展方面持续发力。声网在海外市场的业务增长表现良好,但在中国市场的收入有所下降,这需要声网积极调整市场策略,应对挑战。
AI语音交互技术不断发展的背景下,声网能否凭借其在RTE领域的优势,以及持续的技术创新,成为AI语音领域的核心技术提供商?