星空体育·(StarSky Sports)官方网站-星空官方认证

当“超级大脑”遇上“顺风耳”移远通信为机器人注入智能灵魂-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

当“超级大脑”遇上“顺风耳”移远通信为机器人注入智能灵魂

日期:2025-07-08 浏览: 

  (魏德龄/文)在2025MWC上海,早已对机器人演示项目司空见惯的观众,却在不断对着移远通信展台前的一台产品进行对话交互。

当“超级大脑”遇上“顺风耳”移远通信为机器人注入智能灵魂(图1)

  这台机器人诠释了关于“火种”与“变形金刚”间的故事,让很多业内人士开始考量,自己的传统设备是否也需要加上一个“灵魂大脑”,来实现语音交互、信息查询与指令执行等一系列功能。

  对此,不妨先从系统架构的角度来剖析下,这台机器人是如何拥有了“灵魂大脑”的。

  观众之所以能联想到自身行业的机器人产品升级,关键在于移远通信展示的机器人采用了一套融合方案,即机器人本体为逐际动力提供,通过连接一块搭载移远高算力AI模组SG885G、集成端侧本地模型的主控板,来帮助机器人解决思考与下达指令的问题。在实现交互方面,则配置麦克风阵列和喇叭,从而实现对现场观众的语音感知。

当“超级大脑”遇上“顺风耳”移远通信为机器人注入智能灵魂(图2)

  移远通信在2025MWC上海期间发布的“Robrain AI机器人解决方案”,如同“火种”一样,迅速让机器人获得“灵魂大脑”。该方案采用创新的端云协同架构及麦克风阵列拾音技术,深度融合端侧智能与云端大模型优势,赋予机器人接近人类的“思考”与“倾听”能力。有效攻克了AI模型定制、轻量化部署及低延迟交互响应等关键挑战,推动机器人从“机械执行”跃升为“主动感知、智能思考、自然交流”的AI智能体。

  据了解,本次的演示机器人采用的是一套轻度融合方案,好处在于整合容易,相当于只需为固有设备提供一颗“大脑”,可以选择内置在本体或外挂,就能让机器人拥有“灵魂”,由于各模块相对独立,系统对接简单。

  同时,移远通信还提供深度融合方案,采用一体化软硬件设计。在依旧沿用机器人本体的情况下,将机器人大脑主板与小脑主板合二为一。尽管需要产品人员具有一定开发能力,但整机可靠性更高,在生产过程中也更具成本优势。

  而对于机器人的最终体验好坏与否来说,在融合方案内部的“超级大脑”与“顺风耳”到底能够发挥怎样的作用正是关键所在。

  由于机器人采用语音交互的方式,所以在感知层需要进行前端声学处理,降低会场中的杂音,确定正在进行交流的声源内容,最终将准确的信息内容传递给决策层。

  在决策层通过意图识别后,通过移远端&云混合大模型进行指令处理,端侧大模型与RAG本地知识库结合,确保实时控制中的快速反应与准确作答,云端大模型的接入让用户的一些查询、提问能够通过联网获取信息。

  最终处理完的控制指令将通过机器人执行,机器人也能以语音播报的形式进行反馈。

  显然,感知层的“顺风耳”与决策层“超级大脑”的产品能力,塑造了冰冷机器人的“有趣灵魂”。

  “Robrain AI机器人解决方案”还拥有全链路音频处理能力,让机器人能够“听得见”,更能“听得清”。以2025MWC上海的会场环境为例,现场有着嘈杂的人声,不同展台的喇叭也在不时播放着自家的宣传,在巨大的室内环境中还存在着回声问题;同时,机器人内部也会在运转过程中伴有震动、电机、风扇等噪音。

  移远通信Robrain AI机器人解决方案通过“麦克风阵列拾音+全链路音频算法”,为机器人添上了“顺风耳”的功能。6麦克风均匀分布在设备的圆环上,可以360度全向拾音,最大收录距离可达10米,唤醒率高达95%,±10.0°的DOA精度可以确保声源区域被增强。

  有效的声音信号被收集后,相关算法会首先去除其中的干扰信号以及密闭空间中的回声,并通过AI降噪获得单纯的人声,同时还会自动调节音频增益,让输出音量保持在合适的幅度。

  “回声消除、声源定位、波束成型、降噪、去混响、自动增益以及语音唤醒等一系列前端数据处理,确保了大模型识别的准确率。”移远通信产品经理王宗武表示。

当“超级大脑”遇上“顺风耳”移远通信为机器人注入智能灵魂(图3)

  当清晰明了的声音内容输入到“超级大脑”后,Robrain AI机器人解决方案中的端&云混合大模型同样分工明确。其中,为了让机器人能够如同真人一样在沟通交流中做出及时反馈,并且不依赖于网络环境,85%的运算将在端侧大模型进行,做到时延小于1秒,并且不占用过多算力资源。对于一些与产品相关的问题,端侧大模型还能读取本地RAG知识库,满足商业化需求,减少通用大模型在专业领域容易出现的“幻觉”问题。移远通信产品经理王柯将这一过程比喻为:“大模型在本地进行‘开卷考试’,机器人如同自带一个本地学霸。”从成本侧考虑,RAG的方式也比企业根据自身数据内容进行私域训练耗费资源更少,且落地更快。

  方案中的云端大模型则提供了扩充整体方案的能力,通过与通用大模星空体育官方入口 星空体育官网型进行合作,可以轻松接入互联网资源,帮助进行内容搜索、新闻播报,或提供影音娱乐服务。例如在2025MWC上海的展区演示中,当现场观众询问“明天天气怎么样?”的时候,演示机器人能够快速做出回答。

  实际上,移远通信在2025MWC上海展示的机器人并非“超级大脑”+“顺风耳”这对天作之合的孤例。依托移远通信端侧AI整体解决方案,今年3月联合德壹所发布的全能王AI具身机器人,在无需理疗师介入、无网络连接的环境下,可快速且准确地理解用户通过自然语言提出的指令和意图,高效完成通用聊天、医疗领域RAG问答、指令控制等任务。该机器人搭载高通QCS8550平台,其意图识别小于1s、Prefill时间小于2s,同时,超过15 tokens/s解码速率也确保了交互的实时性。

  正如这台能够代替一定理疗师工作的机器人,当具身智能来到生活中的每个场景,移远通信正在准备将这对“天作之合”的能力进行进一步升级。

  “我的个人建议是把大模型当做人一样。”王柯表示,大模型方案将在如今文本和语音基础上,引入视觉能力的支持,届时,机器人将能够通过视觉看到交流者的表情,从而提升和扩展方案的适用性。与此同时,在与多名对象的交流过程中,视觉也能帮助机器人更好地判断说话人的转换。最终,视觉将与文本、语音一并,构成机器人的多模态感知能力。

  移远通信还正在思考,如何解决当前Transformer架构下的主流大模型对算力内存消耗比较大的问题。目前正在关注非Transformer架构的RWKV大语言模型,并已在SG885G模组上成功运行RWKV7模型,将为机器人带来更高效、内存占用更小的能力。

  在语音交互的演进方面,移远通信同样聚焦在多维感知的方向上。例如,在目前的交互开启环节,语音唤醒还只是基础层面,如果需要能够锁定个人对象的识别开启,就需要引入声纹识别或人脸唤醒。同时,声纹或声源与人脸、人体的结合,更有利于保持交互状态,从而做出更准确的语义判断。人脸锁定功能也可以在多人对话中,通过重新锁定人脸来切换对话信息的收集。另外,在最后结束交互的环节,移远通信也正在让机器人能够以比较友好的方式进行表达,比如说“我累了”或“我想休息了”。

  当“超级大脑”遇上“顺风耳”,正在如同儿时动画片中的“火种”一般,为众多机器人赋予全新的智能灵魂,让冰冷的机身展现出思考与表达的“火花”。随着具身智能开始走向生活中的每一个角落,移远通信也正在推动儿时的科幻想象成为美好现实。