星空体育·(StarSky Sports)官方网站-星空官方认证

黄鹂智声CEO刘志:声音价值大有空间前端处理是语音交互的重要前提-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

黄鹂智声CEO刘志:声音价值大有空间前端处理是语音交互的重要前提

日期:2024-07-14 浏览: 

  央广网北京7月13日消息(记者 黄昂瑾)随着人工智能技术应用的普及,语音识别对于很多人来说并不陌生。而要让语音识别更准确,也就是让机器听懂语音信息,其中一个重要前提是让机器听清楚声音信息。

  “声音往往传递了很多信息,包含了很多层面,比如我们沟通中的内容信息、个人身份信息、还有情感信息等。”近日,在2024(第二十三届)中国互联网大会期间,黄鹂智声CEO刘志在接受央广网记者专访时表示,纵观声音技术发展历程,主要在解决人和人之间通信问题、人机交互问题,以及如何让机器听懂机器的声音。

  深耕声音技术领域近20年,在刘志看来,声音本质上是一种信息,挖掘声音的价值仍大有空间。

  “留声机、通信技术等解决最初远距离采集、传输声音的问题,这是声音技术发展的第一个阶段。而随着通信的场景日益复杂,存在噪声干扰的环境也越来越多。因此声音技术进一步研究如何屏蔽噪声,帮助人在嘈杂环境中听清楚远距离的声音。这一技术还在继续发展。”刘志告诉记者,声音技术发展的第二个重要阶段在于解决人机交互的问题,比如语音识别技术等,目的是让机器听懂人的话。“在这一阶段,声音采集端的降噪处理非常重要,因为要让机器听懂人话,首先得把声音清晰地收集下来。很多时候机器识别不准,很大一部分原因是受周边噪音的影响。”

  “第三个阶段不再仅是让机器听懂人了,而是让人听懂机器、让机器听懂机器。”刘志认为,“声音下一步发展的重要方向之一是声音的物联网,就是通过声音把物和物相连,这样让人能够实时准确地判断周边环境信息。”

  刘志举例称,“比如家里宠物的叫声可能是有含义的,人听不懂,能不能让机器听懂?再比如一些设备故障,可能在被人们发现之前,已经有了声音上的信号,能不能通过让机器听机器及时掌握设备的运行状态?”

  “在声音技术发展的第三个阶段,仍然离不开声音前端的处理,也就是如何清晰地采集到我们需要的声音,让机器进行识别。”刘志补充道。

  “黄鹂智声专注于声音前端处理,把声音采集这件事情做好。”刘志介绍,“我们主要应用在三个大的领域,分别是可穿戴设备、车联网,以及智能家庭。第一个是穿戴类的设备,主要包括自有品牌耳机类产品,以及AR、VR眼镜、手表等产品,我们把技术赋能给合作伙伴,提升这些智能硬件设备的人机交互能力。”

  以黄鹂智声近期推出的一款通话“灭噪”耳机产品为例,刘志向记者介绍了“灭噪”的概念:“实际上并不是真的把噪音给消灭了,而是通过人工智能结合声学以及信号处理等技术,把噪声压制到人耳觉星空体育登录入口 星空体育在线官网察不出的水平。以噪声分贝来衡量,一般环境下人能听到的噪声分贝在30分贝以上。我们把噪声从带噪的声音中分离出来之后,把它压下去50分贝,也就是压10万倍,而且是平均压10万倍,这样就把噪声压到人耳听不见的水平,从而达到‘灭噪’的效果。”

  刘志表示,第二个应用场景是车联网,车会逐渐成为人们的另一个娱乐中心、工作中心。随着自动驾驶的普及,未来人们在车上工作、学习、娱乐过程中,声音是重要的载体。“在行车过程中,存在车内噪声、路面噪声,如何让乘客在车内进行各自活动时不受周边噪声环境的影响,这是我们研究的方向之一。”

  “第三个是智能家庭场景,试想在家里,如果我们通过语音交互就能随处控制家里的电器设备、移动终端,随时感知家里的环境状况,我相信这是立足以人为本的一个重要需求。实现这一点也非常依赖于声音前端技术的处理。”刘志说。

  随着人工智能技术应用的普及,语音识别对于很多人来说并不陌生。而要让语音识别更准确,也就是让机器听懂语音信息,其中一个重要前提是让机器听清楚声音信息。