星空体育·(StarSky Sports)官方网站-星空官方认证

语音识别芯片工作原理pdf-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

语音识别芯片工作原理pdf

日期:2025-04-30 浏览: 

  LD332X LD332X LLDD333322XX系列语音识别芯片的工作原理: LD3320提供的语音识别技术,是基于关键词语列表的识别技术:ASR(Auto speech recognition )技术。 语音识别芯片完成的工作就是:把通过 MIC输入的声音进行频谱分析-提取语音特征-和 关键词语列表中的关键词语进行对比匹配-找出得分最高的关键词语作为识别结果输出。 语音识别芯片能在两种情况下给出识别结果: 1)外部送入预定时间的语音数据后(比如5秒钟的语音数据),芯片对这些语音数据运算分 析后,给出识别结果 2)外部送入语音数据流,语音识别芯片通过端点检测VAD(voice activitydetection)检测 出用户停止说话,把用户开始说话到停止说话之间的语音数据进行运算分析后,给出识别结 果 对于第一种情况,可以理解为设定了一个定时录音(比如为5秒钟),芯片在5秒钟后,会停 止把声音送入识别引擎,并且根据已送入引擎的语音数据计算出一个识别结果。 对于第二种情况,需要了解VAD 的工作原理: VAD(VoiceActivityDetection) 技术是在一段语音数据流中,判断出哪个时间点是人声的 开始,哪个时间点是人声的结束。判断的依据是,在背景声音的基础上有了语音发音,则视 为声音的开始。而后,检测到一段持续时间的背景音(比如600毫秒),则视为人声说话结 束。 通过VAD判断出人声说话的区域后,语音识别芯片会把这期间的声音数据进行识别处理后, 计算出识别结果。 需要说明的是,除了以上两种情况外,语音识别算法无法主动地判断出是否识别出了一个 结果。这是因为,在计算的过程中的任何时刻,语音识别器都会对已送入识别芯片的声音数 据进行分析,并根据匹配程度为识别列表中的关键词语进行打分,最匹配的打分最高。 但是,由于识别算法不知道用户后面是否还继续说语音,所以无法主动地判断已经识别出 一个结果。 比如,识别列表中有两个关键词语分别是李晓和李晓明,当用户说到晓这个音节时, 在识别芯片内部是李晓的得分最高,但此时识别芯片是无法给出识别结果。随着

  2、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。

  3、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客星空体育官方入口 星空体育官网服、多端互通、版权登记。

  4、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

  2025【基于单片机的室内环境智能调节系统设计10000字】.docx

  可视化导论(浙大)中国大学MOOC慕课 章节测验期末考试客观题答案.docx

  重庆市两江新区汽博西政住宅小区(E2-106 地块)豪宅项目(山地现代高层+叠拼+中式合院 75-1300).pdf

  原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者