语音识别的一般技术 语音信号及单片机处理 2022年8月16日星期二 第2页 语音识别的一般技术 1.1 语音识别基本原理 语音识别系统本质上是一种多维模式识别系统,基本结构如图3.4所示。语音识别系统与一般的模式识别系统类似,包括特征提取、语音模式库、模式匹配3个基本单元。 图3.4 语音识别系统的基本结构 2022年8月16日星期二 第3页 1、预处理 预处理包括预加重、反混叠滤波、模/数转换、自动增益控制等处理过程,用以去除声门激励、口鼻辐射、高于1/2采样频率的高频和噪声信号的影响,实现语音信号的数字化。在语音识别中,预处理还包括在声学参数分析之前正确选择识别基本的问题。 2022年8月16日星期二 第4页 2、特征提取 可选择的语音特征参数具体如下: 时域参数 包括短时平均过零率、短时平均幅度或短时平均能量、基音周期。 频域参数 包括短时频谱(有10~30个通道滤波器组的平均谱、DFT频谱、模仿人耳听觉频率特性的MEL谱等)、前3个共振峰(有幅度、频率、带宽)、倒谱、线性预测系数、PARCOR系数(偏自相关系数)。 其他参数 包括声道的形状函数(用于求取讲话者的个性特征)、随机模型(即隐马尔可夫模型)的概率函数、矢量量化的矢量。 超音段信息函数 包括音长、音调、音色等。 2022年8月16日星期二 第5页 3、语音模型库 语音模型库即声学参数模板,它是用聚类分析等方法,从一个讲话者或多个讲话者的多次重复的语音参数,经过长时间的训练得到的。 4、模式匹配 将输入语音的特征参数同训练得到的语音模式库进行比较分析,从而得到初步识别结果。根据模式识别方法的不同,用于语音识别系统时有统计模式识别法和句法模式识别法两类。 2022年8月16日星期二 第6页 5、后处理 在大词汇量连续语音识别系统中,为了提高识别正确率需要使用语言模型,利用语音识别单位之间连接时的相互制约的关系,采取统计方法与语法相结合的方法建立语言模型,达到限制识别器译码时的自由度,提高系统的性能。目前后处理在嵌入式语音系统中还很难使用。 2022年8月16日星期二 第7页 1.2 孤立词识别系统 孤立词识别系统的结构比较简单,其原理框图如图3.6所示。 2022年8月16日星期二 第8页 1.3语言模型 在语音识别中,一般采用统计的方法或统计与语法相结合的方法来寻找语言单位之间的约束关系,以建立语言模型。建立语言模型的根本目的在于限制识别器译码时的自由度。 图3.7是一个充分利用各种可能的知识信息的语音识别系统。图的左边为知识源,右边则为相应的语音或语言模型。 2022年8月16日星期二 第9页 2022年8月16日星期二 第10页 目前国际上公认采用多层次的方法是最好的识别战略。识别是根据测度计算的结果,由门限值决定在某层次上的最佳识别结果,逐层判定声学参数、单词、词法句法、语义等。 由于受到CPU计算速度和存储器容量等的限制,目前很难将语言模型应用到嵌入式语音识别系统中。 谢谢观看! 语音信号及单片机处理
2、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
3、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端星空体育官方入口 星空体育官网互通、版权登记。
4、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
民主生活会、组织生活会对照检查、批评和自我批评意见汇总(50条).docx
(2025春新版)部编版一年级下册道德与法治《这是我的家 》PPT课件.pptx
Android Studio应用程序设计第二版微课版张思民习题答案.docx
2025年郑州铁路职业技术学院单招职业适应性测试题库(综合题).docx
原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中星空体育官方入口 星空体育官网间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者