精品文档,助力人生,欢迎关注小编! 语音识别技术原理概述 摘 要:语音识别技术作为信息社会向智能化发展的关键技术之一,对人们的生活产生着广泛的影响,具有重要的研究意义和实用价值。本文概括介绍了语音识别技术和语音识别技术系统的实现原理,并对语音识别技术的发展趋势做了简单的阐述。 关键词:语音识别;特征参数提取;隐马尔可夫模型 0 引言 语音识别作为一门交叉学科,近30年来得到迅速的发展,逐渐由实验室技术向市场产品转化,越来越多地应用到人们的生活中。语音识别因为具有方便快捷、易于控制的优势,会被应用到越来越多的领域中,对人们的生活产生更广泛的影响。 1 语音识别技术概述 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术是以语音信号为研究对象,涉及信号处理、模式识别、概率论和信息论、人工智能等多个领域。 1.1 语音识别系统分类方式 语音识别技术具有多种分类方式,常见的有根据识别对象分类、是否针对特定发音人和待识别语音的词汇量大小鳳方式。 根据识别的对象不同,可以分为孤立词识别,关键词识别和连续语音识别三类。其中,孤立词识别的任务是识别事先已知的孤立的词;关键词识别的任务是检测连续语音星空体育官方入口 星空体育官网中已知的若干关键词的位置,但并不识别全部文字;连续语音识别的任务则是识别任意的连续语音。 根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别。特定人语音识别只能识别一个或几个人的语音,而非特定人语音识别则可以识别任何人的语音。非特定人语音识别系统更符合实际需要,但实现难度更大。 根据待识别语音的词汇量大小,可以分为小词汇量、中等词汇量和大词汇量语音识别系统。小词汇量语音识别系统的识别范围为几十个词,中等词汇量的语音识别系统的识别范围为几百个词到千个词,而大词汇量语音识别系统的识别范围为几千到几万个词。 2 语音识别系统实现原理 不同语音识别系统的具体实现细节不同,但基本的技术原理相似。一个基本的语音识别系统主要包括语音识别单元的选取、特征提取技术、模式匹配准则和模型训练技术四个部分。 2.1 语音识别单元的选取 语音识别单元有单词句、音节和音素三种。首先需要根据研究的具体任务确定识别的单元:单词句单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统;音节单元多见于汉语语音识别;音素单元以前多见于英语语音识别的研究中。 2.2 特征参数提取技术 特征参数提取的目的是从语音信号中提取出对语音识别有用的信息,即去除与识别无关的冗余信息,保留与识别有关的信息。目前应用最广泛的特征参数提取技术为线性预测(LP)分析技术,许多成熟的语音识别系统都采用基于LP技术提取的倒谱参数。Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱也是常用的特征参数提取方法。 2.3 模型训练及模式匹配技术 模型训练是指根据一定的准则,从大量己知模式中获取表征该模式本质特征的模型参数,语音识别就是通过这些提取的特征参数所建立的。模式匹配是按照一定的准则,使未知模式与模型库中的某一个模型获得最佳匹配。常用的模型训练及模式匹配技术有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)和人工神经元网络(ANN)。 动态时间规整技术是基于动态规划的思想,解决了发音长短不一的模板匹配问题,广泛应用在孤立词的语音识别中,但不适合连续语音和大词汇量识别系统。 隐马尔可夫模型由相互关联的两个随机过程共描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的链,另一个是与链的每一状态相关联的观察矢量的随机过程(可观测的)。 人工神经元网络的发展为语音识别的实现提供了新的解决方案,人工神经元网络模拟了人类神经元活动的原理,具有自学、联想、对比、推理星空体育官方入口 星空体育官网和概括等能力。这些能力都是隐马尔可夫模型不具备的,但人工神经元网络不具有隐马尔可夫模型的动态时间规整性能。所以如果将两者的优点结合起来,可以提高整个模型的鲁棒性。 3 语音识别技术发展趋势 目前,各种形式的隐马尔可夫模型和算法日趋成熟,以它为基础形成了语音识别的整体框架模型,统一了语音识别中声学层和语音学层的算法结构,以概率的形式将声学层中得到的信息和语音学层中已有的信息结合在一起。 另外,通过语音命令控制可以使原本需要手工操作的工作用语音来完成。因此,语音命令控制可广泛用于家电语音遥控
2、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
3、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
4、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
期末测试卷(二)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
期末测试卷(三)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
期末测试卷(二)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
期末测试卷(三)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
期末测试卷(一)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
期末测试卷(一)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
2021年中医执业(助理)医师资格考试实践技能病案例分析易混淆题(学)(1).docx
2021年中医执业(助理)医师资格考试案例分析押题30道word版.docx
惠州市贝特瑞新材料科技有限公司年产8万吨新材料锂电负极扩建项目环评报告书.pdf
原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者