维普资讯语 音 识 别 的 发 展 现 状 中国科学院声学研究所研究员 俞铁城‘‘语音识爿的研究工作可以追溯翻2 0世纪5 0年代AT&T贝尔实童的Audry系统. 它是第一个可以识爿十个英文数字的语音识爿系统o 20世纪80年代末.奠着实宣语音识嗣研究的巨大突破.计算机技术.软件技术和存储技术突飞猛进的发■;语音技术的商业应用开始掀起浪潮。为企业.银行.电信.航空j圈L其它领域带来更好.更新的业务和服务方式。很多专素都认为语音识嗣技术是2000年至2010年向信JI技术领域十大重要的科技发■技术之一。语音识别基础让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。语音识...
维普资讯语 音 识 别 的 发 展 现 状 中国科学院声学研究所研究员 俞铁城语音识爿的研究工作可以追溯翻2 0世纪5 0年代AT&T贝尔实童的Audry系统. 它是第一个可以识爿十个英文数字的语音识爿系统o 20世纪80年代末.奠着实宣语音识嗣研究的巨大突破.计算机技术.软件技术和存储技术突飞猛进的发■;语音技术的商业应用开始掀起浪潮。为企业.银行.电信.航空j圈L其它领域带来更好.更新的业务和服务方式。很多专素都认为语音识嗣技术是2000年至2010年向信JI技术领域十大重要的科技发■技术之一。语音识别基础让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。语音识别是~门交叉学科,关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。语音识别技术就是让机星空体育官方入口 星空体育官网器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:(1)语音特征提取:其目的是从语音波形中提取出随时间变化的语音特征序列。(2)声学模型与模式匹配(识别算法l声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型通常由获取的语音特征通过训练产生,目的是为每个发音建立发音模板。在识别时将未知的语音特征同声学模型(模式)进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大的影响。通信市瑶・2oo5年5月(3)语义理解:计算机对识别结果进行进行语法、语义分析。明白语言的意义以便作出相应的反应。通常是通过语言模型来星空体育官方入口 星空体育官网实现。语义理解作为一个相对独立研究领域,是以语言作为理解的对象,也有很多方法和成果。目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结构命令语言模型。作为一个完整的语音应用系统。鉴于识别输出有别于普通意义上的语言,如何选择理解的方式以达到最佳效果,也是一个重要环节。语音识别技术的应用语音识别过程实际上是一种认识过程。就像人们听语音时,并不把语音和语言的语法结构、语义结构分开来,因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程。对机器来说,识别系统也要利用这些方面的知识,只是鉴于语音信号的多变性,动态性,瞬时性,语音识别技术与人类的大脑还有一定的差距。因此在语言识别技术选择,其应用模式和系统开发上,都需要专业的设计和调试,以实现最好的应用效果。1996年9月,CharlesSchwab开通了首个大规模商用语音识别应用系统:股票报价系统。该系统也是第一个金