语音识别概述 摘要: 回顾了语音识别技术的发展历史 ,描述了语音识别系统的基本原理 ,介绍了语音识别的几种基本方法 ,并对语音识别技术面临的问题和发展前景进行了讨论。 一、语音识别的概念 语音识别就是就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。 语音识别技术主要包括特征提取技术、 模式匹配准则及模型训练技术三个方面。 广泛意义上的语音识别按照任务的不同可以分为 4 个方向:说话人识别、关键词检出、语言辨识和语音识别[ 1] 。 二、语音识别的发展史 早在计算机发明之前, 自动语音识别的设想就已经被提上了议...
语音识别概述 摘要: 回顾了语音识别技术的发展历史 ,描述了语音识别系统的基本原理 ,介绍了语音识别的几种基本方法 ,并对语音识别技术面临的问题和发展前景进行了讨论。 一、语音识别的概念 语音识别就是就是让星空体育网站 星空体育首页机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。 语音识别技术主要包括特征提取技术、 模式匹配准则及模型训练技术三个方面。 广泛意义上的语音识别按照任务的不同可以分为 4 个方向:说话人识别、关键词检出、语言辨识和语音识别[ 1] 。 二、语音识别的发展史 早在计算机发明之前, 自动语音识别的设想就已经被提上了议事日程, 早期的声码器可被视作语音识别及合成的雏形。 1920 年代生产的 Radio Rex 玩具狗可能是最早的语音识别器。 1952 年贝尔研究所 Davis 等人研究成功了世界上第一个能识别 10 个英文数字发音的实验系统。 1960 年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间弯折 Dynamic Time Warp 技术。语音识别技术的最重大突破是隐含马尔科夫模型 Hidden Markov Model 的应用。从 Baum 提出相关数学推理,经过 Labiner 等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统 Sphinx。此后严格来说语音识别技术并没有脱离 HMM 框架 [ 2] 。 三、语音识别的当前应用 语音识别技术的应用包括语音拨号、 语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合, 可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别的应用领域非常广泛, 常见的应用系统有: 语音输入系统,相对于键盘输入方法,它更符合人的日常习惯也更自然、 更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域; 智能对话查询系统,根据客户的语音进行操作, 为用户提供自然、友好的数据库检索服务, 例如家庭服务、宾馆服务、旅行社服务系统、 订票系统、医疗服务、银行服务、股票查询服务等等。 四、语音识别的主要研究方法分类 4.1 动态时间规整 (DTW) DTW 是把时间规整和距离测度计算结合起来的一种非线] ,是较早的一种模