模型并引入语言模型作为词间转移概率,形成循环结构,用Viterbi算法进行
订票、数据库检索等等。其前端是一个语音识别器,识别产生的N-best候选或
料来修正或变换原有的说话人无关(SI)模型,从而使其成为说话人自适应(SA)
特征方法有从倒谱矢量中减去其长时平均值和RASTA滤波,模型方法有倒谱平
数据库(DB),用于车载设备用,包括:将发出的声音作为发声数据输出的麦克
(1);用于识别在类别(DB)中作为检索对象的类别的词汇的第一声音识别词典
(2a);用于识别作为检索对象以外的类别的词汇的第二声音识别词典(2b);通
识别发出的声音的声音识别部(3);在从声音识别部传送来的作为识别结果的词
离测度)以及专家知识(如构词规则、语法规则、语义规则等),计算输入特征与
库存模式星空体育 星空体育平台之间的相似度(如匹配距离、似然概率),判断出输入语音的语意信息。
(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按
期的声码器可被视作语音识别及合成的雏形。而1920 年代生产的Radio Rex
座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T 贝尔实验室开发
的Audrey 语音识别系统,它能够识别10 个英文数字。其识别方法是跟踪语音
语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model 的
应用。从Baum 提出相关数学推理,经过Labiner 等人的研究,卡内基梅隆大学
提供了从采集的语音信号(记为S)到特征序列O 的映射。而声学模型本身定义
系统的相关性考虑,可以将识别系统分为3 类:(1)特定人语音识别系统:仅考
常要用大量不同人的语音数据库对识别系统进行学习;(3)多人的识别系统:通
系统:孤立词识别系统要求输入每个词后要停顿;(2)连接词语音识别系统:连
接词输入系统要求对每个词都清楚发音,一些连音现象开始出现;(3)连续语音
汇量语音识别系统。通常包括几十个词的语音识别系统。(2)中等词汇量的语音
识别系统。通常包括几百个词到上千个词的识别系统。(3)大词汇量语音识别系
(System on Chip,SOC)的出现,为其广泛应用创造了极为有利的条件。本文将
式。此外,对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响
PDA 的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA 上使
这种方法仍然让用户感到很不方便。现在业界一致认为,PDA 的最佳人机交互
术的提高,可以预见,在不久的将来,语音将成为PDA 主要的人机交互界面。
不同的特点。大词汇量连续语音识别系统一般都是基于PC 机平台,而语音识别
至多台PC 机相比起来,其运算速度,存储容量都非常有限,因而这些由专用芯
1、多为中、小词汇量的语音识别系统,即只能够识别10~100 词条。只有
间的偏移通常取帧长的1/2 或1/3。通常要对信号进行预加重以提升高频,对