1.语音识别以IBM推出的ViaVoice为代表,国 内则推出Dutty 语音识别系统、天信语音识别 系统、世音通语音识别系统等。
2. 识别:将输入语音进行处理,提取特征参数, 和模式库中的模板进行比较匹配,作出判决。
并且将其特征矢量作为模板存入模板库。 在识别阶段,将输入语音的特征矢量依次与模板库
(1)发音的各个段构成相应的状态。 (3)基本单元发音速率(停留时间和转移时间)对应状 态转移概率(0.5)。 (2)声学变化(LPC倒谱)对应输出序列,概率分布成 混合高斯密度函数。
德国西门子公司推出的一种新洗衣机,洗衣物非 常专业,知道为什么样的脏衣物选择合适洗涤程序 和洗涤剂,而主人只需要口头命令即可,比如 “半个小时后再洗”。
与普通洗衣机的不同之处是安装星空体育官方入口 星空体育官网了语音识别芯 片,能根据用户的语音指令确定洗涤程序。
1.以所要识别的对象来分,有: (1)孤立词识别(字或词间有停顿,用于控制系统) (2)连接词识别(十个数字连接而成的多位数字识别 或由少数指令构成词条的识别,用于数据库查询、电 线)连续语音识别和理解(自然的说线)会话语音识别(识别出会话语言)
由于语音有较大的随机性,即使同一个人在不同时 刻的同一句话发的同一个音,也不可能具有完全相同 的时间长度,因此时间伸缩处理是必不可少的。
DTW用满足一定条件的时间规整函数,描述待识别 模式和参考模板的时间对应关系,求解两个模板匹配, 就是累积距离测度最小对应的规整函数。
3.语音的模糊性。说话者在讲话时,不同的词可能 听起来是相似的。这在英语和汉语中常见。 4.单个字母或词、字的语音特性受上下文的影响, 以致改变了重音、音调、音量和发音速度等。 5.环境噪声和干扰对语音识别有严重影响,致使识 别率低。
2. 数据库检索:对庞大的数据进行繁杂的检索和 查询,通过使用语音识别技术,将变得轻松、方便。
采用语音识别和语音合成技术,能与客户进行交互 式对话,帮助客户找到他们所需要的商品。一个动作 传感器可以启动系统,询问顾客“需要我帮你寻找什 么吗?”如果顾客回答说“我在找面包。系统将会告 诉顾客:“面包在第11过道,就是直接往前第3个过 道,我们今天有WHEATIO面包特惠,需要我为您打 印一张优惠券吗?
2.根据识别的词汇量来分,有: (1)大词汇(1000个以上的词汇,如会议系统) (2)中词汇(20~1000个词汇,如定票系统) (3)小词汇(1~20个词汇,如语音电线.根据讲话人的范围来分,有: (1)单个特定人 (2)多讲话人(有限的讲线)与讲话者无关
语音识别是指从语音到文本的转换,即让计算 机能够把人发出的有意义的话音变成书面语言。通 俗地说就是让机器能够听懂人说的话。
所谓听懂,有两层意思,一是指把用户所说的 话逐词逐句转换成文本;二是指正确理解语音中所 包含的要求,作出正确的应答。
语音识别技术是以语音为研究对象,涉及到生理 学、心理学、语言学、计算机科学以及信号处理等诸 多领域。
字层:每个字由音子串接而成,需要一个数据库来 描述每一个字如何用音子串接的。
语音层:每个音子用一个HMM模型及其相应的参 数来描述(状态及其状态间的转移)。
语音识别技术的一般概念 语音识别的原理和识别系统的组成 动态时间规整DTW 基于统计模型框架的识别法(HMM) 说话人识别 语种辨识
从技术人员演示 到实际参观者或用户试 用 用户对系统的评价基本在一分钟内完成
一、语音识别的步骤和框图 二、预处理 三、语音特征参数的提取 四、模式匹配
1.根据识别系统的类型选择能满足要求的一种识别 方法,采用语音分析技术预先分析出这种方法所要 求的语音特征参数,这些语音参数作为标准模式由 计算机存储起来,形成标准模式库,称为模板。这 个过程称为“学习”和“训练”。在某些识别系统 中,还备有专家知识库,其中存放由语言学家的各 种知识,如同音字判决规则、语法规则、语义规则 等。
1.对自然语言的识别和理解。首先必须将连续的讲 话分解为词、音素等星空体育官方入口 星空体育官网单位,其次要建立一个理解 语义的规则。
2.语音信息量大。语音模式不仅对不同的说话人不 同,对同一说话人也是不同的,例如,一个说话 人在随意说话和认真说话时的语音信息时不同的。 一个人的说话方式随着时间变化。