概括的说,语音识别的原理其实并不难理解,原理上和指纹识别的原理 相同:设备收集目标语音,然后对收集到的语音进行一系列处理,得到 星空体育网站 星空体育首页目标语音的特征信息,然后让特征信息与数据库中已存数据进行相似度 搜索比对,评分高1、语音识别实现原理:数据库
概括的说,语音识别的原理其实并不难理解,原理上和指纹识别的原理 相同:设备收集目标语音,然后对收集到的语音进行一系列处理,得到 目标语音的特征信息,然后让特征信息与数据库中已存数据进行相似度 搜索比对,评分高者即为识别结果。然后通过其他系统的接入来完成设 备的语音识别功能。
庞大的语言数据库难以放置于星空体育网站 星空体育首页移动端,这也是几乎所有手机语音助手使 用时需要联网的原因。语音识别发展到现在也不是没有离线版,但我们 不难发现,离线版的准确率是要远远低于在线版的。另外,刚才我们提 到不少语音厂商都宣称准确率达到90%以上,这可以说是十分了不起 的,不夸张的说,这时候每提升1个百分比的准确率,都是质的飞跃。 这不仅要相当完善的数据库,满足这样的准确率还得效率较高的识别提 取算法和自学习系统。
冈。才我们提到了识别提取算法和自学习系统,在这里我们不妨简单了解 一下它们的工作过程:首先语音识别系统对收集到的目标语音进行预处 理,这个过程就已经十分复杂,包含语音信号采样、反混叠带通滤波、 去除个体发音差异和设备、环境弓I起的噪声影响等等。之后对处理的语 音进行特征提取。
我们知道,声音的本质是震动,它可以由波形表示,识别则需要对波进 行分帧,多个帧构成一个状态,三个状态构成一个音素。英语常用音素 集是卡内基梅隆大学的一套由39个音素构成的音素集,汉语一般直接 用全部声母和韵母作为音素集,另外汉语识别还分有调音调。之后通过 音素系统合成单词或者汉字。当然,之后的匹配