星空体育·(StarSky Sports)官方网站-星空官方认证

转载语音识别技术原理简介-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

转载语音识别技术原理简介

日期:2025-05-20 浏览: 

  模型并引入语言模型作为词间转移概率,形成循环结构,用Viterbi算法进行

  订票、数据库检索等等。其前端是一个语音识别器,识别产生的N-best候选或

  料来修正或变换原有的说话人无关(SI)模型,从而使其成为说话人自适应(SA)

  特征方法有从倒谱矢量中减去其长时平均值和RASTA滤波,模型方法有倒谱平

  数据库(DB),用于车载设备用,包括:将发出的声音作为发声数据输出的麦克

  (1);用于识别在类别(DB)中作为检索对象的类别的词汇的第一声音识别词典

  (2a);用于识别作为检索对象以外的类别的词汇的第二声音识别词典(2b);通

  识别发出的声音的声音识别部(3);在从声音识别部传送来的作为识别结果的词

  离测度)以及专家知识(如构词规则、语法规则、语义规则等),计算输入特征与

  库存模式星空体育 星空体育平台之间的相似度(如匹配距离、似然概率),判断出输入语音的语意信息。

  (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按

  期的声码器可被视作语音识别及合成的雏形。而1920 年代生产的Radio Rex

  座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T 贝尔实验室开发

  的Audrey 语音识别系统,它能够识别10 个英文数字。其识别方法是跟踪语音

  语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model 的

  应用。从Baum 提出相关数学推理,经过Labiner 等人的研究,卡内基梅隆大学

  提供了从采集的语音信号(记为S)到特征序列O 的映射。而声学模型本身定义

  系统的相关性考虑,可以将识别系统分为3 类:(1)特定人语音识别系统:仅考

  常要用大量不同人的语音数据库对识别系统进行学习;(3)多人的识别系统:通

  系统:孤立词识别系统要求输入每个词后要停顿;(2)连接词语音识别系统:连

  接词输入系统要求对每个词都清楚发音,一些连音现象开始出现;(3)连续语音

  汇量语音识别系统。通常包括几十个词的语音识别系统。(2)中等词汇量的语音

  识别系统。通常包括几百个词到上千个词的识别系统。(3)大词汇量语音识别系

  (System on Chip,SOC)的出现,为其广泛应用创造了极为有利的条件。本文将

  式。此外,对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响

  PDA 的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA 上使

  这种方法仍然让用户感到很不方便。现在业界一致认为,PDA 的最佳人机交互

  术的提高,可以预见,在不久的将来,语音将成为PDA 主要的人机交互界面。

  不同的特点。大词汇量连续语音识别系统一般都是基于PC 机平台,而语音识别

  至多台PC 机相比起来,其运算速度,存储容量都非常有限,因而这些由专用芯

  1、多为中、小词汇量的语音识别系统,即只能够识别10~100 词条。只有

  间的偏移通常取帧长的1/2 或1/3。通常要对信号进行预加重以提升高频,对