星空体育·(StarSky Sports)官方网站-星空官方认证

转载语音识别技术原理简介-星空体育官方网站

转载语音识别技术原理简介

日期：2025-05-20 浏览：　

　　模型并引入语言模型作为词间转移概率，形成循环结构，用Viterbi算法进行

　　订票、数据库检索等等。其前端是一个语音识别器，识别产生的N-best候选或

　　料来修正或变换原有的说话人无关(SI)模型，从而使其成为说话人自适应(SA)

　　特征方法有从倒谱矢量中减去其长时平均值和RASTA滤波，模型方法有倒谱平

　　数据库(DB)，用于车载设备用，包括：将发出的声音作为发声数据输出的麦克

　　(1)；用于识别在类别(DB)中作为检索对象的类别的词汇的第一声音识别词典

　　(2a)；用于识别作为检索对象以外的类别的词汇的第二声音识别词典(2b)；通

　　识别发出的声音的声音识别部(3)；在从声音识别部传送来的作为识别结果的词

　　离测度)以及专家知识(如构词规则、语法规则、语义规则等)，计算输入特征与

　　库存模式星空体育星空体育平台之间的相似度(如匹配距离、似然概率)，判断出输入语音的语意信息。

　　(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按

　　期的声码器可被视作语音识别及合成的雏形。而1920 年代生产的Radio Rex

　　座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T 贝尔实验室开发

　　的Audrey 语音识别系统，它能够识别10 个英文数字。其识别方法是跟踪语音

　　语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model 的

　　应用。从Baum 提出相关数学推理，经过Labiner 等人的研究，卡内基梅隆大学

　　提供了从采集的语音信号(记为S)到特征序列O 的映射。而声学模型本身定义

　　系统的相关性考虑，可以将识别系统分为3 类：(1)特定人语音识别系统：仅考

　　常要用大量不同人的语音数据库对识别系统进行学习；(3)多人的识别系统：通

　　系统：孤立词识别系统要求输入每个词后要停顿；(2)连接词语音识别系统：连

　　接词输入系统要求对每个词都清楚发音，一些连音现象开始出现；(3)连续语音

　　汇量语音识别系统。通常包括几十个词的语音识别系统。(2)中等词汇量的语音

　　识别系统。通常包括几百个词到上千个词的识别系统。(3)大词汇量语音识别系

　　(System on Chip，SOC)的出现，为其广泛应用创造了极为有利的条件。本文将

　　式。此外，对汽车的卫星导航定位系统(GPS)的操作，汽车空调、照明以及音响

　　PDA 的体积很小，人机界面一直是其应用和技术的瓶颈之一。由于在PDA 上使

　　这种方法仍然让用户感到很不方便。现在业界一致认为，PDA 的最佳人机交互

　　术的提高，可以预见，在不久的将来，语音将成为PDA 主要的人机交互界面。

　　不同的特点。大词汇量连续语音识别系统一般都是基于PC 机平台，而语音识别

　　至多台PC 机相比起来，其运算速度，存储容量都非常有限，因而这些由专用芯

　　1、多为中、小词汇量的语音识别系统，即只能够识别10~100 词条。只有

　　间的偏移通常取帧长的1/2 或1/3。通常要对信号进行预加重以提升高频，对