星空体育·(StarSky Sports)官方网站-星空官方认证

语音识别技术原理-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

语音识别技术原理

日期:2024-09-25 浏览: 

  其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。

  1920年代生产的Radio Rex玩具狗可能是最早的语音识别器

  最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。

  语音识别技术的最重大突破是隐马尔科夫模型Hidden Markov Model的应用

  通过交换字母顺序,他们用一个含义广泛的词汇定义了一个新的信号处理技术,倒频谱的计算通常使用快速傅立叶变换。

  使用矢量量星空体育登录入口 星空体育在线官网化法,语者的一套短期训练的特征向量可以直接用来描绘语者的本质特征。

  通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。

  根据第一步所得语音标号序列得到一个语音基元网格,从词典得到有效的词序列,也可结合句子的文法和语义同时进行。

  语音信号的端点检测是进行语音识别中的一个基本步骤,它是特征训练和识别的基础。

  所谓端点检测就是在语音信号中的各种段落(如音素、音节、词素)的始点和终点的位置,从语音信号中排除无声段。

  隐马尔可夫法(HMM)是70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破。

  一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程

  HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程

  将语音信号波形的k个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对矢量进行量化。

  量化时,将k维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为距离最小的区域边界的中心矢量值。

  矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量,实现最大可能的平均信噪比。

  人工神经网络(ANN)本质上是一个自适应非线性动力学系统,模拟了人类神经活动的原理,具有自适应性、并行性、鲁棒性、容错性和学习特性

  由于ANN不能很好的描述语音信号的时间动态特性,所以常把ANN与传统识别方法结合,分别利用各自优点来进行语音识别。

  为了保护您和被举报人的权利,请您慎重填写举报原因,我们会认真核实调查。