星空体育·(StarSky Sports)官方网站-星空官方认证

语音识别概论-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

语音识别概论

日期:2026-01-24 浏览: 

  语音识别(提取或匹配语义)、语音压缩(高效存储、传输语音信号)、语音合成(输出自然可懂的语音信号)、语音增强(提高信噪比、加重语音成分)息息相关。

  60年代-LP较好地解决了语音信号产生模型,DP则有效解决了不等长语音的匹配问题。

  70年代-DTW(DynamicTimeWarp)技术基本成熟,VQ和HMM理论;实现了基于LPC和DTW技术相结合的特定人孤立语音识别系统。

  80年代-HMM模型和人工神经元网络(ANN)在语音识别中成功应用。1988年美国CMU大学基于VQ/HMM开发SI-CSR系统SPHINX。

  采用离散概率输出的H星空体育登录入口 星空体育在线官网MM和VQ相配合,将ot经过矢量量化后,输出相应VQ码本中码字的离散概率。

  相当于离散HMM和连续HMM的混合。状态输出的特征向量是连续的,也是用多个高斯分布的加权和来近似概率分布函数,但是星空体育登录入口 星空体育在线官网用来作加权和的高斯函数的集合是固定的,类似于对高斯密度函数建立了“码本”,各个状态输出概率密度之间不同的是对“码本”中各个高斯密度函数的加权系数。

  汉字是汉语的最小语言单位,所有的汉字的发音都是单音节(monosyllable)