语音识别概论

日期：2026-01-24 浏览：　

　　语音识别（提取或匹配语义）、语音压缩（高效存储、传输语音信号）、语音合成（输出自然可懂的语音信号）、语音增强（提高信噪比、加重语音成分）息息相关。

　　60年代－LP较好地解决了语音信号产生模型,DP则有效解决了不等长语音的匹配问题。

　　70年代－DTW（DynamicTimeWarp）技术基本成熟，VQ和HMM理论；实现了基于LPC和DTW技术相结合的特定人孤立语音识别系统。

　　80年代－HMM模型和人工神经元网络（ANN）在语音识别中成功应用。1988年美国CMU大学基于VQ/HMM开发SI-CSR系统SPHINX。

　　采用离散概率输出的H 星空体育登录入口星空体育在线官网MM和VQ相配合，将ot经过矢量量化后，输出相应VQ码本中码字的离散概率。

　　相当于离散HMM和连续HMM的混合。状态输出的特征向量是连续的，也是用多个高斯分布的加权和来近似概率分布函数，但是星空体育登录入口星空体育在线官网用来作加权和的高斯函数的集合是固定的，类似于对高斯密度函数建立了“码本”，各个状态输出概率密度之间不同的是对“码本”中各个高斯密度函数的加权系数。

　　汉字是汉语的最小语言单位，所有的汉字的发音都是单音节（monosyllable）

星空体育·(StarSky Sports)官方网站-星空官方认证