星空体育·(StarSky Sports)官方网站-星空官方认证

5语音识别-1ppt-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

5语音识别-1ppt

日期:2024-11-01 浏览: 

  Ⅳ语音识别本部分的内容Ⅳ语音识别(1)Ⅳ语音识别(2)(SpeechRecognition)是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。根本目的是研究出一种具有听觉功能的机器,能直接接受人的语音,理解人的意图,并做出相应的反映。从技术上看,它属于多维模式识别和智能接口的范畴。Ⅳ语音识别(3)Ⅳ语音识别(4)(Vocabulary)的大小分小词汇表系统:包括10~100个词条 中词汇表系统:包括100~1000个词条 大词汇表系统:至少包含1000个以上的词条按照发音方式分 孤立词(IsolatedWord)识别连接词(ConnectedWord)识别 连续语音(ContinuousSpeech)识别Ⅳ语音识别(5)(SpeakerDependent,SD)识别 非特定人(Speaker-Independent,SI)识别按照识别方法分模板匹配方法:DTW概率模型方法:HMMⅣ语音识别(6)(DynamicTimeWarping)是一种模板匹配技术,是模式识别中最常用的一种相似度计算与匹配方法。和计算两个标量的相似度欧式距和计算两个矢量的相似度经过预处理和特征提取后的语音可以看作矢量的序列Ⅳ语音识别(7)如何计算两个矢量序列X1和X2之间的相似度???一个直接的想法存在问题:长度不同,对不准DTW:将时间归正和距离侧度计算结合起来的一种非线性归正技术。Ⅳ语音识别(8)如何对准每一条从(1,1)到(M1,M2)路径都有一个累计距离,称为路径的代价。每一条路径都代表一种对齐情况。代价最小的路径就是所求——对准路径。Ⅳ语音识别(9)将对准问题,或者说将求两个语音段星空体育网站 星空体育首页的相似度问题,转化成了搜索代价最小的最优路径问题。事实上,在搜索过程中,往往要进行路径的限星空体育网站 星空体育首页制。(1)起点/终点的限制(2)连续性限制在此限制条件下,可以将全局最优化问题转化为许多局部最优化问题一步一步地来求解,这是动态规划(DynamicProgramming,简称DP)的思想。