星空体育·(StarSky Sports)官方网站-星空官方认证

语音识别系统简述-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

语音识别系统简述

日期:2025-06-01 浏览: 

  版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

  1、语音识别电科 09041语音识别系统简述语音识别系统的本质就是一种模式识别系统,它包括特征提取、模式匹配、参考模式库等基本单元。由于语音信号是一种典型的非平稳信号,加之呼吸气流、外部噪音、电流干扰等使得语音信号不能直接用于提取特征,而要进行前期的预处理。预处理过程包括预滤波、采样和量化、分帧、加窗、预加重、端点检测等。经过预处理的语音数据就可以进行特征参数提取。在训练阶段,将特征参数进行一定的处理之后,为每个词条得到一个模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。2语音识别原理框图语音信号采集语音信

  2、号预处理端点检测识别参数提取识别参数匹配识别模板信号待识别信号识别结果语音信号预处理端点检测识别参数提取3语音信号预处理分帧:在实际处理时可以将语音信号分成很小的时间段(约1030ms5,7),称之为“帧”,作为语音信号处理的最小单位,帧与帧的非重叠部分称为帧移,而将语音信号分成若干帧的过程称为分帧。预加重:对于语音信号的频谱,通常是频率越高幅值越小,在语音信号的频率增加两倍时,其功率谱的幅度下降6dB。因此必须对高频进行加重处理,一般是将语音信号通过一个一阶高通滤波器1-0.9375z-1,即为预加重滤波器,其目的是滤除低频干扰。加窗:为了保持语音信号的短时平稳性,利用窗函数来减少由截断处理

  4、、词的起始点及结束点,从而只存储和处理有效语音信号。1、短时能量2、短时过零率3、双门限端点检测6短时能量:语音和噪声的主要区别在它们的能量上。语音段的能量比噪声段的大,语音段的能量是噪声段能量叠加语音声波能量的和。短时过零率:短时过零表示一帧语音信号波形穿过横轴(零电平)的次数。对于连续语音信号,过零意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值的改变符号则称为过零。双门限端点检测:双门限端点检测顾名思义需要两级检测,即短时能量检测和短时过零率检测。7语音train_0.wav的时域分析参数8语音train_0.wav的端点检测结果9语音识别参数的提取经过预处理的语音数据就可以进

  5、行特征参数提取,特征参数的好坏将直接影响系统的性能和效率,提取出来的参数直接用来进行语音识别。对特征参数的要求:(1)提取的特征参数能有效地代表语音特征,具有很好的区分性;(2)各阶参数之间有良好的独立性;(3)特征参数要计算方便,最好有高效的计算方法,以保证语音识别的实时实现。LPC与LPCC系数MFCC系数10LPC与LPCC系数:LPC(线性预测系数)模拟人发音器官的声管模型,是一种基于语音合成的参数模型。在语音识别系统中很少直接使用LPC系统,而是由LPC系数推出的另一种参数LPCC。LPCC(线性预测倒谱系数)是LPC在倒谱域中的表示。LPCC的优点是计算量小,易于实现,对元音有较好

  6、的描述能力,缺点是对辅音描述能力较差。MFCC系数:人的听觉系统是一个特殊的非线性系统,它响应不同频率信号的灵敏度是不同的,基本上是一个对数的关系。近年来,一种能够比较充分利用人耳的这种特殊感知特性的系数得到了广泛应用,这就是Mel尺度倒谱系数(即MFCC)。大量研究表明,MFCC系数能够比LPCC参数更好地提高系统的识别性能。11DTW算法实现DTW(Dynamic Time Warping,动态时间规整)是语音识别中较为经典的一种算法。在实现小词汇表孤立词识别系统时,其识别率及其它指标与HMM算法实现几乎等同。又由于HMM算法复杂,在训练阶段需要提供大量的语音数据通过反复计算才能得到模型参

  7、数,而DTW算法本身既简单又有效,因此在特定的场合下获得了广泛的应用。12DTW算法原理DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数im=(in),将测试矢量的时间轴n非线性地映射到参考模板的时间轴m上,并使该函数满足:D是处于最优时间规整情况下两矢量的距离。由于DTW不断地计算两矢量的距离以寻找最优的匹配路径,所以得到的是两矢量匹配时累积距离最小所对应的规整函数,这就保证了它们之间存在的最大声学相似性。算法实质为运用动态规划的思想,利用局部最佳化的处理来自动寻找一条路径,沿着这条路径,两个特征矢量之间的累积失真量最小,从而避免由于时长不同而可能引入的误差。13

  1. 本站所有资源如无特殊说星空体育网站 星空体育首页明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。

  2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。

  3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。

  5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。

  7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

  T/CEPPEA 5029-2023电力建设工程地质灾害危险性评估技术要求

  T/CMEAS kDa单甲氧基聚乙二醇丙醛(M-ALD-20K)质量要求与测试方法

  【7语期末】芜湖市无为市2023-2024学年七年级下学期期末语文试题