滤波结合作为语音识别的前端处理方法, 并选用具有抗噪性的 M C F C特征参数。将上 述方法应用于 基 于隐 马 尔可 夫模 型 ( HMM) 的孤 立词 -  ̄ 系统 中, /J 7' .l 结合使 用 N IE -2提 供 的四种 噪 声进 行 测 试 , OS X9
从语音信号 中去除共振峰信息 以跟 踪声调信 息。线性 预测 分 析具有高效 的计算方 法 , 因此线性 预测分 析广泛用 于语音 编
素曰 为 上 的有限子集 , 即曰c z , 关 于原点 的对称 集合为 , l 曰
B= i : ’b b∈B}曰关于点的平 移集合 为 B[ , ]= { : b+ b∈B, ∈Z. , r 则 )关于 曰的基本形态变换定义 如下 : }
其 中,j 。 是线 选 择合适 的线性预 测 。 阶数 p, 该模 型频 率响应 的幅度谱 就是对 语音信 号频谱 包络 的估计 。 L C分析 的全 极点 性质 能 够精 确地 估 计语 音 信号 的谱 P 峰, 但是精确度受信号类 型 的影响很 大。对符合 全极点 模 型
( a e edo h t i cr: h i w ia@ o l o ) d ma . n
要 : 语音 识 别 系统 中信 号 的抗噪 前端 处理 方 法进行 了研 究 。将 线 性 预 测 ( P 分析 与 形 态 对 L)
构 元素 , 中 , 元素 的形 状和 取值 将 直接影 响变 换 的结 其 结构 果 。就 被处理信 号而言 , 学形态变 换 可分为二值 形态变 换 数 和 灰度形态变换 。灰 度形态变换 是一 种极值 运算 , 其对 象是
的语音来说精 度很 高 , 但对于鼻音和不少辅音来 说 ,P L C对谱 峰带宽 的估计 一般都 超限了。
多 值信号。最基本的灰度形态 变换有形 态和 ( 膨胀 ) 形 态差 、
和数学形态滤波对原 始语音进 行语音 增强 , 作为语 音识别 的 前端处理 。在此基础 上进行特 征提取 , 对训 练用语音 以及 测 试用语音进行相 同的预处理及 特征提取 , 并在特定人 、 小词 汇 量和孤立词识别条件下进行 了实验 。在相 同的实验环境下 与 基线系统的性能进行 比较 , 结果表 明 , 采用 星空体育官方入口 星空体育官网该方 法后 , 系统对 干净语音及 带 噪语 音 的 识别 率 均有 提 高 , 信 噪 比不低 于 当 1d 5 B时识 别率 提高了 1 . %。 22
文章编号 :0 1 9 8 (0 7 S —0 3 0 10 — 0 1 2 0 ) 1 18— 2
在数字信号 处理领域 中 , 学形 态学主要用 于非 线性 变 数 换 , 于集 合理 论来 研究 图像 , 了非常有效 的非 线性 滤 并基 提供
波技术 。该技术 只取决 于基元 的局 部形状 特征 , 因此 比传 统
并 提供有关基元 的几何特 征信息 , 因此这种 非线 性 的滤波 器 能够有效地消除噪声而保 留原基元 的一些必要形状特征 。 2 1 离散形态变换 . 语音信号处理的是数字信 号 , 因此需 要将数 学形态 学定
线性 预测分析 常采用 自回归 时域 模型或 全 极点 频谱 模 型。线性 预测模 型能够有效 地建模 共振峰 , 其逆 滤波器 能够
形 态滤 波器 的基 础 , 对一维语音 信号 的处 理采用 函数 一集合 间的离 散灰度形 态变换 。 . 设 )为定义在 上 的离散 函数 , : z, 即 Z 一 结构元
关键词 : 语音-  ̄ ; / J 抗噪性 ; e, ,l 数学形态滤波; 线性预测分析 中图分 类号 : N 1 . 文献 标识 码 : T 9 23 A
目前 , 于 隐 马 尔 可 夫 模 型 ( idn Makv Moe, 基 Hd e ro dl H MM) 的语音识别系 统是该 领域 研究 的主流 , 它对 纯净 语音 的识别 可以达到很好的精度。但是背景噪声对语音特征的影 响以及模 型参数 的失配 , 使得系统在噪声环境 中的性能恶 化。 因此 , 前端的消噪过程 显得 十分重要 。将 语音增 强作为 一种 预处理手段 , 能有效解 决噪声 污染 。本文对 噪声 环境下 的语