星空体育·(StarSky Sports)官方网站-星空官方认证

汉语语音识别的现状与展望-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

汉语语音识别的现状与展望

日期:2024-11-02 浏览: 

  O 中 文 信 息处理 必汉 语 语 音 识 别的 现 状 与 展 望口 吴 文 虎8 0 年代 以 来,信 息 科 学 的发 展 速 度 与 对 社会的 巨 大 推动 作 用.超 出了 人 们 的 想 象,特 别是超 大 规 模集成 电路与微 型 计 算 机 的推 陈 出 新,更是 令 人叹 为 观 止。科 学 技 术是第 一 生产 力 的论 断 得 到 了最 为 透 彻 的 证 明。1 0 年 改革 开 放,我 国 的经 济 实 力 有 了 很大增长,在 信息 技 术 与产 业方面也 有 了长 足 的 进 步,汉字 信息 系 统 业已 达 到 国际 先 进水 平。进 入 9 0 年代,工业企 业的 管 理,军 事 方 面 的 应用 等,都 提...

  O 中 文 信 息处理 必汉 语 语 音 识 别的 现 状 与 展 望口 吴 文 虎8 0 年代 以 来,信 息 科 学 的发 展 速 度 与 对 社会的 巨 大 推动 作 用.超 出了 人 们 的 想 象,特 别是超 大 规 模集成 电路与微 型 计 算 机 的推 陈 出 新,更是 令 人叹 为 观 止。科 学 技 术是第 一 生产 力 的论 断 得 到 了最 为 透 彻 的 证 明。1 0 年 改革 开 放,我 国 的经 济 实 力 有 了 很大增长,在 信息 技 术 与产 业方面也 有 了长 足 的 进 步,汉字 信息 系 统 业已 达 到 国际 先 进水 平。进 入 9 0 年代,工业企 业的 管 理,军 事 方 面 的 应用 等,都 提 出了深化 中 文信 息 处 理 能 力的迫切 需 求。在 这 种形势下,包 括印 刷 体与 手 写 体 汉 字 识 别、语音 识 别 与合 成、图像 识 别 与 处理 等 声 文 图 智 能 化 人 机 接口 的研究,正 在 成 为 热点。信息 时 代 要 求 机 器 能 听 会说。语音识别、理解 与 合成有 着诱 人 的 前 景。这项技 术 除 可 用 作中 文 文 本 的 输 入 手 段 之 外,在 铁 路、民 航 部 门 可用 来 构 成 人 机 语音对 话 的无 人 管 理 问 询处;在民 政 部 门 构 成 口 呼 轮 椅控 制 系 统,供 残 疾 人 使用;在 公 安司 法部 门 用 作“声 纹”刑 事 侦 破系统;在 军事 院校 可 用 作 口 呼 语 音 的 训 练与 指 挥 系统 ;在高级 阶 段 可 以 形 成 由语音直 接输入输出的 自动翻 译 系统。让机 器 能 听 会 说,旨 在 把 人 类 快 速 传 送 和接 收 信 息 的 听 说 智 能赋 予 计算 机。用 听 和 说来交换 信息 有两个 突 出 的 优点:第 一,快,说 比 写约 快 1 0 倍,比 打 字 ( 英 语 ) 约 快4倍;第 二,使手解 放 出 来,可 于 听 说 同 时“并 行 处 理”其 他 的事。使 用 语 音 是 人机 对 话的 最 自 然 的 方式,也是 名 副 其 实的 对 话。但是,这项 研究涉 及到 多种学 科 的 许 多 难点,要 研究 人的发 声 机 理 和 听觉机 制;要 给 计算 机 配“发声 器 官”和“听觉 神 经” ;此 外,还要 给 计 算 机灌输 有 关 的 词 法、语 法、语义、语境和语 用 知识。当 然 它最 好 能 有 自 学 习 的功能。这 属 于交叉学 科,难 点 非常集中,且 对 计算 机的 运算速度 和 并行 处 理 能 力有 很 高的 要19 9 2 年第 6 期求。尽 管 如 此,该 项 技 术 前 程 远大,已 为世界 上许 多 国 家的科技 工 作 者 所 瞩 目。一、语 音识别 技 术 概述为 了 给出语音识 别 研 究 各个 阶 段在 技 术 上的 难 易 情 况,我 们 画 出图一,每 一 阶段认 为 是下述 三 种情 况 的 组 合:` l )使 用 人 ( 特 定 人 还是 非特 定 人 );( 2 ) 词 汇 量 ( 小 还是 大 );( 3 )发音 方 式( 孤 立 词还 是 连 续语 音 )。在 这 张 图 中 我们还 没有 加 上 使 用 环 境,如果 噪声很 大,再完善 的 识 别系 统 也不 可 能 有 好 的 表 现。现 在我 们 只 考 虑一般 的 较好的 使 用 环 境。图一 可 以 组 合 出 八 种情况:小 小 词 汇 星空体育 星空体育平台量 大 词 汇 量连 续 i 台 i 司1 ,特定 人 小词 汇 量孤 立词 的识别。这种情况 相对 容易 些,它 是供 专 人 使 用 的系统,使 用 前要 由 使 用 者 对 系 统进 行 训 练,让 系 统记 住 预 先选择 好 的几 十 个 孤立的单 字或单 词 的 发音特征。识 别时 由 使 用 者将 单字或单 词 孤 立 地 读入系统。2.特 定 人 大 词汇量 孤星空体育 星空体育平台 立 词 的识 别。这 种 情况 有 相 当 难度,词 汇 量 从 几千 到 几万.识别 时 极易 混 淆。3.非 特 定人小 词 汇 量 孤 立词 的 识别。这 种情 况 也 有相 当 难 度,与1 不 同 的是,它 要供 许 多人 使 用,而 且 不 需要 使 用 者 训 练 系 统。人 的 发音是 有 差 别 的,系统 要 做 到 谁说都能 听 懂,应 具 备特 殊 的功能,即获取 众 多 说 话 人 共 性 特 征,并在处理 中加 以 强 化,使同 一 个 语音 的 特 征 ( 不 管 是一3 5一i . 1001 -8476.1992.06.015