两个阶段: 训练和识别。不 管是训 练还是 识别, 都必须 对 输入语音预处理和特征提 取。训练 阶段所 做的 具体工 作 是通过用户输入若干次训练语音, 经过预处理和特征 提取 后得到特征矢量参数, 最后通过特征建模达到建立训 练语 音的参考模型库的目的。而 识别阶 段所做 的主 要工作 是 将输入语音的特征矢量参 数和参考 模型库 中的 参考模 型 进行相似性度量比较, 然后把相似性最高的输入特征 矢量 作为识 别 结 果 输 出。 这 样, 最 终 就 达 到 了 语 音 识 别 的 目的。
语音识别程序的设计, 参考了 LD332X 开发手 册[11] , 本文中采用中断方式工作, 其工作流程分为通用初始 化 语音识 别 用 初 始 化 写 入 识 别 列 表 开 始 识 别 响 应 中断。
两种方式: 一 种是 直 接在 嵌入 式处 理 器中 调用 语 音开 发 包; 另一种是嵌入式处理器外围扩展语 音芯片[ 5] 。第一 种 方法程序量大, 计算 复 杂, 需 要占 用 大量 的 处理 器 资源 , 开发周期长; 第二种方法相 对简单, 只 需要关注语 音芯片 的接口部分 与微处 理器 相连, 结 构简 单, 搭 建 方便, 微处 理器的计 算负 担 大 大降 低, 增 强 了可 靠 性, 缩 短 了 开发 周期。
系统初始化 语音识别 命令解析与执行 串口命令发送 更新对话集 按键检测与处理 LED 指示 统计任务 空闲任务
本文的语音识别方案是以嵌入式微处理器为核 心, 外 围加非特定Baidu Nhomakorabea语音识别芯 片及相 关电 路构成。 语音识 别 芯片选用 ICRoute 公司的 L D3320 芯片。
如图 2 所示, 硬件电路主要包括主控核心部分和语 音 识别部分。语音进入语音识别部分后, 将处理过的数据 并 行传输到主控制器, 主控制 器经过 处理后, 发送 命令数 据 到 U SA RT , US ART 可用于扩展外围串 行设备, 如语音 合 成模块等。
服务机器人以 服 务为 目的, 因此 人 们需 要 一种 更 方 便、更自然、更加人性化的方式与机器人交互, 而不再满 足 于复杂的键盘和按钮操作。基 于听 觉的人 机交 互是该 领 域的一个重要发展方 向[ 1] 。目 前主 流的 语音 识别 技术 是 基于统计模式。然而, 由于统 计模 型训练 算法复 杂, 运 算 量大, 一般由工控机、PC 机或 笔记 本来完 成, 这 无疑限 制 了它的运 用。嵌 入 式 语音 交 互 已 成 为目 前 研 究 的 热 门 课题[ 2 3] 。
硬件单元实现语音识别功能, 采用嵌入式操作系统 C/ O S II 来实现统一的任务调度和外围设备管理。经过大量的 实验
数据验证, 本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。
嵌入式语音识别系统和 PC 机的 语音识 别系统相 比, 虽然其运算速度 和 内存 容量 有一 定 限制, 但它 具 有体 积 小、功耗低、可靠性高、投入小、安装灵活等优点, 特别适 用 于智能家居、机器人及消费电子等领域。
摘要: 介绍了一种以 A RM 为核 心的 嵌入 式语 音识 别模 块的 设计与 实现。 模块 的核 心处 理单 元选 用 ST 公司 的基 于
现有的语音识别技术按 照识别 对象可 以分 为特定 人 识别和非特定人识别。特定 人识别 是指识 别对 象为专 门 的人, 非特定人识别是指识 别对象 是针 对大多 数用户, 一 般需要采集多个人的语音 进行录 音和 训练, 经 过学习, 达 到较高的识别率。
软件系统的设计主要包括 3 部分: 主控单元的嵌 入式 操作系统 C/ OS II 移 植、LD3320 的语 音识 别程 序设 计、 对线 嵌入式操作系统 C/ OS II 移植
C/ O S II 是一个源码公开、可 移植、可固 化、可裁 剪、 占先式的实时多任务操作系统[ 10] 。它 是专门 为计算机 的 嵌入式应用设计的, 绝大部分 代码采用 C 语 言编写, 具 有 执行效率高、占用星空体育 星空体育平台空间小、实 时性能 优良和 可扩 展性强 等 特点, 最小内 核可 至 2 K B。在 C/ O S II 中, 任 务 的概 念 尤为重要, 它是可剥夺型的 内核, 因 此任务 优先 级的划 分 至关紧要。基于分层化和模块化的设计理念, 整个系 统任