星空体育·(StarSky Sports)官方网站-星空官方认证

语音识别基础(34页)-原创力文档-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

语音识别基础(34页)-原创力文档

日期:2026-04-10 浏览: 

  语音识别基础 语音识别基础 第一章 绪论 第一章 绪论 上海交通大学计算机系 吴亚栋Tel: 第一章 绪论 第一章 绪论 1.1 语音识别的重要性 1.2 语音识别的定义、原理和分类 1.3 本课程的内容与要求 1.4 语音识别的历史回顾 1.1 语音识别的重要性 1.1 语音识别的重要性 1.1.1 语音信息处理与语音识别 人类利用语言相互交流信息,包括语音和文字两种 表达方式。通过语音相互传递信息,这是人类最重要的 基本功能之一。随着信息社会的发展,人与人之间,自 不必说,即使在人与机器之间也每时每刻都需要进行大 量的信息交换。 (图1.1) 1.1.2 语音识别的重要性 计算机语音识别是智能计算机系统的重要特征。这 一技术的应用将从根本上改变计算机的人机界面,从而 对计算机的发展以及推广应用产生深远的影响*。 1.2 语音识别的定义、原理及分类 1.2 语音识别的定义、原理及分类 1.2.1 语音识别的定义 1.2.2 语音识别的基本原理 1.2.3 语音识别的分类 1.3 本课程的内容与要求 1.3 本课程的内容与要求 本课程的内容 本课程的要求 参考书籍 1.4 语音识别的回顾 1.4 语音识别的回顾 1.4.1 国外语音识别研究的历史 1.4.2 我国语音识别研究的历史 第一章 回家作业 第一章 回家作业  调查报告: [国内外语音识别技术研究开发最新动态]  提交时间: 图1.1 人与人之间、人与机器之间的语音信息处理过程 图1.1 人与人之间、人与机器之间的语音信息处理过程 人与人之间的语音通信 说话方 收听方 认 语 传输系统 发 收 识 意 言 (编码、解码) 行 (人) ○ · 图 形 动 音 听 理 成 空间传播 解 计 文 文 语 Ⅰ Ⅱ 语 语 算 章 本 音 音 音 (机器) ○ 机 输 解 合 Ⅰ:第一类人机 识 理 · · 处 入 析 成 语音通信问题 别 解 理 Ⅱ:第二类人机 应答文生成 语音通信问题 计算机模拟人类交流信息的过程: 计算机模拟人类交流信息的过程: (1) 将大脑产生的思想转换成语言 自然语言生成 (2) 将语言转换成相应的语音 语音合成 (3) 识别表达语言的语音内容 语音识别 (4) 理解语音所表达的语言意义 自然语言理解 *语音识别是一项具有巨大应用推广前景的工程 *语音识别是一项具有巨大应用推广前景的工程 基于电话的语音识别技术,使计算机直接为客户提 供 金融证券和旅游等方面的信息查询及服务成为可 能,进而成为电子上午进展中的重要一环 (Voice- Commerce)。 语音识别技术作为声控产业,必将对编辑排版、办 公自动化、工业过程和机器操作的声控技术起到重 大的推进作用。因此可以预言,语音技术必将对工 业、金融、商业、文化、教育等诸方面事业产生星空体育官方入口 星空体育官网革 命性的影响。 *主要先进国家都将此工程列为国家级研究项目 *主要先进国家都将此工程列为国家级研究项目 面对如此广阔的应用领域,目前国内外众多公司正 积极推动语音识别技术的应用。 微软 :让计算机能说会听 IBM:ViaVoice仍居主流 Intel:做语音技术倡导者 微软 :让计算机能说会听 微软 :让计算机能说会听 Bill Gates 在97年世界计算机博览会(COMDEX)主题 演讲会上描绘IT事业的发展宏图时,率先指出: 下一代操作系统和应用程序的用户界面将是语音 识别。工业界应对语音识别领域的重大突破做好充分 准备,因为那将是一场席卷全球星空体育官方入口 星空体育官网的另一次热潮。 1998年11月5日,微软中国研究院在北京成立。该中 心的任务是重点研究计算机在中文环境下的易用性。 IBM:ViaVoice仍居主流 IBM:ViaVoice仍居主流 IBM公司潜心研究语音识别技术迄今已达30年之 久,投资超过2亿美元。 IBM公司于1995年在北京成立了中国研究中心,中 文语音信息处理成了该中心三大研究领域之一,并 于1997年9月4日,在北京推出了中文连续语音识别 产品ViaVoice。 Intel:做语音技术倡导者 Intel:做语音技术倡导者 1998年,英特尔公司也宣布致力于推广语音识别技 术,除了在北京举办首届语音技术国际论坛之外, 还在北京、上海、成都、广州等地展开了“基于英特 尔框架的语音识别技术”的宣传活动。 联合了七家世界著名学术机构(中科院自动化所、 清华大学、香港科技大学、香港中文大学、麻省理 工学院、俄勒岗研究院、WATERLLOO大学)成立了 “国际语音技术研究组织”,致力于计算机语音技术 的基础研究,以加速中文语音识别技术的发展。 1.2.1 语音识别的定义 1.2.1 语音识别的定义 语音识别是研究如何采用数字信号处理技术自动提 取以及决定语音信号中最基本、 最有意义的信息的 一门新兴的边缘学科。它是语音信号处理学科的一 个分支。 语音识别所涉及的学科领域:信号处理、物理学 (声学)、模式匹配、通信及信息理论、语言语音 学、生理学、计算机科学(研究软硬件算法以便更 有效地实现用于识别系统中的各种方法)、心理学 等。 *音韵信息与音律信息 *音韵信息与音律信息 有意义、有内容的信息是构成语音音韵特性、即语 音的共性特征之基础,这类特征信息称为音韵信息。 语音信号中有关个人特征的信息、即语音的个性特 征,如:音强、节奏、音高等,这类特征信息称为音 律信息。 从广义上讲,语音识别也包括了对说话人的识别, 其主要内容是提取语音信号中有关个人特征的信息、 即语音的个性特征(如:音律特性等),在这里专指 有意义、有内容的识别。 1.2.2 语音识别的基本原理 1.2.2 语音识别的基本原理 训练 (Training):预先分析出语音特征参数,制作语音 模板(Template)并存放在语音参数库中。 识别 (Recognition):待识语音经过与训练时相同的分 析,得到语音参数,将它与库中的参考模板一一比较,并 采用判决的方法找出最接近语音特征的模板,得出识别结 果。 失真测度 (Distortion Measures):在进行比较时要有个 标准,这就是计量语音特征参数矢量之间的“失真测度”。 主要识别框架 :基于模式匹配的动态时间规整法 (DTW:Dynamic Time Warping)和基于统计模型的隐马尔柯 夫模型法(HMM:Hidden Markov Model)。 (图1.2) 图1.2 语音识别原理框图 图1.2 语音识别原理框图 ·欧氏距离 失真测度 ·似然比测度 语音信号 识别 输入 声学参数 结果 ○ 预处理 测度估计 判决 分析 ·反混叠失真滤波器 训练 ·预加重器 语音库 专家知识库 ·端点检测 ·构词规则 ·噪声滤波器

  2、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。

  3、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。

  4、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

  证券行业:变革开启杠杆空间,创新推动估值提升-2012年中期投资策略.pdf

  精品解析:北京市朝阳区北京中学2024-2025学年七年级下学期期中英语试题 (原卷版).docx

  2---30天练会初中课标词(Unit 2-Unit 10 完整版).docx

  3---30天练会初中课标词(Unit 11-Unit 20 完整版).docx

  30天练会初中课标词(Unit 1 完整版·按原文档序号+全量衍生词).docx

  TCWEA6-2019水利水电工程施工期度汛方案编制导则_可搜索.pdf

  2025年6月大学英语四级考试线套(含答案+听力原文+听力音频).docx

  (2026春新版)部编版二年级语文下册《识字4 中国美食》PPT课件.pptx

  原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者