第一章 绪论 语音是人类进行信息交流最自然、最方便的手段。语音识别技术作为常用人机交互方法具有极大的优势和便利只要有机器存在的地方就有语音技术应用的潜在可能。语音识别的研究目标是让机器识别出人类的语言。近年来语音识别领域取得了很多成果随着声学模型、语言模型、搜索算法的不断改进识别系统的性能得到了极大的提高。 1.1 概述 关键词识别就是在连续的无限制的自然语音流中识别出给定的关键词。它包括两个方面的基本内容一个是关键词检测(keyword spotting KWS )一个是关键词确认。关键词检出是鉴别语音包含哪几个预...
第一章 绪论 语音是人类进行信息交流最自然、最方<a href="http://www.fzaqmmy.com" target="_blank" tar 星空体育官方入口 星空体育官网get=_blank>星空体育官方入口 星空体育官网便的手段。语音识别技术作为常用人机交互方法具有极大的优势和便利只要有机器存在的地方就有语音技术应用的潜在可能。语音识别的研究目标是让机器识别出人类的语言。近年来语音识别领域取得了很多成果随着声学模型、语言模型、搜索算法的不断改进识别系统的性能得到了极大的提高。 1.1 概述 关键词识别就是在连续的无限制的自然语音流中识别出给定的关键词。它包括两个方面的基本内容一个是关键词检测(keyword spotting KWS )一个是关键词确认。关键词检出是鉴别语音包含哪几个预先输入的关键词是一个多元判决问题。而关键词确认则回答是不是包含这个关键词是一个两元判决问题本文所有的关键词识别即是指关键词检出。 关键词识别不要求把整个的语音全部识别出来因 此 可 以 说 关 键 词 识 别 是 连 续 语 音 识 别 (continuous speech recognition CSR)的一个分支因此二者在技术上很多是相通的。 语音检索利用语音处理技术对语音进行内容分析分类 在此基础上对语音进行检索 可以根据语音包含的内容也可以根据语音的说话人进行检索。其实现方式主要有以下几种: (1)利用大词汇语音识别技术进行检索 这种方法是利用自动语音识别(ASR)技术把语音转换为文本从而可以采用文本检索方法进行检索。 (2)基于子词单元进行检索 当语音识别系统处理各方面无限制主题的大范围语音资料时 识别性能会变差尤其当一些专业词汇(如人名、地点)不在系统词库中时。 一种变通的方法是利用子词(Sub-Word)索引单元 当执行查询时用户的查询首先被分解为子词单元 然后将这些单元的特征与库中预先计算好的特征进行匹配。 (3)基于识别关键词进行检索 在无约束的语音中自动检测词或短语即关键词识别利用该技术识别或标记出长段录音或音轨中反映用户感兴趣的事件这些标
2017年上海交通大学媒体与设计学院334新闻与传播专业综合能力[专业硕士]考研仿线年郑州大学新闻与传播学院440新闻与传播专业基础[专业硕士]之广播电视新闻学考研冲刺密押题
2017年中国石油大学(北京)跨文化交际学之跨文化交际学概论复试实战预测五套卷
2017年淮北师范大学数学分析、高等代数(同等学力加试)之高等代数考研复试核心题库
2017年华北理工大学经济学院431金融学综合[专业硕士]之金融学考研仿线年广西大学新闻传播学院806新闻与传播实务之公共关系学考研题库
2017年浙江财经大学法学院871法学综合二(经济法、民法)之经济法考研题库