背景简介进入21世纪,机器人愈来愈进入到人们生产、生活的各个方面。而与之相应,具有语音识别功能的家用服务机器人以及工业机器人的需求量将会越来越大。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。口语对话系统作为一种极具自然性的智能人机交互手段,被认为是面向服务机器人的人机交互技术的首选。语音识别原理语音识别的基本过程由两个部分组成。一是学习和训阶段,二是识别过程。语音识别系统的性能指标主要有四项:①词汇表范围;②说话人限制;③训练要求;④正确识别率。国外发展与现状国外发展与现状第二阶段(快速发展阶段):进入70年代以后,在小词汇量、孤立词的识别方面取得星空体育登录入口 星空体育在线官网了实质性的进展,大规模的语音识别研究也是在这个时期得到很大发展。进入80年代以后,研究的重点逐渐转向大词汇量、非特定人连续、语音理解语音识别。在研究思路由传统的基于标准模板匹配的技术思路开始转向基于统计模型(HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路。理论:声学模型—隐马尔科夫模型(HMM)语言模型—N-gram模型国外发展与现状第三阶段(应用开发):进入九十年代,特别是新世纪以来的十几年,语音识别的鲁棒性、自适应性和智能性得到较大的提高。已经能够满足简单的应用。各种语音识别的产品也开始进入我们的生活。以航空垂直领域语音理解为研究目标的航空旅行信息检索服务、中等规模连续语音识别任务海军资源管理识别、北美商务录音识别、以及难度更大的大词汇量连续语音识别任务广播新闻录音识别、电话信道会话转写等。理论:深度学习理论的提出与发展声学模型—隐马尔科夫模型(HMM)—深度神经网络语言模型—N-gram模型—反馈神经网络国内发展现状1986年3月中国高科技发展计划(863计划)启动,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在863计划的支持下,中国开始了有组织的语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。从此中国的语音识别技术进入了一个前所未有的发展阶段。成果:清华大学电子工程系研发的非特定人汉语连续语音识别系统是最典型代表,而且它对不定长数字串和定长的数字串的识别率分别高达94.8%和96.8%以上,性能基本能满足实际应用要求,是当时世界上最好的语音识别系统之一。2000年,我国研制出了一个熊猫语音识别系统,这是个非特定人的连续语音系统。语音识别产品Google推出的语音搜索((VoiceSearch)和Googlenow等产品、以及苹果在iPhone手机中推出的个人语音助理Siri为代表,语音交互方式正在逐渐改变人们的使用习惯并给用户带来更多的便利。语音识别产品除了国外的这些巨头以外,科大讯飞于2010年发布全球首个面向中文语音识别的“语音云”,并在后续几年内持续在中文语音识别领域领跑,在其之后,百度、搜狗、腾讯等互联网巨头纷纷投入巨大资源开发出自主的语音识别系统。语音识别产品语音云3.0集成了自然语言理解、个性化语音识别和语音唤醒、声纹识别等创新能力。语音云3.0还在人脸识别、手势识别等方面加速布星空体育登录入口 星空体育在线官网局,构建全自然交互平台,打造语音生态体系。语音识别产品清华小图:小图为清华大学图书馆的机器人,目的是让其更好地服务于图书馆。语音识别产品每次识别最多可以设置50项候选识别句,每个识别句可以是单字,词组或短句,长度为不超10个汉字或者79个字节的拼音串。通过快速而稳定的优化算法,完成非特定人语音识别。不需要用户事先训练和录音,识别准确率90%。语音识别产品语音识别的难题由于语音识别涉及到模式识别、信号处理、传感器技术等很多领域,是一项难度与复杂度较大的技术,想要这些系统在真实环境中得到广泛的应用,还需要解决很多难题。主要表现在以下几个方面:(1)系统鲁棒性差;(2)识别模型有待提高;(3)可靠性差;设想1、捆绑式学习;2、基于决策树的交叉聚类。*语音识别的核心部分。涉及到:声学模型与语言模型第一阶段(启始阶段):1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研究成功了第一个计算机语音识别系统。在此期间,提出的一些思想一直沿用至今。理论:动态规划算法、时间规划方法、动态音素跟踪法。
语文五年级上册第八单元第二课时 《 忆读书 》说课稿附反思含板书.pptx
人教版高中数学第三册(选修I)《概率与统计》教材分析与教学建议.doc
原创力文档创建于2008年,本站为文档C2C交易模式,即用户上传的文档直接分享给其他用户(可下载、阅读),本站只是中间服务平台,本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方,若您的权利被侵害,请发链接和相关诉求至 电线) ,上传者