星空体育·(StarSky Sports)官方网站-星空官方认证

Natural-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

Natural

日期:2025-05-21 浏览: 

  语音识别是将人类的声音信号转化为文字或者指令的过程([1])。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,其研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域([2])。

  语音识别系统根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统、连接字语音识别系统和连续语音识别系统;根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统;根据词汇量大小可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语星空体育网站 星空体育首页音识别系统([3])。

  语音识别的研究从上个世纪50年代开始,1952年,三位贝尔实验室的研究人员研究出了世界上第一个能识别10个英文数字发音的系统——Audry系统。该系统被普遍认为是自动语音识别系统的开端。

  20世纪60年代:60年代计算机的应用推动了语音识别的发展。其中动态规划(DP)和线性预测分析技术(LP)等技术的提出和运用对语音识别的发展产生了深远影响。

  20世纪70年代:70年代LP技星空体育网站 星空体育首页术得到进一步发展,动态时间归正技术(DTW)基本成熟。特别是矢量量化(VQ)和隐马尔可夫模型(HMM)理论在实践上的运用初步实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。

  20世纪80年代:20世纪80年代随着HMM模型和人工神经元网络(ANN)等技术在语音识别中的成功应用人们终于在实验室突破了大词汇量、连续语音和非特定人这三大语音识别障碍。首次把这三个特性都集成在一个系统中,比较有代表性的是卡耐基梅隆大学研发的Sphinx系统。

  20世纪90年代:90年代之后语音识别与自然语言处理相结合发展到基于自然口语识别和理解的人机对话系统。与机器翻译技术相结合逐步发展出面向不同语种人类之间交流的直接语音翻译技术。

  [1] 中华人民共和国国家质量监督检验检疫总局.GB/T21023 ⁃ 2007 中文语音识别系统通用技术规范[S].北京:中国标准出 版社,2007.

  [2] 王文慧.基于ARM的嵌入式语音识别系统研究[D].天津:天津 大学,2008.

  [3] 马志欣,王宏,李鑫.语音识别技术综述[J].昌吉。学院学报,2006(3):93⁃97.