星空体育·(StarSky Sports)官方网站-星空官方认证

AI技术背景下语音识别技术研究现状与途径-星空体育官方网站

新闻资讯
质量为本、客户为根、勇于拼搏、务实创新

AI技术背景下语音识别技术研究现状与途径

日期:2024-10-25 浏览: 

  在现代科学技术水平不断提升的背景下,社会的科技实力逐步 增强,促进着我国社会慢慢的朝向智能化方向发展,智能领域包含 的内容丰富多彩,机器学习就是其中的一种,并成为了智能领域研 究的关键项目,在促进我国智能领域的发展上也起到了重大的作 用。目前,科学家在语言识别以及互联网搜索等项目上取得了较大 的突破,在依托AI技术的帮扶下,可以达到机器与人类的语言交流 以及汽车自动驾驶的层面,同时在不断发展的背景下,机器人慢慢 的具备了人类无法达到的功能。为了更好的促进AI技术的发展,必 须要加强对语音识别技术的研究,本文从AI技术背景下语音识别技 术研究现状与途径,以此为语音识别技术的进一步发展提供帮助。

  在20世纪50年代中后期,AI技术也称为人工智能技术正式被人 类提出来,并在当时引发了相当大的反响,许多科学家以及专家学 者都参与到机器模拟智能方面的研究上,与此同时AI技术依据自身 独特的优势在各个行业领域中获得广泛应用,推动着许多行业领域 的改革创新,也促进着社会经济的快速发展,特别是对语音识别技 术的研发。

  音识别技术的研究进行整合,大部分研究项目都处于理论辩证阶段 与简单算法方面,从而很难真正发挥出数据资源的优势。现如今随 着深度学习技术的应用,可以很好的将云计算和数据资源整合到一 起,从星空体育官方入口 星空体育官网而提高对数据资源的识别速度和精确性,使得语音资源能够 得到较好的应用,并促使语音识别技术能够朝向更高层面发展。

  学习依旧停留在理论层面的研究,未应用到实际产品中。另外,深度学习技术可以将云计算和数据资源整合到一起,提高对数据资源的识别

  速度和精确性。为了促使语音识别技术朝向更高层次发展, 需要从语音收集与特征筛选、模拟训练和语音识别两方面进行。

  1.1 语音识别技术理论层面的研究 现阶段,我国的科学技术实力得到较大的增强,以往比较陈旧 的语言识别技术已经不能够满足现代社会的发展速度,尽管现在许 多智能终端设备上都带有语音识别功能,能够完成人类与机器之间 的信息交流,但是语音识别的准确率以及速度还有待加强,而目前 的语音识别算法与相关技术已经很难再继续发展[1]。在这样的背景 下,深度学习成为了语音识别技术进一步发展的重要方式,能够像 人类大脑一样进行模式学习以及信息感知等,并且具备了大量的理 论研究。然而,深度学习大多停留在理论阶段,还没能广泛的应用到 实际产品中。为了解决这一的问题,促进理论和产品的相互融合,更 好的满足现代社会发展的需求,必须要加强语言识别功能中关键部 位的研发,如语音信号产生与传播等,从而促进语音识别技术能够 获得更好的发展[2]。 1.2 语音识别技术应用方面的研究 伴随着我国科学技术水平以及互联网技术的迅速发展,促使我 国逐渐的从信息化社会过渡到智能化社会,加强语音智能技术的研 究也是时代发展的必然需求,能够很好的满足人类的使用需求,帮 助人们可以从多种方式与手段得到初始语音信息。对现有的关于语

  罗国强 1 方斌2 李家华1 (1.广州科技职业技术大学信息工程学院,广东广州 510550;2.广州城建职业学院信息工程学院,广东广州 510925)

  摘要:AI技术的问世为现代社会经济带来了较大的进步与发展,现阶段语音识别技术在准确率以及速度上还需要进一步完善,而深度

  收稿日期:2019-11-03 作者简介:罗国强(1979 —),男,广东兴宁人,硕士,讲师,研究方向:深度学习、计算机星空体育官方入口 星空体育官网视觉和图形图像处理。

  2.1 语音收集与特征筛选 系统在进行语音信息资源的收集过程中,需要经历采样与端点 测试两个环节。首先,采样环节通常是依托声卡来实现对语音信息 资源的归纳与整合,并将收到的信息进行相应的处理使之呈现出数 字化形态[3]。其次,端点测试环节通常是对语音信息出现的初始与末 尾阶段进行核实,是进行信息资源处理前的重要准备工作。一般情 况下端点检测功能的实现是基于能量与过零率相联系的算法方式。 此外,要确保语音识别系统能够正常工作,还必须要解决信息特征 筛选问题,信息特征筛选结果的准确性以及筛选速度直接影响到语 音识别的精确性和效率,这是因为只有实现了信息特征的精准筛选 才能够将庞大的语音信息进行区分,提取出有用的信息,同时将不 完整、无用的信息排除掉,从而确保语音信息资源采集环节的有序 运行[4]。 2.2 模拟训练和语音识别 在这个部分重点涉及到两个方面的内容,分别是训练以及识 别。首先训练是根据系统的要求选择一项适宜的识别路径,并通过 训练和聚类的措施来得到这些汉字的相关信息,同时将这些信息资 源作为初始应用值储存到系统中。在进行数据信息辨别时,必须要 将待辨别的汉字资源存储到系统文件中,以此来建立参考模板资源 库。其次识别主要是将需要进行识别的文字和参考模板数据库中的 文字信息进行比对,并根据比对的相似度确定被识别文字的内容, 目前主要有三种识别方式[5]:以模拟训练阶段获取的语言信息为基 础并存储到系统中,当要进行文字识别时,选取计分与距离最小的 文字;利用计分求法的途径将需要识别的文字信息通过态图模型开 展计算,从而得到输出概率;根据语言特征的差异性进行适宜的划 分,然后对每个区域特征中的平均值进行计算。