语音识别(Automatic Speech Recognition,简称ASR),就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,也就是让机器听懂人类的语音。
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,在未来的不远处,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
通过训练,建立声学模型、语言模型,将未知的语音特征同上述模型进行匹配与比较,继而得以识别。
(3)语义理解:计算机对识别结果进行语法、语义分析。明白语言的意义以便做出相应的反应。通常是通过语言模型来实现。
语音识别技术目前主要应用于语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。
最著名的当属苹果语音助手Siri、三星语音助手S-Voice,另外各大航空公司和顶级银行的自动呼叫中心也采用了语音识别系统。
随着物联网的发展,对家庭电器的控制将会有更多的发展,而目前已经可以通过语音与智能家庭硬件之间进行互动,包括对电视、电灯、空调、热水器等家电的语音操控。
Nuance已有定制的汽车级语音平台Dragon Drive,并获得了CES创新大奖。通过将车载平台与手机连接,Nuance可以帮用户实现语音控制GPS导航,信息收发,电话接打,社交网络更新等等。国内也出现了类似的产品。
除了语音输入类APP本身,我们所熟悉的各类APP许多都已经支持语音识别的功能。比如搜索和导航、语音阅读、语音记账、日程管理等等。
语音识别产业链主要分为三部分,分别包括技术提供商、后端服务提供商以星空体育登录入口 星空体育在线官网及入口平台商。其中,技术提供商着重语音合成、语音识别等基础技术的研发,为下游的入口层提供基础技术支撑;以智能家居、个人语音助手、语音搜索为代表的入口平台则继续整合后端服务提供商(比如电商、本地生活等)为用户提供一站式的智能语音人机交互体验。
随着自然语言处理技术及硬件设备的发展,语音识别的准确率与响应时间持续得到改善,驱动语音交互方式快速渗透。从1970年到2016年,语音识别的词汇量和准确率大幅增长。2010年,准确率已经达到70%,到2016年时准确率已经达到了90%。
随着语音识别近年来的突破性进展,相关商业应用已经越来越普及。2015年,全球语音识别市场规模达到61.2亿美元。
1.本公众号版权为康橙投资所有,未经书面许可,任何机构和个人不得为商业目的以任何形式翻版、复制和发布。如引用须注明出处为“康橙投资”,且不得对本公众号所载内容进行有悖原意的引用、删节和修改。如有违反,本公司将保留向其追究法律责任的权利。
2.本公众号所载内容仅供参考之用,不构成出售或购买证券或其他投资标的要约或邀请。在任何情况下,本公众号所载内容均不构成对任何个人的投资建议。本公司及雇员对投资者使用本公众号所载内容而造成的一切后果不承担任何法律责任。
3.本公众号所载部分内容源于公开资料,已标明出处,本公司对这些信息的准确性、完整性星空体育登录入口 星空体育在线官网或可靠性不作任何保证。如对内容、版权有问题,请联系: