您的当前位置:首 页 >> 科普资源 >> 科技解读 >> 深入解读 >> 电子信息 >> 语音识别

电子信息

语音识别
第一版 引言 第二版 背景:人机交互
第三版 对话式AI背后:机器感知与机器识别 第四版 语音识别的发展
第五版 语音识别系统的基本构造块 第六版 基于深度学习的改进
第七版 前沿研究
第一版 引言
 

“语音识别”的终极梦想,是真正能够理解人类语言甚至是方言环境的系统。但几十年来,人们并没有一个有效的策略来创建这样一个系统,直到人工智能技术的爆发。

过去三十年里,语音识别是这样的:您能够和自己的计算机交谈,通常使用头戴式麦克风,使用微软 Windows 中未公开的语音识别应用软件,或者 Nuance 通信公司“龙自然语言”版的应用软件。如果您发音很清晰,那么屏幕上就会显示出单词,然后执行命令。

现在,人们在人工智能和深度学习领域的突破,让语音识别的探索跨了一大步。在过去两年中,它催生了一类新的消费系列产品:语音控制的个人助理。VoiceLabs 公司为语音应用软件开发人员提供分析技术,该公司创始人之一 Adam Marchick 表示:“这是经过了 30 年的沉淀而一夜成名。它终于变得足够精确,足以能进行对话了。”

和大多数技术一样,语音识别的发展也是逐步的。2017 年 8 月,微软宣布,根据行业标准测试,其会话语音识别系统的单词识别准确度已经超过了专业人类转录员的识别准确度。在此类测试中,专业人员的平均错误率为 5.9%, 而微软系统达到了 5.1%。

本文将回顾语音识别技术领域的最新进展,研究促进其迅猛发展进程的元素,并探讨其未来以及我们距离可以完全解决这个问题还有多远。

 

 

(发布时间:2018-08-09)