语音交互市场显现四大客观限制待跨越

2017-02-23 17:21:01 微信号：agoodesign 点击量：31736

　　【中国安防展览网企业关注】根据VoiceLabs发布的《2017年语音报告》(The 2017 Voice Report)。报告对亚马逊Alexa和谷歌Google Home的和消费者进行了调查，总结了目前的智能语音市场，并对2017年的趋势做出预测。2017年，语音产业结构将按照硬件产品、AI软件、语音应用Apps、生态系统服务相结合的架构继续向前发展。预计2450万台以语音为主要交互方式的智能硬件产品发货，市场总量将达到3300万台，市场规模超过200亿美元。而对各种智能语音助手以及语音交互app而言，竞争将更加激烈。

语音交互市场显现四大客观限制待跨越

　　目前，在语音交互相关的领域已经出现了一批玩家和产品，国外的有Google Now、微软的Cortana(小娜)、Facebook的Message Platform、苹果的Siri、亚马逊的Echo、Google Home的智能音箱，国内的科大讯飞、百度的智能机器人(度秘)、搜狗语音、微信的语音功能等，虽然这么多玩家进入语音交互的领域，但由于技术和社会环境的限制，语音交互还处在起步阶段，相关的语音交互技术还无法支持大规模的应用和推广。

　　要想让语音交互流行起来，必须合理解决以下几点客观的限制：

　　1、语音识别技术还处于起步阶段。

　　语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audrey系统，它是个可以识别十个英文数字的语音识别系统。并且一些行业巨头也都是在2010年左右才开始加大对语音技术的投入。各大巨头各自为战，语音识别领域里面还没有形成统一的行业标准和应用生态。

　　2、使用场景有限。

　　语音识别技术对环境要求苛刻；在识别的准确率上受较多因素的影响，比如背景噪音、口音、语速、特定领域的专有名词等都影响准确率。有一项这样的测试，有人随机截取了几段网络课程用主流的云端引擎测试识别准确度，基本上准确率在70%左右；然后又截取了一段新闻联播的音频，用同样的云端引擎做测试，准确率达到了95%左右。由这个测试我们可以清楚的看到客观因素对语音识别准确率的影响，要知道在这个行业5%的准确率就是可以引起行业变革的。目前的技术先限制导致语音交互体验的机器感特别强，缺乏人性化的感知，没有人喜欢跟呆板的机器一直做交流的。

　　3、语音交互是非可视化的，非常消耗用户的注意力，增加记忆负担。

　　人在与系统做交互的时候，能记住的信息也就10秒左右。举一个常用的场景，有时候打银行的客服电话，你必须集中精力听语音播报，一旦被打断就又得从头听一遍。

　　4、用户习惯还未完全养成。

　　没有人愿意对着冰冷的机器说话，然后得到毫无感情的甚至是错误的回应。用户对语音交互对象的要求不但是可以听懂，还应该能人性化的给以回应，人类更期望通过语音达到人人交互的感受，而不是人机交互，这也是为什么语音交互的普及很大程度上依赖于人工智能技术的发展。

　　语音交互将成为物联网时代流行也是普遍的交互方式

声明：凡来源标明“智慧城市网”的文章版权均为本站所有，如需转载请务必注明出处，违者本网将追究相关法律责任；所有未标明来源为“智慧城市网”的转载文章目的在于传递更多信息，均不代表本网立场及观点，“智慧城市网”不对这些第三方内容或链接做任何保证或承担任何责任；如涉及版权等问题，请在内容发表之日起一周内与本网联系，否则视为放弃相关权利。

上一篇：比苹果还快国产虹膜识别手机来了

下一篇：摄像头安装争议大制定使用规范迫在眉睫