【中国安防展览网 市场分析】通过利用机器学习技术进行自然语言深度理解,一直是各界关注的焦点。在人工智能各项领域中,自然语言处理拥有交互的自然性,是发展和商业化早的技术,市场空间巨大。据中商产业研究院数据显示,2017年中国智能语音产业规模达到105.7亿元,与2016年相比增长70%。随着智能语音应用产业拓展,市场需求增大,预计2018年中国智能语音产业规模将进一步增长,达到159.7亿元。
当下,语音识别系统基于深度学习技术得在各个领域都逐渐起到作用。例如,在智能家居领域,智能音箱、智能电视等硬件本身具有入口价值,而找到语音入口是挖掘智能家居背后用户价值的关键。企业可凭借前端语音交互提供入口,后端互联网提供服务的方式完成物联网时代家居场景下商业模式转换。另外,语音识别技术可以与其他自然语言处理技术如机器翻译及语音合成技术相结合,构建更加复杂的应用。
不过,语音识别技术与产业的发展也存在一些问题,而要解决这些问题还有待于各方面共同努力。
口音问题*
尽管在机器学习的加持下,语音识别技术取得了巨大进步,但还不够完善。其中,口音是语音识别技术的挑战之一。华盛顿邮报近进行的一项研究结果显示,谷歌和亚马逊研发的智能语音助手识别非美国本地口音准确率要比美国本地口音低30%。对此,语言学家和AI工程师纷纷表示,语音识别“地域歧视”的发生是由于缺乏多样性的语音数据。也就是说,语音识别的口音问题是由于数据不足产生的,同等条件下,语料库质量越高,语言模型越多种多样,语音识别系统准确率越高。
“鲁棒性“问题显著
语音识别包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。由于语音信号具有多样性和复杂性,系统只能在一定限制条件下才能获得满意效果。目前业内普遍宣称的97%识别准确率,只在安静室内的进场识别中才能实现。而在真实使用场景中,麦克风质量、说话者口音,以及环境噪音等因素,都会让语音识别准确率大打折扣。此外,语音识别技术对于说话者的口误,容错度也有所欠缺。用户往往会追求多样性,包括使用过程中偶然状况以及场景的多样性,因此容错技术尤为重要。
跨界竞争激烈 商业模式欠缺
语音识别巨大的提升空间和市场空间,吸引了互联网巨头争相加入。当前,以BAT为代表的互联网巨头已经入局,并先后推出自己的产品,以抢得行业入口先机。互联网巨头的现金流业务、场景、数据和用户,其产品发展迭代由客户需求驱动,以上条件正是传统语音技术提供商所欠缺的。在语音识别领域,科达讯飞拥有多年技术积累,在某些前沿技术上处于水平,但其他公司在技术上并没有本质差别,然而技术本身已不足以成为核心竞争力,大多数公司很难单纯依赖技术建立成熟可靠的商业模式。
小结:语音识别技术给人们带来了诸多便利,但距离技术成熟还有很长的一段路要走,要想做到更好的商业应用,就必须取得突破性进展,这也是未来语音识别技术发展方向。行业方面,只凭技术不足以让企业建立成熟的商业模式,语音识别行业未来会如何发展?让我们拭目以待。
(本文据砍柴网、中国经营报、品途商业评论、爱分析ifenxi、中商产业研究院、前瞻产业研究院编辑)
版权与免责声明:
凡本网注明“来源:智慧城市网”的所有作品,均为浙江兴旺宝明通网络有限公司-智慧城市网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智慧城市网”。违反上述声明者,本网将追究其相关法律责任。
本网转载并注明自其它来源(非智慧城市网)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。
如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。