语音识别技术的原理及应用

2017年12月08日 14:38 点击量：2833

　　上周，百度宣布语音技术全系列接口*免费开放，提供语音识别、语音合成、语音唤醒多平台SDK (软件开发工具包)，支持和合作伙伴。语音交互是人与机器“交流”的重要环节，百度宣布语音技术全系列接口*免费，或将带来一场巨大的行业变革。

　　智能语音技术是人工智能产业链上的关键一环。人工智能产业链主要分为三个层次。底层是基础设施，包括芯片、模组、传感器，以及大数据平台、云计算服务和网络运营商；中间层是基础技术研究和服务提供商，包括深度学习、计算机视觉、语音技术和自然语言处理以及机器人等领域；上层是行业应用，包括智能家居、可穿戴设备、无人驾驶、虚拟助理、家庭机器人等。

　　语音识别技术原理是什么？

　　语音识别系统构建过程整体上包括两大部分：训练和识别。训练是指对预先收集好的语音进行信号处理和知识挖掘，获取语音识别系统所需要的“声学模型”和“语言模型”；识别是对用户实时语音进行自动识别。识别过程通常又可以分为“前端”和“后端”两大模块：“前端”主要作用是进行端点检测(去除多余的*和非说话声)、降噪、特征提取等；“后端”作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别，得到其包含的文字信息。此外，后端模块还存在一个“自适应”的反馈模块，可以对用户的语音进行自学习，从而对“声学模型”和“语音模型”进行必要的“校正”，进一步提高识别的准确率。

　　智能语音技术将在哪些领域发挥作用？

　　智能家居：找到合适的语音入口是挖掘智能家居背后用户价值的关键。硬件本身具有入口价值，智能音箱、智能电视、家庭机器人等都有可能成为合适的入口。通过前端语音交互提供入口，后端互联网提供服务的方式完成物联网时代家居场景下的商业模式转换。

　　智能车载：语音交互在车载场景中存在刚需，也会成为zui先爆发的领域。未来，车载设备提供商可以通过补贴用户来抢占汽车内显示屏市场，通过用户用车行为数据的搜集与挖掘，为保险公司和车厂提供信息，保险公司根据数据设立分层级的保费机制，激励规范驾驶行为。这样，信息流和服务流将不断在生态系统中流转，不断挖掘更大价值。

上一篇：对于小间距LED屏前维护究竟有何意义？

下一篇：LED显示屏频繁跳闸？解决窍门都在这儿

版权与免责声明： 凡本网注明“来源：智慧城市网”的所有作品，均为浙江兴旺宝明通网络有限公司-智慧城市网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：智慧城市网www.afzhan.com”。违反上述声明者，本网将追究其相关法律责任。

本网转载并注明自其它来源（非智慧城市网www.afzhan.com）的作品，目的在于传递更多信息，并不代表本网赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品第一来源，并自负版权等法律责任。