移动版

当前位置:智慧城市网资讯中心科技动态

新发产品更多
科学家研发人工智能声呐眼镜:可识别唇语,准确率达 95%
2023年04月13日 09:06:24来源:IT之家点击量:33417
导读美国康奈尔大学的研究人员开发了一种新技术,可以通过声呐眼镜进行无声沟通。这种眼镜利用微型扬声器和麦克风来读取佩戴者默念的单词,从而可以在不需要物理输入的情况下执行各种任务。
  【智慧城市网 科技动态】美国康奈尔大学的研究人员开发了一种新技术,可以通过声呐眼镜进行无声沟通。这种眼镜利用微型扬声器和麦克风来读取佩戴者默念的单词,从而可以在不需要物理输入的情况下执行各种任务。
 
  4月10日消息,美国康奈尔大学的研究人员开发了一种新技术,可以通过声呐眼镜进行无声沟通。这种眼镜利用微型扬声器和麦克风来读取佩戴者默念的单词,从而可以在不需要物理输入的情况下执行各种任务。 这项技术由康奈尔大学的博士生张瑞东(音译)领导开发,是在一个类似的项目的基础上进行的改进,该项目使用了一个无线耳机,而之前的模型则依赖于摄像头。
 
  该声呐眼镜使用一种名为 EchoSpeech 的无声语音识别接口,利用声呐来感知嘴部运动,同时使用一个深度学习算法实时分析回波特征。这使得系统能够以约 95% 的准确率识别佩戴者默念的单词。
 
  这项技术最令人兴奋的前景之一是,对于有语言障碍的人来说,可以使用它来无声地将对话输入到语音合成器中,然后将单词大声说出来。眼镜也可以用来在安静的图书馆中控制音乐播放,或者在嘈杂的音乐会上口述信息。
 
  该技术既小巧又低功耗,也不会侵犯隐私,因为没有数据离开用户的手机。这样,就不会有隐私方面的担忧。眼镜佩戴非常方便,比其他可用的无声语音识别技术更实用、更可行。
 
  研究人员表示,该系统只需要几分钟的训练数据来学习用户的语音模式,学习完成后,就可以朝用户的脸上发送和接收声波,感知嘴部运动,同时使用深度学习算法分析回波特征。该系统目前能够识别 31 个孤立的命令和一串连续的数字,并且错误率低于 10%。
 
  该系统目前的版本提供了大约 10 小时的电池续航,并且可以通过蓝牙无线地与用户的智能手机通信。智能手机负责处理和预测所有数据,并将结果传输到一些“动作键”,让它可以播放音乐、与智能设备交互或激活语音助手。
 
  康奈尔大学智能计算机接口未来交互(SciFi)实验室正在利用康奈尔大学的一个资助计划来探索将这项技术商业化的可能性。
关键词 人工智能声呐眼镜
相关阅读更多
版权与免责声明:

凡本网注明“来源:智慧城市网”的所有作品,均为浙江兴旺宝明通网络有限公司-智慧城市网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智慧城市网”。违反上述声明者,本网将追究其相关法律责任。

本网转载并注明自其它来源(非智慧城市网)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

正在阅读:科学家研发人工智能声呐眼镜:可识别唇语,准确率达 95%
我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)afzhan@foxmail.com
  • 联系电话0571-87756384
智慧城市行业“互联网+”服务平台
智慧城市网APP

功能丰富 实时交流

智慧城市网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智慧城市网

抖音号:afzhan

打开抖音 搜索页扫一扫
i

视频号

AF智慧城市网

视频号ID:sphF7DOyrojJnp8

打开微信扫码关注视频号

小红书

智慧城市

小红书ID:2537047074

打开小红书 扫一扫关注
反馈