人工智能声呐眼镜可识别唇语准确率约为95%_人工智能_穿戴
美国康奈尔大学研究职员开拓了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时未便利说话或无法发声的人供应帮助。干系论文将在本月于德国汉堡举行的打算机协司帐算系统人为成分会议上揭橥。
这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿着的人工智能驱动的声呐系统,在面部发送和吸收声波,并感知嘴巴的运动。然后,深度学习算法实时剖析这些反应轮廓,准确率约为95%。这款低功耗、可穿着的眼镜只须要几分钟的用户演习数据,即可识别命令并可在智好手机上运行。
EchoSpeech可用于在说话未便利或不得当的地方通过智好手机与他人互换,比如在喧华的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起利用,险些不须要键盘和鼠标。
研究职员表示,他们正在将声呐技能“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实天下中支配新的可穿着技能的主要功能。无声语音识别中的大多数技能都局限于一组选定的预定命令,须要用户面部或佩戴摄像头,这既不实用也不可行。可穿着式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技能肃清了对可穿着式摄像机的需求。
此外,由于音频数据比图像或***数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智好手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。
今年以来,人工智能再次引发极大关注。几年前,专家们还在磋商如何让人工智能更加准确地理解人的意图,并与人进行多轮对话。曾经,让人工智能读懂唇语,还只是科幻电影中的桥段。如今,这些都在快速变为现实。面对人工智能带来的超乎预期的变革,不能勾留在“看热闹”阶段,人们须要真正去思考,如何更好地主宰人工智能,利用它为人类造福,并只管即便规避它可能带来的麻烦。
来源: 科技日报
本文系作者个人观点,不代表本站立场,转载请注明出处!