8种面部神色实时追踪你的喜怒哀乐全被AI看穿了_情感_面部
有研究表明,人类在相似的社会环境下表达情绪的面部表情险些是相同的。如果一个人皱眉、嘟嘴、神色涨红,你一定知道TA是执政气,现在AI同样能够“看穿”这一点。
情绪剖析一贯是AI的重点研究方向,它分为文本识别、语音识别、视觉识别三种紧张路子,后者也便是面部表情的剖析。
最近这项研究又有了新的进展。在识别生气,愤怒、愉快、悲哀等感情特色的根本上,AI或许能够更进一步追踪面部感情变革的全过程。
近日,三星大家工智能研究院(Samsung AI)联合伦敦帝国理工学院(Imperial College London)在《自然机器智能》期刊揭橥了一篇名为《自然状态下人脸连续性效价和唤醒水平估计》的论文。
在论文中,研究职员称他们开拓了一种基于深度神经网络的AI系统,该系统可以通过剖析日常环境下拍摄的图像\***,高精度地估计人脸面部的感情效价和感情唤醒。
这意味着AI系统不仅能够快速、实时且精准地监测面部感情,同时还能呈现不同感情所达到的程度。
用深度神经网络识别面部表情
上述提到的感情效价( Valence )和感情唤醒(Arousal),是生理学专家用来评估人类感情的专业术语。
个中,前者描述了一个人对付某事物的感兴趣或排斥的程度。后者是指一个人对外界刺激重新产生反应的程度,比如是微笑,大笑,狂笑,还是歇斯底里的笑。
在大部分人眼中,通过看脸评估感情效价和唤醒是很随意马虎的,但对付机器来说却是一项困难的寻衅。
在全天下范围内,浩瀚科研机构和职员都在开拓基于深度神经网络的模型,以根据人们的面部表情预测感情,然而,到目前为止所开拓的大多数模型仅能够检测出愤怒、快乐、悲哀等紧张感情状态,而不是人类情绪中更奇妙的感情特色。
而本次研究提出的深度神经网络模型能够在识别8种基本面部感情之上,进一步评估感情的效能水平(积极状态 or 悲观状态)以及唤醒水平(激动 or 沉着)。
如研究职员在论文中写道,“长期以来我们一贯致力于研究面部情绪剖析,一样平常来说,情绪的离散种别有限,无法覆盖人类每天表现出的所有感情范围,因此,我们把把稳力转移到更普遍的情绪维度上,即效价和唤醒。”
他们将该模型在三个具有寻衅性的数据集上进行了测试,效果如下:
如我们所见,在连续性状态下,模型能够精准识别面部感情,并实时反响其感情所达到的程度,如蓝色条越高代表越愤怒。
黄色条的高度代表悲哀的程度。
研究职员先容,该模型紧张是通过特定五官来剖析面部表情,如一个人的嘴唇、鼻子、眼睛等,这使得它能够把把稳力集中在与估计效价和唤醒水平最干系的区域,并实现剖析人脸在自然状态下的感情特色。
其余,该AI模型还能够在8种常见的面部感情中,给出更精确的监测定位(如右下角)。
研究职员称,该模型能够在给定的面部图像上,准确地、连续性地估计感情效价和唤醒,是因其经由了有注释的图像数据集的演习,这些图像包含了有关效价和唤醒的信息。
同时在算法方面,为了提高模型在任务中的性能,他们利用了离散感情种别作为赞助标签,以供应额外监督;为了防止在网络演习过程中涌现过拟合问题,采取了随机过程、抖动正则化相结合的方法。
当然除了关键算法,构建机器学习系统还须要一个基本要素:得当的数据集。以上Demo的演习数据集为AFEW-VA和SEWA,它们是研究团队专门自建的可用于演习感情识别的深层神经网络的数据集。
研究职员说:“我们创建AFEW-VA数据集,目的是要验证在自然条件下模型的有效性,而不是受控于实验室条件下的有效性。因此该数据集包含的内容均来自真实天下所拍摄的图像和***。”
在最初的评估中,深度神经网络模型能够在自然条件下拍摄的人脸图像中达到前所未有的准确度,而且在AffectNet和SEWA数据集上进行测试时,它所表现的性能与人工标注基本能够达到同等性。
研究职员说:“我们的神经网络在两个数据集上的表现优于专家注释之间的同等性。”,这意味着如果将神经网络视为另一个人工注释者,那么它与人类注释者之间的同等性至少与其他人类注释者之间的同等性相同,这样的结果是非常显著的。”
更主要的是,除了性能表现良好外,采取深度学习更易于操作和退推广,由于它的预测是基于普通相机拍摄的图像和***,例如它可以用于市场剖析,或创造更具交互性的机器人。
论文的末了,研究职员强调,无论是感情类型识别的精度度,还是反响不同感情的变革过程,该AI模型要优于所有现有的方法。
看到这里有同学可能会好奇,AI为什么要达到如此高的感情识别度?
有哪些潜在运用处景
实在,面部情绪剖析的目的是让打算机更好地理解人的感情状态,从而创建更友好的人机交互过程。
在现实环境中,它在智能驾驶、新零售、临床医疗等诸多领域都有着广泛的运用处景,也正是这些领域对AI识别人类感情的能力提出了更高的哀求。
例如在智能驾驶领域,AI对驾驶员的表情识别是提升智能汽车安全性和舒适性的关键成分。比如当系统推举了一首驾驶员或搭客不喜好的音乐时,通过剖析车内人员的面部表情,系统便可自动“切歌”。
或者在新零售领域,商家可以采取表情识别技能剖析顾客感情,理解他们对不同商品的喜好程度,以此推举适宜的广告,实现精准营销等等。
随着人工智能技能和干系学科的飞速发展,人们对自动化和人机交互的需求日益强烈,表情识别作为打算机理解人类情绪的根本,干系研究成果也有了很大的进展,不过,总体而言仍处于实验室探索阶段,间隔大规模场景落地还有很长的一段间隔。
其余,据有关研究表明,人类的面部表情至少有21种,除了高兴、悲哀、愤怒、厌恶等8种常见感情外,还有13种可别区分的复合表情。那么你以为未来AI真的能看懂人类繁芜的感情变革吗?
引用链接:
https://techxplore.com/news/2021-01-technique-emotional-valence-arousal-images.html
https://www.nature.com/articles/s42256-020-00280-0
雷锋网雷锋网雷锋网
本文系作者个人观点,不代表本站立场,转载请注明出处!