表情识别是指从给定的静态图像或动态视频序列中分离出特定的表情状态,从而确定被识别对象的心理情绪。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。
表情识别是指从给定的静态图像或动态视频序列中分离出特定的表情状态,从而确定被识别对象的心理情绪。
介绍
随着计算机技术和人工智能技术及其相关学科的迅猛发展,整个社会的自动化程度不断提高,人们对类似于人和人交流方式的人机交互的需求日益强烈。计算机和机器人如果能够像人类那样具有理解和表达情感的能力,将从根本上改变人与计算机之间的关系,使计算机能够更好地为人类服务。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。
人脸表情识别是指从给定的静态图像或动态视频序列中分离出特定的表情状态 ,从而确定被识别对象的心理情绪,实现计算机对人脸表情的理解与识别 ,从根本上改变人与计算机的关系,从而达到更好的人机交互。 因此人脸表情识别在心理学、智能机器人、智能监控、虚拟现实及合成动画等领域有很大的潜在应用价值。
研究现状
面部表情识别技术是近几十年来才逐渐发展起来的,由于面部表情的多样性和复杂性,并且涉及生理学及心理学,表情识别具有较大的难度,因此,与其它生物识别技术如指纹识别、虹膜识别、人脸识别等相比,发展相对较慢,应用还不广泛。但是表情识别对于人机交互却有重要的价值,因此国内外很多研究机构及学者致力于这方面的研究,并己经取得了一定的成果。
20 世纪 70 年代美国心理学家 Ekman 和 Friesen 对现代人脸表情识别做出了开创性的工作。Ekman 定义了人类的 6 种 基本 表 情:高兴 (Happy)、生 气 (Angry)、吃 惊 (Surprise)、恐惧(Fear)、厌恶(Disgust)和悲伤(Sad),确定了识别对象的类别;其次是建立了面部动作编码系统(Facial Action Coding System,FACS),使研究者按照系统划分的一系列人脸动作单元(Action Unit,AU)来描述人脸面部动作,通过人脸运动和表情的关系,进而检测人脸面部细微表情。1978 年,Suwa 等人对一段人脸视频动画进行了人脸表情识别的最初尝试,一系列的研究在人脸表情视频序列上展开。
到上世纪 90 年代,随着图像处理与模式识别技术的发展,使得人脸表情识别的计算机自动化处理成为可能,K Mase 和 A Pentland 是其中的先驱者。二人首先使用光流来判断肌肉运动的主要方向,然后提取局部空间中的光流值,组成表情特征向量,最后利用表情特征向量构建人脸表情识别系统。该系统可以识别高兴、生气、厌恶和惊奇 4 种表情,识别率接近 80%。
1997 年,哈尔滨工业大学的高文教授领导的团队将人脸表情识别的研究成果引入我国。2003 年,北京科技大学的王志良教授领导的团队,将人脸表情识别算法应用于机器人的情感控制研究中,并发表了 2002 年以来人脸表情识别发展情况的综述。
2004 年,东南大学的郑文明博士在面部表情识别方面,提出了基于核典型相关分析、偏最小二乘回归等多种识别方 法,并负责开发了 自动面部表情识别系统。2006 年,国家自然科学基金对人脸表情识别的相关研究正式立项。直至今年,项目数有总体增长的趋势。
国内的清华大学、中国科学院、北京航空航天大学、北京交通大学、北京科技大学、哈尔滨工业大学、东南大学、上海交通大学、西北工业大学、华中师范大学等多所高校和科研机构参与了人脸表情识别相关课题的研究。虽然人脸表情识别的商业应用还处于起步阶段,但是国内外研究机构和企业都在不同的领域进行尝试和研究,部分成果已经取得了专利。因此表情识别的研究具有很大的开发潜力。
过程
表情识别可分为三部分:人脸图像的获取与预处理、表情特征提取和表情分类。
人脸图像检测与定位就是在输入图像中找到人脸确切的位置,它是人脸表情识别的第一步。人脸检测的基本思想是用知识或统计的方法对人脸建模,比较待检测区域与人脸模型的匹配程度,从而得到可能存在人脸的区域。其方法大致可分为以下两类:(1)基于统计的人脸检测是将人脸图像视为一个高维向量,将人脸检测问题转化为高维空间中分布信号的检测问题。(2)基于知识的人脸检测是利用人的知识建立若干规则,从而将人脸检测问题转化为假设、验证问题。
表情特征的提取根据图像性质的不同可分为:静态图像特征提取和序列图像特征提取。静态图像中提取的是表情的形变特征,即表情的暂态特征。而对于序列图像不仅要提取每一帧的表情形变特征还要提取连续序列的运动特征。形变特征提取必须依赖中性表情或模型,把产生的表情与中性表情做比较从而提取特征,而运动特征的提取则直接依赖于表情产生的面部变化。特征选择的依据是:①尽可能多的携带人脸面部表情的特征,即信息量丰富;②尽可能容易提取;③信息相对稳定,受光照变化等外界的影响小。
表情识别方法分类大致分为 4 种情况:
(1)基于模板的匹配方法。
(2)基于神经网络的方法。
(3)基于概率模型的方法。
(4)基于支持向量机的方法。