微软研究院视觉技术组首席研究员张正友做客名师讲堂

  • 日期:2017-05-15 06:58:00

摘要:

5月9日,IEEE Fellow、ACM Fellow、微软研究院视觉技术组首席研究员张正友受邀做客名师讲堂,为我校师生带来题为“Emotionally Intelligent Virtual Assistant”的学术报告,分享他在人机交互、人脸表情识别等领域的核心技术研究。讲座由国家“千人计划”入选者、计算机学院申恒涛教授主持。

5月9日,IEEE Fellow、ACM Fellow、微软研究院视觉技术组首席研究员张正友受邀做客名师讲堂,为我校师生带来题为“Emotionally Intelligent Virtual Assistant”的学术报告,分享他在人机交互、人脸表情识别等领域的核心技术研究。讲座由国家“千人计划”入选者、计算机学院申恒涛教授主持。

\

张正友首先介绍了人机交互的现状。信息技术的飞速发展对于人们的生活和工作都产生了十分重要的影响,高科技成果在给人们带来快乐和便利的同时也不断促进人机交互领域的发展。他指出,人机交互使用的设备从键盘显示器、鼠标、其他触摸输入设备演变成语音识别、手势识别等输入设备,操作员和计算机在类似于自然语言或受限制的自然语言这一级上进行交互成为可能。分析人机交互未来发展趋势,张正友相信将向下一代的人机交互将向情绪智能迈进,这种人机交互可称为智能化的人机交互。随着高清晰度摄像机和降噪麦克风的出现,通过观察人们的面部表情和声音识别,使用先进的算法,计算机可以深入了解人的情感。

张正友分享了他在情绪智能人机交互领域的研究成果,并详细介绍了作为智能化人机交互技术中的 一个重要组成部分——人脸表情识别(FER)技术,重点介绍了“基于几何与Gabor小波的多层感知表情识别”和“基于特征的识别”面部表情识别技术。他谈到,人脸特征提取是为了找到人脸最合适的表示方式,从而便于识别,首先定位一系列特征点,再通过图像卷积抽取特征点的Gabor小波系数,以Gabor特征的匹配距离作为相似度的度量标准,提取特征之后,表情识别就成为了一个传统的分类问题,可以通过多层神经网络来解决。张正友的研究结果表明,置信点集的几何位置和这些点的多尺度多方向Gabor小波系数,二者既可以独立使用也可以结合使用,Gabor方法优于几何方法,但二者结合效果更佳。他风趣地讲到,使用这项技术,“你的笑不再是你穿的保护色,你是否真的快乐也将会被识别”。这项技术的应用前景非常广阔,可用于教育、医疗、安全检查、广告娱乐等行业。

在交流环节,师生们围绕情绪的复杂多样性与人脸表情识别等方面提出问题,与张正友研究员积极互动。国家“千人计划”入选者、计算机学院葛树志教授也与主讲人就相关学术问题进行了探讨。

\

本次讲堂由人力资源部教师发展中心主办,计算机学院、未来媒体研究中心承办。