EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

栏目: 编程工具 · 发布时间: 6年前

内容简介:当地时间2018年10月20日,由国际计算机协会ACM ICMI 2018举办的第六届EmotiW2018 视频情感识别大赛在美国科罗拉多进行了奖项授予。思图场景AI团队在百余支世界顶尖研究机构与院校成绩比拼中脱颖而出,获得了音视频短片情绪分类挑战赛冠军奖杯。本次大赛,思图场景在EmotiW2018的视频情绪分类挑战赛中获得第一名,情绪识别分类准确率比2017年冠军IntelLab高1.53%。

当地时间2018年10月20日,由国际计算机协会ACM ICMI 2018举办的第六届EmotiW2018 视频情感识别大赛在美国科罗拉多进行了奖项授予。

思图场景AI团队在百余支世界顶尖研究机构与院校成绩比拼中脱颖而出,获得了音视频短片情绪分类挑战赛冠军奖杯。本次大赛,思图场景在EmotiW2018的视频情绪分类挑战赛中获得第一名,情绪识别分类准确率比2017年冠军IntelLab高1.53%。

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法 EmotiW2018 音视频组竞赛前10名

在此次国际大赛中,思图场景充分用成绩证明了“以应用场景为基础的研发模式”在人工智能技术发展方面的创新性及有效性,为人工智能技术在应用领域的发展提供了思路。

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法 思图场景AI团队获奖

经过与思图场景AI团队沟通与允许后,下面对其情感识别算法进行一下重要解析与公布:

思图场景情感识别算法采用多种特征融合的方式对视频进行了分类,显著提升了情绪识别的准确率,其整体结构如下:

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

其算法主要涉及到4个模块,分别是卷及神经网络(CNN)、长短期记忆网络(LSTM)、人脸关键点几何特征和声音特征。这四个不同的特征模块,保证了算法可以学习到视频的多方信息。

CNN和LSTM是两个比较流行的处理视频情绪的方法,他们需要依靠大量的数据支撑,思图场景凭借在情感计算中积累的数据库进行训练深度学习模型预训练。在不同深度学习网络中,视频单帧人脸情绪识别准确率为:

Network

Inception-V3

DenseNet-121

DenseNet-161

DenseNet-201

预测准确率

82.79

83.86

83.27

79.75

运用人脸图片预训练的深度学习模型,进行时视频情绪分类的结构如下,其中具体用到了两种方式对提取的CNN特征进行归一化:

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

除此之外,思图场景还运用了工程上经过验证的方法:关键点欧式距离,该方法提取了一些人脸的高级特征,运用关键点的几何变化来预测情绪变化。该方法证实可靠高效,并且不需额外数据集训练,对结果有很大影响。其程序为:人脸3D关键点检测,3D特征提取,取平均值,标准差和最大值,SVM分类器的训练。具体流程如下:

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

在音频方面,思图场景首次运用SoundNet的结构来对声音进行预测:

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

通过上述多种算法模块融合,思图场景在EmotiW2018上最终的准确率为61.87%。

Item

Result

Baseline

40.47

Emotiw2017 1 st IntelLab

60.34

Emotiw2018 1 st SituTech

61.87

其对应的多种情绪混淆矩阵如下表:

EmotiW2018国际大赛夺冠 解析思图场景情感识别算法

这表明,思图场景自身的算法及海量数据集对视频情感分类的效果提升明显,尤其是在判断开心、生气和中性非常明显,其可靠类别的分类情况已经达到商用落地的水平,可在一定应用环境下更真实的“体会”用户的意图,进而促进视觉理解、人机交互技术在场景应用层面的发展。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

决战大数据

决战大数据

车品觉 / 浙江人民出版社 / 2014-3-1 / 45.9

[内容简介]  大数据时代的来临,给当今的商业带来了极大的冲击,多数电商人无不“谈大数据色变”,并呈现出一种观望、迷茫、手足无措的状态。车品觉,作为一名经验丰富的电商人,在敬畏大数据的同时,洞悉到了数据时代商业发展的更多契机,他创新了数据框架的建立和使用,重新量化了数据价值的指标,并挖掘了在无线数据和多屏时代下商业发展的本质……在他看来,改变思维方式,即可改变数据和商业的未来。  ......一起来看看 《决战大数据》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具