内容简介:在之前的文章中(我们可以根据经验大致把图像篡改检测一般性方法归纳为Fig-1所示的三个主要步骤:(1)输入图像预处理;(2)特征提取器;(3)特征输出后处理。事实上,目前的算法主要都在研究这三个部分。
在之前的文章中( 图像篡改检测和定位(一) ),我们谈到图像篡改检测的几种方法,在这里我们主要讨论整个体系的框架里面不同的算法各自的优势,以及存在的问题。
我们可以根据经验大致把图像篡改检测一般性方法归纳为Fig-1所示的三个主要步骤:(1)输入图像预处理;(2)特征提取器;(3)特征输出后处理。事实上,目前的算法主要都在研究这三个部分。
目前的文章大部是基于CNN模型的算法,这里面有一个共同特征:绝大部分文章都把图像做了分片(切割)处理,这里面显然存在一些问题:(1)切片块在篡改区域的交界处,特征是不明显的;(2)切片块的输出特征向量只能代表切片块自己,一但误判,没有补救措施,结果就是误判;(3)很多文章是没考虑纹理度特征的,事实上纹理度密集区域的篡改特征相对低文理处明显。
2.Related Work
A.预处理(Pre-processing)
图像的预处理方法有很多,归结来说这些模型的作用都是在抑制图像内容,提取残差噪声。
预处理的文章有两个类别:(1)静态滤波器(手工设计);(2)动态滤波器(CNN模型);
静态滤波器有很多了,中值滤波MFR(median filter residual) [4],相机是别的PRNU噪声(photo response non-uniformity noise) [5],重采样滤波器[6]、[7],还有图像隐写分析里面用的SRM(steganalytic features)[8]。下面主要看看动态预处理。
Belhassen Bayar 和 Matthew C. Stamm应该是最早提出的动态预处理层的作者了,随后他们在系列的领域(相机模型识别、图像后处理、图像篡改检测)里面开始疯狂地发文章,用的都是一套模型。
这篇文章作为这个方向的终结发在2018年的TIFS里面,应该是很成功的,而这两位作者从2015年就开始用这个idea发文章了。
这篇文章主要解决后处理操作的检测,包括了:Median filtering (MF),Gaussian Blurring (GB),Additive White Gaussian Noise,Resampling,JPEG compression。不得不说,文章写得真的好,motivation阐述严谨、实验部分做的非常完备。
文章的思想也朴素的不能再朴素,在预处理层强制地让CNN内核除中心点为1,然后令中心点为-1,也就是类似归一化处理。作者声称是在模仿静态过滤器做的事情,那么到底先有鸡还是先有蛋??这么做真的有变好吗?这些都是问题。
还是Belhassen Bayar 和 Matthew C. Stamm的文章,换了个话题,采用了2中方法融合预处理,MFR(Median Filter Residual)和他们提出来的Constrained CNN。换汤不换药,一样的效果,不一样的问题。
目前,动态预处理的文章就只有他们的。
B.特征提取(Feature Extraction)
C.特征后处理(Post-processing)
图像篡改检测最难的地方就在于整张图像中篡改块的定位,因为定位是像素级别(pixel-level),不同于检测是图像级别(image-level)。另一方面,不谈整张图像(full image level)篡改区域定位,单单看单个切片块(patch level)的正确率,很多文章都正确率都是95%以上,事实上这种意义相对较小。
那么常见后处理,有几种方法呢?简单地可以分为:(1)单特征提取器融合;(2)多特征提取器融合。
单特征提取融合算法只能检测一种篡改方式;多特征提取器融合主要为了解决多个篡改数据(Copy-Move,Splicing,Removal等等)。
Tampering Detection and Localization through Clustering of Camera-Based CNN Features[9]
还是这篇文章,只用了CNN作为输入特征,期间考虑CNN向量中对每个类别的置信度、纹理度特征、以及融合后的密度系数。
提取的特征简洁、分析的数据很有依据,算法效果也是很好。
Image Forgery Localization via Integrating Tampering Possibility Maps[10]
这篇文章在motivation里面详细讲到了两种检测算法:Splicing和Copy-Move的检测算法,于是作者把CNN+PatchMatch放入特征提取器里面,最后做一步阈值处理决定这张图属于Splicing还是Copy-Move,不同的类别参考的权重系数不一样。
所以文章能够检测多种算法:
但是文章存在比较大的问题是运行速度慢,作者也在文章中阐述特征包含18157维,执行速度比较慢。
4. Conclusion
wait…
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。