掌桥专利:专业的专利平台
掌桥专利
首页

图像隐写分析中基于补偿的检测特征选择方法

文献发布时间:2023-06-19 11:22:42


图像隐写分析中基于补偿的检测特征选择方法

技术领域

本发明属于图像隐写检测技术领域,特别涉及一种图像隐写分析中基于补偿的特征选择方法。

背景技术

随着多媒体技术的飞速发展,数字图像已经成为隐蔽通信的重要载体。隐写者们利用图像隐写技术将秘密信息嵌入图像中,通过公共渠道传递隐写图像,实现了秘密通信。隐写检测是为了检测图像中是否藏有秘密信息,并揭示相应隐写方法的缺点,从而维护网络信息安全和社会稳定。随着图像自适应隐写技术的高速发展,传统的隐写检测方法已经无法应对图像自适应隐写方法的挑战,于是,近年来涌现出大量新的图像隐写检测方法。这些图像高维隐写检测方法为了更加有效地捕获嵌入变化,尽可能多地从不同尺度和方向提取特征子集,造成了隐写检测特征的维数不断升高,最终导致特征提取时间、分类检测计算量和特征存储空间的不断增加。于是,研究者们提出了特征选取方法,以达到降低图像高维隐写检测特征维数,进而减轻分类器的压力,缩短提取特征和分类训练时间的目的。而现有的图像高维隐写检测特征选取方法都需要对高维隐写检测特征进行反复选取,然后训练分类器对载密图像进行检测,最终根据检测结果衡量选取特征的优劣。这种对高维隐写检测特征的反复选取和分类器的反复训练造成了较大的计算和时间开销,难以在实际中推广和应用。

发明内容

为此,本发明提供一种图像隐写分析中基于补偿的特征选择方法,解决在保持图像隐写检测特征检测正确率条件下对其进行大幅度降维,提升隐写检测技术的实际推广应用。

按照本发明所提供的设计方案,一种图像隐写分析中基于补偿的特征选择方法,包含如下内容:

针对收集到的载体图像,利用隐写算法生成不同嵌入率的载密图像,并提取载密图像一维步态隐写检测特征;

度量每个检测特征分量的可分性,并根据每个检测特征分量可分性值对所有检测特征分量进行降序排序;

构建候选特征向量,根据可分性排序结果选取排名第一的特征分量作为初始候选特征向量,并在排序结果中删除此特征,依次将排序结果中的第一个特征分量添加至前一个候选特征向量以形成新的候选特征向量;

度量每个候选特征向量的可分性,选取可分性值最大的候选特征向量作为局部最优特征向量。利用轮特征补偿策略向局部最优特征向量中添加特征分量来获取最终选取的特征向量。

作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,利用基于失真函数的图像隐写算法分别生成不同嵌入率的载密图像。

作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,对不同嵌入率下载密图像的检测特征进行统计分析,基于类间间距、类内间距和类内距离差异的特征分量可分性准则来度量每个检测特征分量的可分性。

作为本发明图像隐写分析中基于补偿的检测特征选择方法,进一步地,假设s

作为本发明图像隐写分析中基于补偿的检测特征选择方法,进一步地,选取

作为本发明图像隐写分析中基于补偿的检测特征选择方法,进一步地,利用自然对数函数均衡

作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,每个检测特征分量可分性的度量公式表示为:

作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,基于类间距离、类内距离和整体类内差异的特征向量可分性准则从候选特征向量中选出局部最优特征向量。

作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,特征向量可分性度量包含如下内容:首先选取可分性值最大的特征分量作为初始候选特征向量,迭代计算当前轮次内相应特征分量的载体特征及载密特征两者的方差和均值;在迭代中内嵌循环计算特征分量的载体特征及载密特征两者的方差和均值;通过特征分量整体类内距离差异度量候选特征向量的可分性值;兵选取可分性值最大的候选特征向量作为局部最优特征向量。

作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,利用特征补偿策略获取最终选取的特征向量,包含如下内容:依据每个特征分量被选中概率及其累计概率,并累计概率与产生的随机数进行比较来旋固特征分量;重复执行直至达到最大执行次数,将选取的特征分量加入局部最优特征向量中形成最终选择的特征。

本发明的有益效果:

本发明通过对隐写检测特征进行选取,使特征子集的势(集合元素的个数)显著低于原始特征的维数,从而减少提取特征所需的时间,而且低维数的特征相比高维特征能明显减轻分类器的压力,缩短分类器处理的时间,故基于约简的特征进行隐写检测能够显著提高检测效率;且,不需要依赖具体的提取算法,实现简单和时间复杂度低,可适用于图像隐写检测特征的选取,具有较好的应用前景。

附图说明:

图1为实施例中图像隐写分析中基于补偿的隐写检测特征选择流程示意;

图2为实施例中新特征向量可分性的度量流程示意;

图3为实施例中基于补偿的隐写检测特征选择整体流程示意;

图4为实施例中选取前后GFR特征的检测正确率对比实验结果示意;

图5为实施例中与Fisher-based算法的对比实验结果示意;

图6为实施例中对不同嵌入率下其它隐写检测特征的对比实验结果示意。

具体实施方式:

为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。

现有的图像高维隐写检测特征选取方法中,无论是基于通用评价准则还是基于特定评价准则,都需要对高维隐写检测特征进行反复选取,然后训练分类器对载密图像进行检测,最终根据检测结果衡量选取特征的优劣。这种对高维隐写检测特征的反复选取和分类器的反复训练造成了较大的计算和时间开销,难以在实际中推广和应用。另外,即使针对隐写检测特征的专门评价准则也不能保证评价结果的绝对准确,即不能够绝对准确地反映相应特征分量对检测载密图像的贡献。这将导致部分有用的特征分量因度量值较小而没能被选取出来,使得选取后的特征向量无法包含对检测载密图像有用的所有信息,导致其对载密图像的检测正确率下降或者无法达到最佳。为了能够进一步降低隐写检测特征的维数,提高其对载密图像的检测正确率,同时提高特征选取的速度,本发明实施例,提供一种图像隐写分析中基于补偿的检测特征选择方法,参见图1所示,包含如下内容:

S101、针对收集到的载体图像,利用隐写算法生成不同嵌入率的载密图像,并提取载密图像一维步态隐写检测特征;

S102、度量每个特征分量的可分性,并根据每个特征分量可分性值对所有特征分量进行降序排列;

S103、构建候选特征向量,根据可分性排序结果选取排名第一的特征分量作为初始候选特征向量,并在排序结果中删除此特征,依次将排序结果中的第一个特征分量添加至前一个候选特征向量以形成新的候选特征向量,并度量每个候选特征向量可分性;

S104、选取可分性值最大的候选特征向量作为局部最优候选特征向量,利用特征补偿策略向局部最优特征向量中添加特征分量以获取最终选取的特征向量。

鉴于特征中存在大量类间距离较小但类内距离较大的特征分量,而这部分特征分量又经常被误判为无用特征,导致最终选取的特征对载密图像的检测正确率不高;本案实施例中,通过度量每个检测特征分量的可分性和候选特征向量可分性来获取局部最优特征向量,降低隐写检测特征的维数、减少运算时间以及提高对载密图像的检测正确率。

作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,利用基于失真函数的图像隐写算法分别生成不同嵌入率的载密图像。例如,对Bossbase-1.01数据库中10000幅512×512的灰度图像,先将其转换成质量因子为95的JPEG载体图像,再利用SI-UNIWARD隐写算法分别生成嵌入率为0.1,0.25,0.5,0.8,1.0的载密图像,对载体和载密图像分别提取GFR隐写检测特征。

作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,对不同嵌入率下载密图像特征进行统计分析,发现当|m

表1GFR特征中满足条件的特征分量统计表

(注,Δm代表|m

在表1中,m

例1:假设存在两个特征分量f

若同时选取

由例1可知,只需选取二者中的最大值即可表示类内距离的差异,于是将

其中1≤i≤N,m

作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,基于类间距离、类内距离和最大类内差异的特征向量可分性准则从候选特征向量中选出局部最优特征向量。进一步地,特征向量可分性度量包含如下内容:首先选取可分性值最大的特征分量作为初始候选特征向量,迭代计算当前轮次内相应特征分量的载体特征及载密特征两者的方差和均值;在迭代中内嵌循环计算特征分量的载体特征及载密特征两者的方差和均值;并结合特征分量的最大类内差异获取候选特征向量的可分性值;选取可分性值最大的候选特征向量作为局部最优特征向量。

C

其中1≤i≤N,1≤j≤i,m

特征向量可分性度量算法过程可设计为如算法1所示:

根据算法1,可以构建出N个候选特征向量,并度量出每个特征向量的可分性,为选取局部最优特征向量提供直接依据。

作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,利用特征补偿策略获取最终选取的特征,包含如下内容:依据每个特征分量被选中概率及其累计概率,并累计概率与产生的随机数进行比较来旋固特征分量;重复执行直至达到最大执行次数,将选取的特征分量加入局部最优特征向量中以形成最终选取的特征。

虽然特征分量可分性准则尽可能准确地度量特征分量的可分性,但都无法完全度量准确,导致可能存在特征分量可分性值较小,但却对提高载密图像检测正确率“有用”的并未被选取的特征分量。因此,本案实施例中在获得局部最优特征向量后,考虑利用特征补偿策略补选一部分可分值小但可能有用的特征分量,与局部最优特征向量共同形成最终选取的特征。特征补偿策略基本思想是:每个个体被选中的概率与其适应度函数值成正比。假设群体大小为N,个体i的适应度函数值为C

利用特征补偿策略补选一部分有用却未被选择的特征分量,将这部分特征分量与局部最优特征向量结合,形成最终选取的特征。具体过程如下:

(1)利用公式(3)计算每个特征分量被选中的概率,在公式中,N代表剩余特征分量的数量,C

(2)利用公式

(3)产生一个[0,10000]区间内的随机数r。

(4)若r≤Q

重复执行(3)、(4)K次,将选取的特征分量加入局部最优特征向量中。这里的K表示特征补偿次数。

本案实施例中,首先,利用特征分量可分性准则度量每个特征分量的可分性;再根据每个特征分量的可分性值对所有特征分量进行降序排列;其次,根据特征分量的排序结果,每次向候选特征向量中添加一维特征分量,形成一个新的候选特征向量;接着,利用特征向量可分性准则度量每个候选特征向量的可分性;然后,选取可分性值最大的候选特征向量作为局部最优特征向量;最后,利用特征补偿策略向局部最优特征向量中添加一部分特征分量,形成最终选取的特征。参见图3所示算法的主要步骤如下:

(1)归一化特征值。利用

(2)度量特征分量可分性。根据步骤(1)中归一化后每个特征分量的载体特征和载密特征,利用特征分量可分性准则度量每个特征分量的可分性。

(3)处理异常数据。对特征分量可分性值为NAN的数据进行处理,使其可分性值为0。

(4)降序排列特征分量。根据步骤(2)中的特征分量可分性值对所有特征分量进行降序排序得ST=[f

(5)构建候选特征向量。初始化,选取可分性值最大的特征分量作为第一个候选特征向量即V

(6)度量特征向量可分性。利用公式(2)计算步骤(5)中每个候选特征向量的可分性值。

(7)选取局部最优特征向量。选取步骤(6)中特征向量可分性值最大的候选特征向量,将其作为局部最优特征向量。

(8)计算剩余特征分量被选中概率。将特征分量可分性值作为轮盘赌算法的适应度函数的结果,根据公式(3)计算每个特征分量被选中的概率。

(9)计算累加概率。根据步骤(8)中剩余的每个特征分量被选中的概率,计算剩余特征分量中前i个特征分量被选中的累加概率Q

(10)补选特征分量。随机生成一个随机数r,通过比较随机数r与累计概率Q

(11)选取最优特征向量。选取步骤(10)中最后一个局部最优特征向量作为最终选择的特征。

F

根据算法2,可将其分解为归一化处理、度量分量可分性并处理异常数据、降序排列特征分量、构建候选特征向量并度量其可分性、选取局部最优特征向量、计算剩余特征分量被选中的概率、计算累加概率、补选特征分量以及确定被选取的特征这九个部分。对九个部分进行分析,得到每个部分的时间复杂度、作用和包含的步骤具体如表2所示:

表2时间复杂度分析表

在表2中,由于每个部分间都是线性独立的,不存在嵌套关系,故算法2的时间复杂度与时间复杂度最大的那部分相等,即O((N-1)(N+2)/2);而现有的依赖集成分类器结果的选取方法,其时间复杂度取决于集成分类器的时间复杂度,即

为进一步验证本案方案有效性,下面结合试验数据做进一步解释说明:

由于篇幅限制,我们以GFR特征为例在Matlab R2016b中进行了特征选取实验,采用的图像来自BOSSbase-1.01图像库,其中包含10000幅512×512的灰度图像。首先,采用SI-UNIWARD隐写算法进行隐写,构建嵌入率分别为0.1,0.25,0.5,0.8,1.0的、质量因子为95的JPEG载密图像库,共得到一组载体图像和五组载密图像。然后,使用GFR特征选取算法(17000-D)对其提取特征。最终,得到包括10000×6=60000幅图像的GFR隐写检测特征库。在训练和分类过程中,继续沿用FLD集成分类器对样本数据进行训练和测试,该集成分类器中的错误率由虚警率和误报率组成。

一、与原始特征的对比实验

对提取的17000维GFR隐写检测特征进行实验,首先,归一化处理数据;其次,根据C

为直观了解SRFS方法对GFR特征的选取效果,将SRFS方法选取后的特征与GFR原始特征进行对比实验,检测其对载密图像的检测正确率,实验结果如图4所示,可知,SRFS方法明显提高了GFR特征的检测正确率,特别是当嵌入率低时,结果越明显。如当嵌入率=0.1时,SRFS选取后的特征的检测正确率为0.5240,GFR原始特征的检测正确率为0.5168,SRFS的检测正确率比原始特征检测正确率提高了0.72%;当嵌入率为0.25时,SRFS选取后的特征的检测正确率为0.5237,GFR原始特征的检测正确率为0.5205,SRFS选取后的特征对载密图像的检测正确率比原始特征检测正确率提高了0.32%。

选取后,随着特征维数的大幅度下降,选取后特征占用的存储空间也随之明显下降。随后,10000幅GFR隐写检测特征选取前后的存储空间进行了对比实验,具体结果表3所示,表3是SRFS方法与原始特征的存储空间对比,从表中可以看到,SRFS方法明显减少了存储空间,如当嵌入率为0.1时,节省了0.6833GB,节省比例为59.59%;当嵌入率为1.0时,节省了0.7521GB,节省比例为65.54%。

表3 SRFS方法与原始特征的存储空间对比表(17000-D)

二、与Fisher-based方法的对比实验

Fisher-based是一种简单有效的特征选取方法,具有判别方法简单、对总体的分布没有特定要求、应用广泛等优点。其过程如下:首先利用均值和标准差度量每个特征分量的可分性值。其次,按照特征分量可分性值对特征分量进行降序排序。接着,度量特征向量的可分性。最后,选取可分性值最大的候选特征向量作为最终选取的特征向量。SRFS方法与Fisher-based方法在不同嵌入率下的检测效果如图5所示,在不同嵌入率下,SRFS方法与Fisher-based方法对GFR隐写检测特征的对比实验图。图中,横轴代表特征维数,纵轴代表检测正确率,每一条线代表一个嵌入率,自上而下,嵌入率分别为1.0,0.8,0.5,0.25,0.1,图中红点代表SRFS方法的结果,蓝点代表Fisher-based方法的结果,绿点代表GFR原始特征的结果。由图5可知,SRFS方法在显著降低特征维数的同时,还进一步提高了检测正确率,实验效果普遍优于Fisher-based方法。

三、与Steganalysis-α方法的对比实验

Steganalysis-α方法的过程如下:首先,对数据进行归一化处理,构建决策表;其次,计算每个特征分量的均值和标准差,进而计算每个特征分量的属性可分性值;然后,设置属性可分性值阈值,删除可分性值低的特征分量;最后划分步长,构建若干候选特征向量,约简特征,选取分类效果好并且位数较低的候选特征向量作为最终选取的特征向量。SRFS方法与Steganalysis-α的对比实验结果如表4所示,可知,在不同的嵌入率下,利用SRFS方法选取后的特征维数都比利用Steganalysis-α方法选取的特征维数低得多,并且SRFS方法的检测正确率优于或基本等于Steganalysis-α方法选取后特征对载密图像的检测正确率。如当嵌入率=0.1时,Steganalysis-α方法得到的特征维数是15493,检测正确率是0.5168,而SRFS方法得到的特征维数是8565,检测正确率是0.5240,不仅进一步降低了6928维,检测正确率还进一步提高了0.71%;同时,在不同的嵌入率下,SRFS方法特征选取的时间均远远低于Steganalysis-α特征选取的时间。如当嵌入率=0.1时,SRFS方法选取特征花费的时间为0.0342小时,而Steganalysis-α选取特征的时间为43.12小时,Steganalysis-α方法的时间是SRFS方法时间的1261倍。由此可知,SRFS方法极大地提升了隐写检测特征选取的速度。

表4 SRFS方法与Steganalysis-α方法的对比实验结果

通过上述内容可说明本案方案SRFS方法的有效性和快速性,基于以上实验数据可进一步验证本案对降低GFR隐写检测特征的维数、减少运算时间以及提高对载密图像的检测正确率是非常有效的。本案方案同样对其他隐写特征也有很好的检测效果。参见图6所示,(a)-(f)分别表示GFR特征(SI-UNIWARD隐写)、DCTR特征(SI-UNIWARD隐写)、DCTR特征(nsF5隐写)、SRM特征(S-UNIWARD隐写)、CC-JRM特征(J-UNIWARD隐写)、CC-PEV特征(SI-UNIWARD隐写)。例如CCPEV特征(SI-UNIWARD),如图6中(f)所示,当Payload=0.2时,本案SRFS选择特征的检测正确率为0.5235,未使用特征补偿策略OSC选择特征的检测正确率为0.5228,原始特征的检测正确率为0.5181。结果表明,本案方案SRFS方法的检测正确率比原始特征检测正确率提高了0.54%,维数降低了42.70%,比OSC方法进一步提高了0.07%。对于DCTR特征(SI-UNIWARD),如图6中(b)所示,当Payload=0.1时,SRFS选择特征的检测正确率为0.5276,OSC选择特征的检测正确率为0.5268,原始特征的检测正确率为0.5239。SRFS方法的检测正确率比原始特征提高了0.37%,维数降低了50.55%,比OSC方法进一步提高了0.08%。

除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。

在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

相关技术
  • 图像隐写分析中基于补偿的检测特征选择方法
  • 隐写分析系统中基于主元特征的隐写分析算法
技术分类

06120112899169