掌桥专利:专业的专利平台
掌桥专利
首页

基于改进核函数的快速SVM复杂背景下的轮廓提取方法

文献发布时间:2024-04-18 20:01:23


基于改进核函数的快速SVM复杂背景下的轮廓提取方法

技术领域

本发明涉及机器学习的技术领域,尤其是一种基于改进核函数的快速SVM复杂背景下的轮廓提取方法,具体地是基于高斯核函数的支持向量机轮廓提取方法。

背景技术

工业界对工件的定位和缺陷的检测有很大的需求和很高的要求,轮廓提取在计算机视觉和图像分析应用中起着非常重要的作用,轮廓提取会应用到各个领域,比如:偏位检测、缺陷检测等。在工业应用中,不同工件的不同光学面会由于形状不同、光照不同、材料不同,在成像后对轮廓提取会形成不同的干扰。比较细小的指纹、毛絮等干扰通过滤波和形态学操作可以有效的对其进行去除,但是针对图像背景有较大的斑块状干扰和较粗的曲线这种具有复杂背景的现象在进行直线检测过程中会造成提取失败或不准确的情况,即这种复杂背景都会对轮廓提取造成提取失败或不准确现象。

目前,针对以上问题,现有的解决方案就是采用人工核对的方法对轮廓进行提取,然而,这种方法将会耗费大量人力,增加项目成本,同时效率也很低。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。

为此,本发明提出一种基于改进核函数的快速SVM复杂背景下的轮廓提取方法,解决图像背景有大斑块和较粗曲线噪声的轮廓提取问题,提高设备的使用场景,减少项目的人员成本。

根据本发明实施例的基于改进核函数的快速SVM复杂背景下的轮廓提取方法,包括以下步骤:

第1步骤、采用大津法得到物体的前景图:采用大津法对灰度图进行阈值分割得到前景区域;

第2步骤、对前景区域采用中值滤波:得到前景区域后通过中值滤波对前景区域的椒盐噪声进行基本的去噪处理;

第3步骤、针对前景图采用大津法阈值分割:去完椒盐噪声后提取前景区域中的缺陷轮廓;

第4步骤、对图像进行去噪处理:采用基于快速搜索和发现密度峰值的聚类算法对图像进行去噪处理,去除经过预处理后图像中剩余的噪声点;

第5步骤、采用支持向量机进行轮廓提取:采用支持向量机的高斯核函数,进行轮廓提取;

第6步骤、采用改进核函数进行预测加速。

本发明的有益效果是,采用基于快速搜索和发现密度峰值的聚类算法,进行图像去噪;采用高斯核函数的支持向量进行轮廓提取;通过对轮廓提取准确度的提升,可以更好的服务于物料定位等工业需求;在满足工业现场动态需求的情况下,提高项目的准确率,降低图像因背景复杂而不能准确提取到轮廓的影响。

根据本发明一个实施例,在所述第4步骤中,所述聚类算法是一个基于密度聚类的无监督聚类算法,算法假设类簇中心被类簇中其它密度较低的样本点包围并且类簇中心间的距离相对较远,具体包括以下步骤:

第4.1步骤、首先,定义局部密度,局部密度的公式如下:

其中,公式(1)和公式(2)中各个符号所表示的含义是:

p

n表示邻域内除了样本点自身以外点的个数,n是大于等于1的正整数;

i表示第i个样本,i是大于等于1的正整数;

j表示第j个样本,j是大于等于1的正整数;

X的定义为公式(2),公式(2)中的x表示d

d

d

第4.2步骤、然后,定义相对距离,在所有样本点中,有一个样本点的局部密度是所有样本点中取值最大的,设定取值最大的局部密度为p

第4.3步骤、接着,计算每个样本点i的决策值;

第4.4步骤、再接着,通过决策值寻找密度峰值,决策值最大的值所对应的密度值为密度峰值;

第4.5步骤、找到密度峰值后,算法将剩余样本点分配给局部密度比密度峰值高的最近的密度峰值样本点所在的簇。

根据本发明一个实施例,在所述第4.2步骤中,除局部密度最大取值p

其中,公式(3)中各个符号所表示的含义是:

δ

表示在所有d

p

p

d

在所述第4.3步骤中,决策值的公式如下:

γ

其中,公式(5)中各个符号所表示的含义是:

γ

根据本发明一个实施例,

在所述第4.2步骤中,仅对于局部密度最大取值p

δ′

其中,公式(4)中各个符号所表示的含义是:

δ′

max

d

在所述第4.3步骤中,决策值的公式如下:

γ

其中,公式(5)中各个符号所表示的含义是:

γ

根据本发明一个实施例,在所述第5步骤中,对图像特征进行升维操作,即对样本进行函数映射,该样本是图像数据中的像素点,具体包括以下步骤:

第5.1步骤、首先,在第4步骤中得到的所有点集中挑选出两类点集;

第5.2步骤、然后,通过函数φ对两类样本进行升维映射操作后,用一个超平面对两类样本进行分类;

第5.3步骤、最后,通过函数φ

根据本发明一个实施例,支持向量机线性可分时的表达式如下:

f(x)=wx+b (6)

其中,公式(6)中各个符号所表示的含义是:

f(x)表示样本x的预测值;

w表示向量,向量大小为每个样本的特征个数;

x表示需要预测的样本;

b表示偏差。

根据本发明一个实施例,支持向量机线性不可分时的表达式如下:

g(x)=wφ(x)+b (7)

其中,公式(7)中各个符号所表示的含义是:

g(x)表示样本x的预测值;

w表示向量,向量大小为每个样本的特征个数;

φ表示函数;

x表示需要预测的样本;

b表示偏差。

根据本发明一个实施例,在二分类的情况下,当预测值大于0时,则样本x被判断为正样本;当预测值小于0时,则样本x被判断为负样本。

根据本发明一个实施例,

未进行特征映射时的目标函数是

已进行特征映射时的目标函数是

其中,φ(x

根据本发明一个实施例,通过分析未进行特征映射时的目标函数和已进行特征映射时的目标函数,使用非线性映射φ后将数据变换到一个高维的特征空间后,还需要再在新的特征空间上用线性学习分类器进行求解,故而引入核K,核K的计算公式如下:

K(x,z)=φ(x)

其中,公式(8)中各个符号所表示的含义是:

K(x,z)表示由两个样本x和z通过相同的映射函数φ进行点乘得到的;

φ(x)表示样本x的映射函数;

T表示对向量进行转置;

φ(z)表示样本z的映射函数。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的流程图;

图2是原始两类点集的分布图像;

图3是升维后两类点集的分布图像;

图4是逆映射两类点集的分布图像;

图5是带有缺陷的原始图像;

图6是图5通过大津法和中值滤波等预处理后的二值图;

图7是图6经过采用基于快速搜索和发现密度峰值的聚类算法后得到的去除噪声的图像;

图8是图7经过支持向量机的高斯核函数处理后的缺陷轮廓;

图9是工业界常见的带有复杂背景的轮廓原图片一;

图10是工业界常见的带有复杂背景的轮廓原图片二;

图11是图9采用高斯核函数支持向量机算法后找到的轮廓;

图12是图10采用高斯核函数支持向量机算法后找到的轮廓。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面参考附图具体描述本发明实施例的基于改进核函数的快速SVM复杂背景下的轮廓提取方法。

见图1,本发明的基于改进核函数的快速SVM复杂背景下的轮廓提取方法,包括以下步骤:

第1步骤、采用大津法得到物体的前景图:采用大津法对灰度图进行阈值分割得到前景区域;

第2步骤、对前景区域采用中值滤波:得到前景区域后通过中值滤波对前景区域的椒盐噪声进行基本的去噪处理;

第3步骤、针对前景图采用大津法阈值分割:去完椒盐噪声后提取前景区域中的缺陷轮廓;

第4步骤、对图像进行去噪处理:采用基于快速搜索和发现密度峰值的聚类算法对图像进行去噪处理,去除经过预处理后图像中剩余的噪声点;聚类算法是一个基于密度聚类的无监督聚类算法,算法假设类簇中心被类簇中其它密度较低的样本点包围并且类簇中心间的距离相对较远,具体包括以下步骤:

第4.1步骤、首先,定义局部密度,局部密度的公式如下:

其中,公式(1)和公式(2)中各个符号所表示的含义是:

p

n表示邻域内除了样本点自身以外点的个数,n是大于等于1的正整数;

i表示第i个样本,i是大于等于1的正整数,i的取值范围大于n的取值范围;

j表示第j个样本,j是大于等于1的正整数,j的取值范围是[0,n];

X的定义为公式(2),公式(2)中的x表示d

d

d

第4.2步骤、然后,定义相对距离,在所有样本点中,一定会有一个样本点的局部密度是所有样本点中取值最大的,这时公式(3)就无法使用,对于密度最高的样本点其相对距离定义为公式(4),设定取值最大的局部密度为p

除局部密度最大取值p

其中,公式(3)中各个符号所表示的含义是:

δ

表示在所有d

p

p

d

仅对于局部密度最大取值p

δ

其中,公式(4)中各个符号所表示的含义是:

δ

max

d

剩余的密度峰值需要同时满足两个条件:局部密度p

第4.3步骤、接着,计算每个样本点i的决策值;

当p

γ

其中,公式(5)中各个符号所表示的含义是:

γ

p

δ

当p

γ

其中,公式(13)中各个符号所表示的含义是:

γ

p

δ

第4.4步骤、再接着,通过决策值寻找密度峰值,决策值最大的值所对应的密度值为密度峰值;

第4.5步骤、找到密度峰值后,聚类算法将剩余样本点分配给局部密度比密度峰值高的最近的密度峰值样本点所在的簇。此聚类算法很好地解决了噪声抑制和保持图像边缘细节之间的矛盾,可以说在进行去噪的过程中并没有对边缘进行模糊化处理。

第5步骤、采用支持向量机进行轮廓提取:采用支持向量机的高斯核函数,进行轮廓提取;由于轮廓是由曲线构成,传统的支持向量机是无法提取曲线形状的轮廓,所以对图像特征进行升维操作,即对样本进行函数映射,该样本是图像数据中的像素点,具体包括以下步骤:

第5.1步骤、首先,在第4步骤中得到的所有点集中挑选出两类点集;

第5.2步骤、然后,通过函数φ对两类样本进行升维映射操作后,用一个超平面对两类样本进行分类;

第5.3步骤、最后,通过函数φ

如图2所示的坐标系,X

如图3所示的坐标系,Z

如图4所示的坐标系,X

支持向量机线性可分时的表达式如下:

f(x)=wx+b (6)

其中,公式(6)中各个符号所表示的含义是:

f(x)表示样本x的预测值;

w表示向量,向量大小为每个样本的特征个数;

x表示需要预测的样本;

b表示偏差。

支持向量机线性不可分时的表达式如下:

g(x)=wφ(x)+b(7)

其中,公式(7)中各个符号所表示的含义是:

g(x)表示样本x的预测值;

w表示向量,向量大小为每个样本的特征个数;

φ表示函数;

x表示需要预测的样本;

b表示偏差。

在二分类的情况下,当预测值f(x)大于0时,则样本x被判断为正样本;当预测值f(x)小于0时,则样本x被判断为负样本。同理,在二分类的情况下,当预测值g(x)大于0时,则样本x被判断为正样本;当预测值g(x)小于0时,则样本x被判断为负样本。

第6步骤、采用改进核函数进行预测加速。

未进行特征映射时的目标函数是

已进行特征映射时的目标函数是

其中,N表示所有样本个数;α

通过分析两个目标函数,即通过分析未进行特征映射时的目标函数和已进行特征映射时的目标函数可以发现,使用非线性映射φ后将数据变换到一个高维的特征空间后,还需要再在新的特征空间上用线性学习分类器进行求解,故而引入核K的概念,核K的计算公式如下:

K(x,z)=φ(x)

其中,公式(8)中各个符号所表示的含义是:

K(x,z)表示由两个样本x和z通过相同的映射函数φ进行点乘得到的;

φ(x)表示样本x的映射函数;

T表示对向量进行转置;

φ(z)表示样本z的映射函数。

通过加入高斯核函数,这样就可以将映射函数的求解和线性分类器求解这两个步骤聚合到一起建立起一个非线性学习器。高斯核函数的公式如下:

其中,公式(9)中各个符号所表示的含义是:

K(x

exp表示以e为底数的指数函数;

x

x

σ为一个调控参数,x

其中,公式(10)中各个符号所表示的含义是:

h(x)表示预测函数;

N表示所有样本个数;

α

y

K(x

b表示常数项。

最终通过对图片上每个像素点进行预测得出每个像素的预测值,当预测值接近于0时,则样本x就是图像上的轮廓点。

在对预测函数进行求解时发现,预测函数的时间复杂度为Ο,其中,Ο=n×L;

n为支持向量机的个数,L为样本特征数。因此,如果n的值增大,并且高斯核的计算又相对复杂,这样在应用过程中是无法达到实时性要求的。本发明对决策函数的核函数进行了优化改进为公式(11),带入决策函数后为公式(12)

其中,公式(11)中各个符号所表示的含义是:

G(x

L表示样本特征数;

x

x

其中,公式(12)中各个符号所表示的含义是:

l(x)表示决策函数;

N表示所有样本个数;

α

y

x

x

b表示常数项。

当x

经过和改进前的核函数对比,可以看出改进后的核函数有更简洁的计算形式。改进后的核函数去掉了平方操作和指数操作,也就是说,当有相同的数据量作为输入时,改进后的核函数能够明显的降低计算复杂程度,从而降低计算时间。改进后的核函数虽然没有改变时间复杂度,但是在实际处理数据时,有效的提高了计算效率。经过上述过程的处理,本发明在不降低轮廓提取精度的前提下,有效的减少了计算时间。

图5是带有缺陷的原始图像。

图6是图5通过大津法和中值滤波等预处理后的二值图,可以明显看出处理后的图像还是有很多噪声点的。

图7是图6经过采用基于快速搜索和发现密度峰值的聚类算法后得到的去除噪声的图像,非缺陷区域的噪声已被去除并且轮廓保持清晰。

图8是图7经过支持向量机的高斯核函数处理后的缺陷轮廓。

图9和图10是通过归纳总结找出工业界常见的一些带有复杂背景的轮廓图片。

图11是图9采用高斯核函数支持向量机算法后找到的轮廓。

图12是图10采用高斯核函数支持向量机算法后找到的轮廓。

通过实验验证本发明适用于大斑块和条状噪声的轮廓提取。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

相关技术
  • 图像处理方法和装置、电子设备、计算机可读存储介质
  • 图像处理方法、装置、电子设备及计算机可读存储介质
  • 图像处理方法和装置、电子设备、计算机可读存储介质
  • 图像处理方法和装置、电子设备、计算机可读存储介质
  • 图像处理方法和装置、电子设备、计算机可读存储介质
  • 图像处理方法、图像处理装置、电子设备和计算机可读存储介质
  • 图像处理方法、图像处理装置、电子设备和计算机可读存储介质
技术分类

06120116553103