掌桥专利:专业的专利平台
掌桥专利
首页

一种基于改进KAZE特征的人脸表情识别方法

文献发布时间:2024-04-18 20:01:30


一种基于改进KAZE特征的人脸表情识别方法

技术领域

本发明实施例涉及人脸表情识别领域,具体涉及一种基于改进KAZE特征的人脸表情识别方法。

背景技术

面部表情在人类交流中具有极为重要的作用。面部表情通过面部肌肉的运动产生,因此可以通过分析其中运动规律从而实现对面部表情的分析。随着科技的日益进步,表情识别的应用也更为广泛。在表情识别技术中,较为关键的一步就是提取有效的特征,从而准确识别表情。近年来,已有许多特征提取方法应用于表情识别。但像LBP,HOG,Gabor小波等特征提取方法,往往会对全局特征进行统计,从而混入无效特征。为避免此类问题,常用的方法有:对面部关键部分定位,仅保留五官而去除其余像素;或划分图像块后,统计直方图,等等。此类方法增加了计算量的同时,因光照、姿态等影响,受到定位准确性或无效特征的干扰,使其识别表情能力降低。

发明内容

为能解决上述需要,本发明提出一种基于改进KAZE特征的人脸表情识别方法。通过改进KAZE算法的特征点选取方法,在保证了原有的图像信息的情况下,有效提取人脸中的关键特征,从而提高对表情的识别能力。

本发明主要提供如下技术方案:

步骤1:对表情图像预处理后,构建非线性尺度空间。

步骤2:对非线性尺度空间中每层图像中的像素变化率进行度量,从而寻找关键点。

步骤3:生成特征描述子。对于步骤2中得到的关键点位置信息计算主方向,而后构建特征描述子集合,表示为X=[x

步骤4:对于训练集中的每张图像应用上述步骤1至步骤3后得到的特征,利用K-Means算法聚类。聚类为K个簇,作为视觉词典,表示为B=[b

步骤5:对特征描述子进行编码。

步骤6:利用空间金字塔模型,生成最终的特征编码。具体地,空间金字塔分为L层,每层中对原始图像划分的网格数为2

步骤7:对训练集中每张图像的特征描述子应用步骤5与步骤6,求得表征该图像的特征编码后,训练线性SVM用于分类。

在所述步骤1中,构建非线性尺度空间包括以下步骤:

步骤1.1:首先求出演化时间t,具体公式如下:

其中,σ

步骤1.2:依次构建非线性尺度空间中的每一层:

其中I为单位矩阵,A

其中β为对比度因子,

在所述步骤2中,寻找关键点包括以下步骤:

步骤2.1:对非线性尺度空间中每层图像构建如下矩阵,以实现对像素变化的度量:

其中

步骤2.2:设矩阵M的特征值分别为λ

步骤2.3:设置阈值T=αλ

步骤2.4:为防止检测出聚簇点,对非线性空间中每一层选出的关键点依照特征值λ

在所述步骤3中,特征描述子生成包括以下步骤:

步骤3.1:在以关键点为中心半径为6σ

具体地,对邻域内的所有像素点一阶导数L

步骤3.2:构建特征描述子。对于尺度空间第i层以关键点为中心,划分出24σ

然后,以关键点为中心,对子区域描述符向量进行高斯加权(σ

在所述步骤5中,对特征描述子进行编码包括以下步骤:

步骤5.1:对于步骤3中单个特征描述子x

步骤5.2:对x

其中

与现有技术相比,本发明具有的优点和积极效果是:

通过引入非线性扩散,能够在构建非线性尺度空间时,保留图像细节。基于本方法中提出的特征点选择方式,能够提取出语义丰富的特征点,增强了对面部表情的表征能力。应用视觉词袋模型,使特征得到了进一步的抽象,具有了更高级别的语义,使本方法更具鲁棒性。本方法避免像深度学习一样训练复杂,同时能保证在小样本情况下有较好的表现。

附图说明

图1为本发明实施例的流程图。

图2为本发明实施例中关键点选取范围视图。

图3为本发明实施例中对特征描述子求解编码的示意图。

具体实施方式

为使本领域技术人员能更加清晰的理解本发明的目的、技术方案和优点,下面采用一个具体的实施例进行说明,并结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,要说明的是,所描述的实施例是本发明一部分实施例,而不是全部的实施例。以下所述具体实施例的各部分组件可以以其他参数或配置来进行布置与设计。

本实施例在进行识别前,对表情图片进行裁剪,并将图片放缩至128×128,获得用于训练与测试的数据。

如图1所示,本发明实施例的具体操作步骤如下:

步骤1:对表情图像预处理后,构建非线性尺度空间。

在所述步骤1中,构建非线性尺度空间包括以下步骤:

步骤1.1:首先求出演化时间t,具体公式如下:

其中,σ

步骤1.2:依次构建非线性尺度空间中的每一层:

其中I为单位矩阵,A

其中β为对比度因子,

步骤2:对非线性尺度空间中每层图像中的像素变化率进行度量,从而寻找关键点。

在所述步骤2中,寻找关键点包括以下步骤:

步骤2.1:对非线性尺度空间中每层图像构建如下矩阵,以实现对像素变化的度量:

其中

步骤2.2:设矩阵M的特征值分别为λ

步骤2.3:设置阈值T=αλ

步骤2.4:为防止检测出聚簇点,对非线性空间中每一层选出的关键点依照特征值λ

步骤3:生成特征描述子。对于步骤2中得到的关键点位置信息计算主方向,而后构建特征描述子集合,表示为X=[x

在所述步骤3中,特征描述子生成包括以下步骤:

步骤3.1:在以关键点为中心半径为6σ

具体地,对邻域内的所有像素点的一阶导数L

步骤3.2:构建特征描述子。对于尺度空间第i层以关键点为中心,划分出24σ

然后,以关键点为中心,对子区域描述符向量进行高斯加权(σ

步骤4:对于训练集中的每张图像应用上述步骤1至步骤3后得到的特征,利用K-Means算法聚类。聚类为K个簇,作为视觉词典,表示为B=[b

步骤5:对特征描述子进行编码。

在所述步骤5中,对特征描述子进行编码包括以下步骤:

步骤5.1:对于步骤3中单个特征描述子x

步骤5.2:对x

其中

步骤6:利用空间金字塔模型,生成最终的特征编码。具体地,空间金字塔分为L层,每层中对原始图像划分的网格数为2

步骤7:对训练集中每张图像的特征描述子应用步骤5与步骤6,求得表征该图像的特征编码后,训练线性SVM用于分类。

以上详细叙述了本发明实施例,从而帮助本领域技术人员更好的理解本发明的技术方案和优点,要说明的是,在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

技术分类

06120116561635