掌桥专利:专业的专利平台
掌桥专利
首页

一种基于手势动作的身份识别技术

文献发布时间:2024-04-18 20:01:55


一种基于手势动作的身份识别技术

技术领域

本发明涉及身份识别领域,尤其涉及一种基于手势动作的身份识别技术。

背景技术

身份识别技术是密码学研究的一项基础内容,是保障信息安全的有效手段,而将生物特征作为身份识别的密码是当前最热门的技术,由于生物特征识别是利用人体特有的生理特征或行为特征来进行个人身份鉴定的技术,具有高可靠性、不易模仿和高准确度的特点,对比传统的口令和标记的识别方法,生物特征识别不但简洁快速,而且利用它进行身份的认定,更易于配合电脑和安全、监控、管理系统整合,实现自动化管理。但目前市面上将人体的手势动作作为生物特征的身份识别方式还未被探索。

有鉴于此,有必要设计一种基于手势动作的身份识别技术,以解决上述问题。

发明内容

本发明的目的在于提供一种将人的手势动作作为一种生物特征的高准确度的基于手势动作的身份识别技术。

为实现上述发明目的,本发明提供了一种基于手势动作的身份识别技术,包括如下步骤:

S1,将收集到的加速度、角速度和倾角数据进行整合,并输入到嵌入层的中进行特征提取特征矩阵;

S2,将所述特征矩阵输入TimesBlock中进行多周期数据特征分析,提取出不同的周期间的数据关系;

S3,将经过所述TimesBlock处理过的数据传入Transformer,通过所述Transformer中的注意力机制来提取动作数据的时序特征;

S4,所述动作数据的时序特征经过一层全连接层后进行分类,完成身份识别。

作为本发明的进一步改进,所述嵌入层配置为稀疏高维的特征数据映射成稠密低维的特征,将离散的数据分布转化到连续的空间。

作为本发明的进一步改进,所述S2包括如下步骤:

S21,所述TimesBlock对于时间长度为T、通道维度为C的一维时间序列X∈R

S22,所述TimesBlock采用Inception卷积核来进行二维的特征提取;

S23,将提取好的若干个二维特征矩阵传入自适应模块中,还原成一维数据后,按照对应分割的周期强度进行加权求和,得到最终输出,即:

其中,A用于表示周期的强度,

作为本发明的进一步改进,所述Transformer由Encoder和Decoder两个部分组成,所述Encoder和所述Decoder均由若干个Block组成,所述Encoder负责对于输入的时序信息进行编码提取特征,所述Decoder负责对于完成编码处理的数据进行解码和还原处理;在所述Encoder和所述Decoder的输入前加入Position Encoding,将时序数据的位置信息加入输入数据作为特征的一维。

作为本发明的进一步改进,所述Encoder负责对于输入的时序信息进行编码提取特征的过程如下:

S311,Multi-HeadAttention层使用自注意力机制来求出若干个不同的特征提取的概率分布,根据概率分布来提取出不同的特征信息,并且进行正则化传入下一层;

S312,Add&Norm层包括Add和Norm两个计算部分组成,计算过程如下:

LayerNorm(X+MultiHeadAttention(X))

LayerNorm(X+FeedForward(X))

其中,所述LayerNorm用于表示层标准化、MultiHeadAttention用于表示多头注意力机制、FeedForward用于表示非线性层;

S313,FeedForward层负责加入非线性函数,计算过程如下:

FeedForward(X)=max(0,XW

其中,W

S314,所述Encoder由若干个Encoder Block组成,配置为增加模型的深度;同时选择Encoder Block个数,所述Encoder Block个数区间为1-5。

作为本发明的进一步改进,所述Decoder负责对于完成编码处理的数据进行解码和还原处理的过程如下:

S321,Masked Multi-HeadAttention层采用了Masked的操作,通过Masked操作将当前要进行解码的数据以后的信息屏蔽掉;

S322,Add&Norm层完成残差连接和Layer Normalization的正则化功能,FeedForward层完成提取特征和提高模型的表达能力的功能;

S323,Multi-HeadAttention中输入由所述Decoder的上一层Masked Multi-HeadAttention的输出和Encoder的输出组成,其中,所述Encoder的输出包含了所有时序数据的信息,所述Masked Multi-HeadAttention的输出包含了要预测的局部数据的信息;

S324,所述Decoder由若干个Decoder Block组成,配置为增加模型的深度;所述Encoder由若干个Encoder Block组成,且所述Decoder Block的个数要和所述EncoderBlock个数保持一致。

作为本发明的进一步改进,所述S4包括如下步骤:

S41,经所述Transformer的输出后,将输出的动作数据的时序特征经过一层全连接层;

S42,通过Sigmoid函数对输出的特征数据进行处理,计算出是否为使用用户的概率,完成身份识别的功能。

本发明的有益效果是:本发明一种基于手势动作的身份识别技术首先将收集到动作过程的加速度、角速度和倾角,进行数据整合,通过嵌入层获取特征数据,获得全面身份识别的动作信息。采用TimesNet中的TimesBlock和Transformer时序模型对手势动作的信息进行多周期的特征提取,提高身份识别的准确率。

附图说明

图1为本发明的一种基于手势动作的身份识别技术的流程图。

图2为本发明中的TimesBlock模块图。

图3为Transformer模型图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。

在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。

请参阅图1-图3所示,本发明提供了一种基于手势动作的身份识别技术,具体过程为:将收集到的加速度、角速度和倾角数据进行整合,经过一层嵌入层的编码,传入TimesBlock模型中,对比传统的时序模型只会收集相邻时刻的数据信息进行学习,本发明使用的TimesBlock会收集不同周期之间的关系进行训练和学习。经过TimesBlock处理的数据,通过Transformer模型中的注意力机制来提取动作数据的时序特征,最后经过一层全连接层后进行分类完成身份识别。

作为较佳的实施例,嵌入层的作用是稀疏高维的特征数据映射成稠密低维的特征,将离散的数据分布转化到可以连续的空间,可以在模型中采用较少的参数来达到拟合数据的效果,无需拟合一些不重要的信息如噪声等,有效减少模型的过拟合。

请参阅图2,TimesBlock由对于时间长度为T、通道维度为C的一维时间序列X∈R

由于二维的数据矩阵,其每列与每行分别对应着相邻的时刻与相邻的周期,而临近的时刻与周期往往蕴含着相似的时序变化。因此,上述二维张量会表现出二维局部性,从而可以很容易通过二维卷积捕捉信息,因此TimesBlock采用Inception卷积核来进行二维的特征提取。

对于提取好的多个二维特征矩阵传入自适应模块中,还原成一维数据后,按照对应分割的周期强度进行加权求和,得到最终输出,即:

其中A表示周期的强度,

作为较佳的实施例,Transformer由Encoder和Decoder两个部分组成,Encoder和Decoder都有多个Block组成,Encoder负责对于输入的信息进行特征提取,所述Decoder负责对于完成编码处理的数据进行解码和还原处理。

Encoder处理过程如下:

步骤1:Multi-HeadAttention层负责使用自注意力机制来求出多个不同的特征提取的概率分布,根据概率分布来提取出不同的特征信息,进行正则化传入下一层。

步骤2:Add&Norm层包括Add和Norm两个计算部分组成,计算过程如下:

LayerNorm(X+MultiHeadAttention(X))

LayerNorm(X+FeedForward(X))

步骤3:FeedForward层负责加入非线性函数,提高模型的表达能力,计算如下:

FeedForward(X)=max(0,XW

步骤4:多个Encoder Block组成Encoder,增加模型的深度,以提高模型拟合复杂数据的能力,提高模型训练和学习的效果,同时要选择合适的Encoder Block个数,过多的Encoder Block可能会提高模型训练成本和时间,并且训练过度可能产生过拟合的情况。

Decoder处理过程如下:

步骤1:Masked Multi-HeadAttention层采用了Masked的操作,因为在模型进行解码的过程中是按照输入时序数据的时间顺序来进行解码翻译的,即解码完前一个数据才能解码后面一个数据,在解码的过程中是无法看到下一个时刻的信息的,所以通过Masked操作将当前要进行解码的数据以后的信息先屏蔽掉,提高解码的准确度。

步骤2:Add&Norm层完成残差连接和Layer Normalization的正则化功能,FeedForward层完成提取特征和提高模型的表达能力的功能。

步骤3:Multi-HeadAttention中输入由Decoder的上一层Masked Multi-HeadAttention的输出和Encoder的输出组成,其中Encoder的输出包含了所有时序数据的信息,而Masked Multi-HeadAttention的输出则包含了要预测的局部数据的信息,这样处理即考虑了全局的信息,有包含了局部的信息。

步骤4:多个Decoder Block组成Decoder,增加了模型的深度,提高了模型能力和效果,且Decoder Block的个数要和Encoder Block个数保持一致。

作为较佳的实施例,由于自注意力机制只会从全局来考虑所有的信息,但没有考虑时序数据的时间先后关系,所以为了将时序数据的在时间轴上的位置信息也进行训练和学习,在Encoder和Decoder的输入之前加入了Position Encoding,将时序数据的位置信息也加入输入数据作为特征的一维。

作为较佳的实施例,在Transformer的输出后面加一个MLP层,来提高模型的复杂度,并且最后用Sigmoid函数来进行对输出进行处理计算出是否为使用用户的概率,以完成身份识别的功能。

综上所述,本发明一种基于手势动作的身份识别技术首先将收集到的加速度、角速度和倾角数据进行整合,经过一层嵌入层的编码,传入TimesBlock模型中,对比传统的时序模型只会收集相邻时刻的数据信息进行学习,本发明使用的TimesBlock会收集不同周期之间的关系进行训练和学习;经过TimesBlock处理的数据,通过Transformer模型中的注意力机制来提取动作数据的时序特征,最后经过一层全连接层后进行分类完成身份识别。该方法采用多周期特征提取模块和Transformer时序模型综合考虑不同周期的手势动作特征,并进行训练和学习;大幅提升身份识别的准确率。

以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

技术分类

06120116566172