掌桥专利:专业的专利平台
掌桥专利
首页

分类识别方法、装置、识别设备及存储介质

文献发布时间:2023-06-19 18:34:06


分类识别方法、装置、识别设备及存储介质

技术领域

本发明实施例涉及人工智能和计算机视觉技术领域,尤其涉及一种分类识别方法、装置、识别设备及存储介质。

背景技术

近年来,人工智能和计算机视觉技术高速发展,加速了信息时代的教育变革,学校越来越重视课堂行为识别的信息化和智能化。课堂教学活动效果直接体现在学生的课堂行为,有助于教师及时改进教学方式,进一步提升教师的教学水平。因此观察学生课堂行为对提高教学质量有重要意义。

传统的课堂行为分析主要依靠人工观察记录教师和学生上课的视频,进而分析教学中的问题。这种方式费时费力,效率低下。面对课堂教学视频中目标众多、遮挡严重等问题,一类是基于目标检测和图像分类的算法,只是对目标进行简单的分类,当检测目标和训练数据集的场景差异比较大时,其识别准确率会有较大的下降;另一类是通过人体关键点识别,然后对关键点进行SVM分类或CNN分类,是通过深度学习自动提取分类所需的特征,相比传统的机器学习模型不透明,可解释性差,准确率难以保证。

为此,如何解决提高对象行为的分类识别准确率成为目前亟待解决的问题。

发明内容

鉴于此,为解决上述对象行为的分类识别准确率的技术问题,本发明实施例提供一种分类识别方法、装置、识别设备及存储介质。

第一方面,本发明实施例提供一种分类识别方法,包括:

获取图像样本库,所述图像样本库中存储多个图像样本;

将待识别的目标图像与所述图像样本库中的全部所述图像样本进行匹配,确定匹配概率;

根据所述匹配概率,确定所述目标图像的分类识别结果。

在一个可能的实施方式中,所述获取图像样本库,包括:

获取多个初始图像样本,并对所述初始图像样本进行分类;

生成所述初始图像样本对应的类别标签;

对所述初始图像样本进行预处理,得到对应的图像样本;

将全部所述图像样本和对应的类别标签存储至指定数据库,生成所述图像样本库。

在一个可能的实施方式中,所述对所述初始图像样本进行预处理,得到对应的图像样本,包括:

将所述初始图像样本输入至Openpose姿态识别网络中进行姿态特征提取,得到第一提取结果;

对所述第一提取结果进行归一化处理,得到第一姿态特征数据对应的图像样本。

在一个可能的实施方式中,所述将待识别的目标图像与所述图像样本库中的全部所述图像样本进行匹配,确定匹配概率,包括:

将待识别的目标图像输入至Openpose姿态识别网络中进行姿态特征提取,得到第二提取结果;

将所述第二提取结果与全部所述图像样本进行匹配,确定匹配概率。

在一个可能的实施方式中,所述将所述第二提取结果与全部所述图像样本进行匹配,确定匹配概率,包括:

对所述第二提取结果进行归一化处理,得到第二姿态特征数据对应的目标图像;

获取所述第二姿态特征数据对应的目标图像与所述第一姿态特征数据对应的全部所述图像样本的曼哈顿距离;

根据所述曼哈顿距离,确定所述目标图像与全部所述图像样本的匹配概率。

在一个可能的实施方式中,所述根据所述匹配概率,确定所述目标图像的分类识别结果,包括:

获取所述曼哈顿距离中最小的K个图像样本,K的值由曼哈顿距离预先训练确定;

记录所述K个图像样本的类别标签;

统计所述K个图像样本中对应所述类别标签的分布概率,得到所述匹配概率;

选取所述匹配概率最大的所述图像样本对应的类别标签作为所述目标图像的类别,确定所述目标图像的分类识别结果。

在一个可能的实施方式中,所述方法,还包括:

在预设的时间阈值内截取指定视频中的多个图像;

将所述图像作为目标图像进行存储。

第二方面,本发明实施例提供一种分类识别装置,包括:

获取模块,用于获取图像样本库,所述图像样本库中存储多个图像样本;

匹配模块,用于将待识别的目标图像与所述图像样本库中的全部所述图像样本进行匹配,确定匹配概率;

识别模块,用于根据所述匹配概率,确定所述目标图像的分类识别结果。

第三方面,本发明实施例提供一种识别设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的分类识别程序,以实现第一方面中任一所述的分类识别方法。

第四方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一所述的分类识别方法。

本发明实施例提供的分类识别方案,通过获取图像样本库,所述图像样本库中存储多个图像样本;将待识别的目标图像与所述图像样本库中的全部所述图像样本进行匹配,确定匹配概率;根据所述匹配概率,确定所述目标图像的分类识别结果;通过采集多个图像样本,并设定图像样本的类别,存储到图像样本库中,将待识别的目标图像与存储在图像样本库中的全部图像样本进行匹配,判断是否与图像样本匹配一致,则确定目标图像识别结果为对应的图像样本,将识别到的多个图像样本进行统计得到针对全部图像样本的匹配概率,根据匹配概率的大小确定目标图像的对应识别结果的分类结果;由本方案,可以实现针对对像行为的识别结果的分类处理,提高分类识别准确率的技术效果。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1为本发明实施例提供的一种分类识别方法的流程示意图;

图2为本发明实施例提供的另一种分类识别方法的流程示意图;

图3为本发明实施例提供的一种分类识别装置的结构示意图;

图4为本发明实施例提供的一种识别设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例中的用语“包括”和“具有”用以表示开放式的包括在内的意思,并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。此外,附图中的不同元件和区域只是示意性示出,因此本发明不限于附图中示出的尺寸或距离。

为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。

OpenPose姿态识别网络指的是人体姿态识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以caffe为框架开发的开源库。可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用,基于它的实例如雨后春笋般涌现。人体姿态估计技术在体育健身、动作采集、3D试衣、舆情监测等领域具有广阔的应用前景。

图1为本发明实施例提供的一种分类识别方法的流程示意图。用于针对对象行为的识别结果的分类处理过程中。如图1所提供的示图,分类识别方法具体包括:

S101、获取图像样本库,图像样本库中存储多个图像样本。

本发明实施例的执行主体为识别系统,识别系统中设置有图像样本库,用于存储图像样本和每一张图象样本对应的类别,通过图像样本与待识别的图像进行匹配,找到待识别的图像的类别与图像样本识别相同的图像的个数,统计识别结果中数量最多的类别,确定待识别的图像的识别结果对应类别。

这里说的图像样本库可以理解为在识别系统中创建的一个数据库,预先存储多个行为类别的图像样本的数据库,作为待识别图像的识别和分类匹配依据。这里说的图像样本可以理解为针对指定视频中出现的对象行为的一些模板图像,通过图像样本预先设定类别。

进一步地,在识别系统中创建一个数据库,将采集到的多个图像样本作为图像模板存储到数据库中,得到一个图像样本库,根据与图像样本库中的图像样本进行比对,可以确定图像与图像样本库中的一个或多个图像样本的行为类别一致,进而为图像的行为类别的识别提供参考依据。

S102、将待识别的目标图像与图像样本库中的全部图像样本进行匹配,确定匹配概率。

这里说的目标图像可以理解为待识别的对象行为的图像数据,可以是一些视频中截取的瞬间动态图像或画面,或者是一些指定格式的人物、动物或移动设备的静态图像。这里说的匹配可以理解为一种比对过程,用于判断目标图像与图像样本的相似度,这里说的匹配概率可以理解为目标图像与全部图像样本中匹配成功的个数占全部图像样本总数的比重。

进一步地,在确定好图像样本库的基础上,获取待识别的目标图像,然后根据目标图像的特征数据与图像样本库中的每一个图像样本对应的特征数据进行比对,确定是否比对成功,当比对成功时,认定当前目标图像与比对成功对应的图像样本的行为类别相同,统计比对成功的图像样本的个数,并计算在图像样本总数量中的占比,将这个占比作为匹配概率进行存储和输出。

S103、根据匹配概率,确定目标图像的分类识别结果。

这里说的分类识别结果可以理解为针对目标图像的识别结果进行分类,得到的分类结果。

进一步地,根据目标图像得到的匹配概率,可以获取匹配概率的分布情况,根据分布情况,选取匹配概率最高情况时对应的图像样本的识别类别,根据图像样本的识别类别确定对应的识别图像的分类结果,进而确定目标图像对应的图像行为的分类识别结果,完成针对对像行为的识别结果的分类处理,实现提高分类识别准确率的技术效果。

本发明实施例提供的分类识别方法,通过获取图像样本库,图像样本库中存储多个图像样本;将待识别的目标图像与图像样本库中的全部图像样本进行匹配,确定匹配概率;根据匹配概率,确定目标图像的分类识别结果;通过采集多个图像样本,并设定图像样本的类别,存储到图像样本库中,将待识别的目标图像与存储在图像样本库中的全部图像样本进行匹配,判断与那些图像样本匹配一致,则确定目标图像识别为对应的图像样本,将识别到的多个图像样本进行统计得到针对全部图像样本的匹配概率,根据匹配概率的大小确定目标图像的对应识别结果的分类结果;由本方案,可以实现针对对像行为的识别结果的分类处理,提高分类识别准确率的技术效果。

图2为本发明实施例提供的另一种分类识别方法的流程示意图。用于针对对象行为的识别结果的分类处理过程中。图2是在上一种实施例的基础上进行介绍的。如图2所提供的示图,分类识别方法具体还包括:

S201、获取多个初始图像样本,并对初始图像样本进行分类。

本发明实施例的执行主体为识别系统,识别系统中设置有图像样本库,用于存储图像样本和每一张图象样本对应的类别,通过图像样本与待识别的图像进行匹配,确定待识别的图像与图像样本库中匹配成功的,则认为待识别的图像的类别与图像样本相同,找到所有识别结果相同的图像样本,统计图像样本对应的多个类别中数量最多的类别,则确定待识别的图像的识别结果对应的类别为图像样本中匹配成功中数量最多对应的类别。

这里说的初始图像样本可以理解为未经处理过的图像样本,可以是通过针对指定视频截取的定格图像或指定画面内的静态图像。例如,一段过马路视频中随机截取的几个瞬间画面,或是一段视频中暂停时定格的画面都可以作为初始图象样本。这里说的分类可以理解为针对每一张初始图像样本的行为状态进行区分,根据初始图象样本中对象的关键点信息数据确定的初始图象样本对应的行为状态的具体类别。例如,在一张学生上课视频的瞬间画面中,展示了一位学生正趴在桌子上睡觉,则根据分析画面中学生肢体的多个关键点信息,比如趴着的动作和眼睛闭上的状态,可以将当前画面的行为类别定义为睡觉类别,当再次检测到趴着或闭眼状态信息时,可以作为睡觉行为的分类依据。

进一步地,通过专业截图软件或图像采集设备采集多个初始图像样本,并对采集到的初始图像样本进行分类,确定每一张初始图象样本的行为状态对应的类别,这里的多张初始图象样本的类别可以是相同的行为状态类别,或者是不同的行为状态类别,但是每一张初始图象样本不存在相同重复的两张。

S202、生成初始图像样本对应的类别标签。

这里说的类别标签可以理解为初始图像样本分类的类别名称。例如,针对学生上课时的多个图像数据中,根据图像中学生的状态的不同,可以将学生行为状态进行分类,分成睡觉状态的类别标签、说话状态的类别标签或玩手机状态的类别标签等。

进一步地,通过将采集到的初始图象样本的数据进行分类,得到多个图像行为类别,针对每一种行为类别进行标记名称,将每一种类别定义为一个类别标签,确定初始图像样本的全部类别标签。

在一种可能的示例场景中,收集学生上课的视频,通过图像采集设备采集视频中不同时间段内(可以是随机连续采集或是间隔3秒采集一张图像的方式)的100个瞬间画面,对每一张画面中的学生行为状态进行识别,对每一张画面中学生的行为类别进行分类,例如,可以是睡觉类别、说话类别或玩手机类别等,可能存在多种画面的类别相同,都为睡觉类别或玩手机类别。通过统计100张瞬间画面可以分类为10种行为类别,在将每一种行为类别进行标记,定义一个类别名称,将类别标签作为类别名称进行存储。例如将行为类别中睡觉类别定义为类别标签1,则类别标签1代表睡觉类别。

S203、将初始图像样本输入至Openpose姿态识别网络中进行姿态特征提取,得到第一提取结果。

这里说的Openpose姿态识别网络可以理解为一种姿态特征提取工具,用于提取图像中的关键点的坐标数据。一般可以提取到人体中18个关键部位特征的具体位置信息。这18个部位具体包含:左目、右目、左耳、右耳、鼻子、颈部、左肩、右肩、左肘、右肘、左手腕、右手腕、左腰、右腰、左膝、右膝、左脚踝和右脚踝的18个位置。这里说的第一提取结果可以理解为针对初始图像样本得到的18个部位的姿态特征数据。

进一步地,将采集到的全部初始图像样本输入到Openpose姿态识别网络中进行姿态特征提取,提取出每一张初始图象样本的18个指定部位坐标信息,将提取到的指定部位的特征数据作为第一提取结果进行存储。

S204、对第一提取结果进行归一化处理,得到第一姿态特征数据对应的图像样本。

这里说的归一化处理可以理解为将数据按比例缩放,使其缩放到相同的数据区间和范围,以减少个体本身的身高差异和摄像头采集画面远近导致的个体身高差异,消除个体身高差异对行为的分类识别的影响。这里说的第一姿态特征数据可以理解为经过Openpsoe姿态识别网络提取到的特征数据。例如,对于人体图像来说经过Openpsoe姿态识别网络得到人体18个部位的关键点的位置信息,将这18个位置信息和部位名称作为第一姿态特征数据。这里说的图像样本可以理解为经过初始图象样本处理后得到的一些模板图像。

进一步地,对Openpsoe姿态识别网络处理过的特征数据再次进行归一化处理,得到统一设定范围的第一姿态特征数据,可以设定第一姿态特征数据的表达公式1为:

S

其中,pi表示第i个身体部位的位置,i=1,2,...,n,n表示身体部位的总数;R2表示二维欧式空间,y表示预先定义的姿态类别,N表示姿态类别集合。

S205、将全部图像样本和对应的类别标签存储至指定数据库,生成图像样本库。

这里说的图像样本库可以理解为在识别系统中创建的一个数据库,预先存储多个行为类别的图像样本的数据库,作为待识别图像的识别和分类匹配依据。

进一步地,经过对初始图像样本的处理得到对应的图像样本,对每一个图像样本的类别进行分类,利用对初始图像样本做的类别标签对应关联到处理后的同一张图像样本中,获得图像样本与类别标签的一一映射关系,再将全部图像样本和对应的类别标签的关联关系存储至一个设定的数据库中,作为图像样本库进行存储。

在一种可能的示例场景中,从系统图片库中下载100张学生上课视频中随机采集的图像,将这100张图像输入到Openpose姿态识别网络中进行姿态特征提取,得到100张学生上课的姿态特征数据,每一张都包含人体中18个关键点的坐标信息和关键点部位的名称,将这些提取到的关键点坐标信息进行尺寸归一化处理,得到统一尺寸下的学生上课的行为姿态特征数据,根据每一张姿态特征数据确定每一张图像的类别,将类别名称按照类别标签的格式与每一张图像关联,并将每一张图像的姿态特征数据和关联的类别标签存储在指定数据库中,获得一个识别学生行为姿态特征的数据库。

S206、在预设的时间阈值内截取指定视频中的多个图像。

S207、将图像作为目标图像进行存储。

这里说的预设时间可以理解为周期时间或者设定好的固定时间间隔,例如,可以是间隔2秒、3秒或5秒时间的周期时间。这里说的图像可以理解为待识别类别的视频中出现的一些瞬间画面,还可以通过其他方式获取目标图像,在这里就不再赘述。

进一步地,通过图像采集器或视频剪辑软件对待识别的视频内容中按照周期时间采集多个图像,并将采集到的多个图像作为待识别的目标图像进行存储,为下一步对目标图像的识别处理做好准备。

S208、将待识别的目标图像输入至Openpose姿态识别网络中进行姿态特征提取,得到第二提取结果。

这里说的目标图像可以理解为待识别的对象行为的图像数据,可以是一些视频中截取的瞬间动态图像或画面,或者是一些指定格式的人物、动物或移动设备的静态图像。这里说的Openpose姿态识别网络可以理解为一种姿态特征提取工具,用于提取图像中的关键点的坐标数据。一般可以提取到人体中18个关键部位特征的具体位置信息。这18个部位具体包含:左目、右目、左耳、右耳、鼻子、颈部、左肩、右肩、左肘、右肘、左手腕、右手腕、左腰、右腰、左膝、右膝、左脚踝和右脚踝的18个位置。这里说的第二提取结果可以理解为针对目标图像得到的18个部位的姿态特征数据。

进一步地,将采集到的待识别的目标图像输入到Openpose姿态识别网络中进行姿态特征提取,提取出目标图象的18个指定部位坐标信息,将提取到的指定部位的特征数据作为第二提取结果进行存储,为下一步识别目标图像做好准备。

S209、对第二提取结果进行归一化处理,得到第二姿态特征数据对应的目标图像。

这里说的归一化处理可以理解为将数据按比例缩放,使其缩放到相同的数据区间和范围,以减少个体本身的身高差异和摄像头采集画面远近导致的个体身高差异,消除个体身高差异对行为的分类识别的影响。这里说的第二姿态特征数据可以理解为经过Openpsoe姿态识别网络提取到的特征数据。例如,对于人体图像来说经过Openpsoe姿态识别网络得到人体18个部位的关键点的位置信息,将这18个位置信息和部位名称作为第二姿态特征数据。

进一步地,对Openpsoe姿态识别网络处理过的特征数据再次进行归一化处理,得到统一设定范围的第二姿态特征数据,可以设定第二姿态特征数据的表达公式2为:

S

其中,pi表示第i个身体部位的位置,i=1,2,...,n,n表示身体部位的总数;R2表示二维欧式空间。pi代表(p1,p2,...,pn)中的某一项,Si={(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),(x6,y6),(x7,y7),(x8,y8),(x9,y9),(x10,y10),(x11,y11),(x12,y12),(x13,y13)},(x

通过公式2得到目标图像的姿态特征数据,为下一步分类识别做好准备。

在一种可能的示例场景中,从待识别的视频中采集20张学生上课的行为图像,将这20张图像输入到Openpose姿态识别网络中进行姿态特征提取,得到20张学生上课的姿态特征数据,每一张都包含18个人体关键点的坐标信息和关键点部位的名称,将这些提取到的关键点坐标信息进行尺寸归一化处理,得到统一尺寸下的学生上课的行为姿态特征数据的图像,为下一步分类识别做准备。

S210、获取第二姿态特征数据对应的目标图像与第一姿态特征数据对应的全部图像样本的曼哈顿距离。

这里说的曼哈顿距离可以理解为两个图像之间指定位置的坐标之间偏移量大小,用来判断两个图像是否一致的参考依据。

进一步地,根据获得的目标图像的第二姿态特征数据与图像样本的第一姿态特征数据进行比对,计算两个图像之间18个关键点的距离关系,利用曼哈顿距离公式3进行计算:

其中,pi(l)表示待识别的目标图像中第l个身体部位的位置,即,第二姿态特征数据,pj(l)表示图像样本中第l个身体部位的位置,即第一姿态特征数据。

将一张目标图像的第二姿态特征数据分别与每一张图像样本中的第一姿态特征数据进行计算曼哈顿距离,对应一张目标图像,有多少个图像样本就得到多少个曼哈顿距离数据。按照相同的方式,分别计算每一张目标图像与多个图像样本的曼哈顿距离,得到多个目标图像对应的曼哈顿距离数据表。

在一种可能的示例场景中,在识别学生上课视频中,对存储在数据库中的100张模板图像通过Openpose姿态识别网络进行特征提取,分别得到每一张模板图像中人体的18个关键点的位置坐标和位置名称数据。在对特征数据进行归一化处理,得到特征数据表。在利用相同的技术手段,对待识别的2张学生上课图像进行处理,得到相应的人体18个关键点的位置坐标和位置名称数据。利用曼哈顿距离公式,对待识别的图像的18个关键点的特征数据与模板图像中提取的相同部位的人体18个关键点的位置名称做匹配,然后对位置左边进行曼哈顿距离计算,计算两张图象中同一个关键点部位的距离,距离越小,表征两个图象的关键点的位置越重合,代表相同的行为类别。在将每一个关键点的距离进行累加,最终得到待识别学上上课图像偏离模板图像的18个关键点的总距离,这个总距离作为曼哈顿距离进行存储。对1张待识别的学生上课图像进行100次曼哈顿距离计算,得到待识别学生上课图像与100张模板图像的18个关键点的距离数据。

S211、获取曼哈顿距离中最小的K个图像样本,K的值由曼哈顿距离预先训练确定。

S212、记录K个图像样本的类别标签。

这里说的K的值是利用曼哈顿距离公式经过不断尝试的前期训练后确定的。在对同一张目标图像针对同一张图像样本经过多次曼哈顿距离计算后,确定最终的K的取值,可以作为以后的曼哈顿距离计算的经验值参考。

进一步地,通过对同一张目标图像针对同一张图像样本经过多次曼哈顿距离计算后,确定曼哈顿距离中最小的K的取值。可以按照距离阈值的情况限定目标图像的识别个数,当目标图像与图像样本经过曼哈顿距离计算时,得到的曼哈顿距离小于距离阈值时,确定当前目标图像的识别结果对应计算曼哈顿距离的图像样本,进而获得多个识别图像样本,将识别类别相同的图像样本的个数作为K值。针对K的值,获取这K个指定图像样本,并获取K个图像样本的类别标签。通过记录的方式将得到的K个图像样本和对应的K个类别标签进行存储。

S213、统计K个图像样本中对应类别标签的分布概率,得到匹配概率。

这里说的分布概率可以理解为K个图像样本中每一个图像样本对应的类别标签的统计个数占总数K的占比。这里说的匹配可以理解为一种比对过程,用于判断目标图像与图像样本的相似度比较,这里说的匹配概率可以理解为目标图像与全部图像样本中匹配成功的个数占全部图像样本总数的比重。

进一步地,在确定好与目标图像识别结果相同的图像样本的个数作为K值时,分别统计K个图像样本中每一种行为类别对应的类别标签情况下的个数,然后根据统计到的每一种类别标签的个数在总数K中的占比,计算出针对目标图像识别结果有可能存在的行为类别的占比作为分布概率,将每一种类别标签的占比作为匹配概率进行存储。

S214、选取匹配概率最大的图像样本对应的类别标签作为目标图像的类别,确定目标图像的分类识别结果。

这里说的分类识别结果可以理解为针对目标图像的识别结果进行分类,得到的分类结果。

进一步地,根据目标图像得到的匹配概率,可以获取匹配概率的分布情况,根据分布情况,选取匹配概率最高情况时对应的图像样本的识别结果与对应距离最小的图像样本的识别类别相同,根据图像样本的类别确定对应的的类别标签,根据类别标签确定分类结果,进而确定目标图像对应的图像行为姿态的分类识别结果,完成针对对像行为的识别结果的分类处理,实现提高分类识别准确率的技术效果。

本发明实施例提供了一种分类识别方法,通过预先设置图像样本数据库,先将存储的初始图象样本进行姿态特征提取和归一化处理,得到第一姿态特征数据的图像样本,在对待识别的目标图像经过相同的处理,先在Openpose姿态识别网络中提取姿态特征数据,然后在经过归一化处理,得到第二姿态特征数据,在对处理后的目标图像分别与每一张图像样本进行曼哈顿距离计算,获取目标图像与每一张图像样本中人体关键点的距离数据,选取距离最小的K个图像样本作为目标图像的识别结果在进行分类,通过统计K个图像样本的类别标签的分布概率,确定目标图像的匹配概率,将匹配概率中数值最大的图像样本对应的类别标签作为目标图像的识别结果的分类结果,进而确定目标图像对应的图像行为姿态的分类识别结果,完成针对对像行为的识别结果的分类处理,实现提高分类识别准确率的技术效果。

图3为本发明实施例提供的一种分类识别装置的结构示意图。用于针对对象行为的识别结果的分类处理过程中。如图3所提供的示图,分类识别装置具体包括:

获取模块31,用于获取图像样本库,图像样本库中存储多个图像样本;

匹配模块32,用于将待识别的目标图像与图像样本库中的全部图像样本进行匹配,确定匹配概率;

识别模块33,用于根据匹配概率,确定目标图像的分类识别结果。

本实施例提供的分类识别装置可以是如图3中所示的分类识别装置,可执行如图1-2中分类识别方法的所有步骤,进而实现图1-2所示分类识别方法的技术效果,具体请参照图1-2相关描述,为简洁描述,在此不作赘述。

图4为本发明实施例提供的一种识别设备的结构示意图,图4所示的识别设备400包括:至少一个处理器401、存储器402、至少一个网络接口404和其他用户接口403。识别设备400中的各个组件通过总线系统405耦合在一起。可理解,总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统405。

其中,用户接口403可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。

可以理解,本发明实施例中的存储器402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器402旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中,存储器402存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统4021和应用程序4022。

其中,操作系统4021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序4022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序4022中。

在本发明实施例中,通过调用存储器402存储的程序或指令,具体的,可以是应用程序4022中存储的程序或指令,处理器401用于执行各方法实施例所提供的方法步骤,例如包括:

获取图像样本库,图像样本库中存储多个图像样本;将待识别的目标图像与图像样本库中的全部图像样本进行匹配,确定匹配概率;根据匹配概率,确定目标图像的分类识别结果。

上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成上述方法的步骤。

可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本实施例提供的识别设备可以是如图4中所示的识别设备,可执行如图1-2中分类识别方法的所有步骤,进而实现图1-2所示分类识别方法的技术效果,具体请参照图1-2相关描述,为简洁描述,在此不作赘述。

本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。

当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在识别设备侧执行的分类识别方法。

所述处理器用于执行存储器中存储的分类识别程序,以实现以下在识别设备侧执行的分类识别方法的步骤:

获取图像样本库,图像样本库中存储多个图像样本;将待识别的目标图像与图像样本库中的全部图像样本进行匹配,确定匹配概率;根据匹配概率,确定目标图像的分类识别结果。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 识别码识别方法、装置、计算机设备和存储介质
  • 车辆套牌识别方法、装置、识别设备及存储介质
  • 物品识别方法、装置及设备、存储介质、电子装置
  • 刷牙动作的分类识别方法、计算设备、系统及存储介质
  • 音乐风格识别方法、装置、计算机设备及存储介质
  • 人脸识别方法、装置及分类模型训练方法、装置、存储介质和计算机设备
  • 一种混杂语种分类识别方法、装置、存储介质及终端设备
技术分类

06120115616457