掌桥专利:专业的专利平台
掌桥专利
首页

一种基于能量模型的行人重识别方法

文献发布时间:2023-06-19 12:10:19


一种基于能量模型的行人重识别方法

技术领域

本发明涉及智能交通和人工智能领域,它处理的对象为城市各街道路口摄像头所拍摄到的行人,利用该技术实现跨区域行人的检索和识别。

背景技术

目标识别是视频监控中的一项重要任务,而行人识别其目的为跨摄像头识别出同一个人及其行动轨迹,该技术在智能交通、公共安全和视频监控方面发挥着重要作用。如果当前有一个需要查询的行人图像,行人重识别任务需要从部署在不同路口位置的多个摄像头收集的数据中,找出最相似的同一目标的图像。行人重识别难点在于人体姿势、照明和视野的不同所引起的行人姿态和外观的变化。本发明通过构建图像特征空间的能量模型,利用同一个行人的低能量分布特征,提高目标识别准确度。本发明的行人重识别方法,基于计算机视觉技术和人工智能技术,具有实现简单、识别准确度高等优点,在智能交通领域具有广泛的应用前景。

发明内容

现有的各种的行人重识别方法,均为基于目标分类的行人重识别模型,在泛化性和准确率方面尚存在一些不足。为了解决现有技术问题的不足,本发明提出一种基于能量模型的行人重识别方法,从而提升行人重识别的准确率和泛化性。

为了达成所述目的,本发明提供一种基于能量模型的行人重识别方法,其技术方案包括如下步骤:

步骤S1:通过摄像头采集城市各路口行人图像N*M个,其中N为行人个数, M为每个行人采集的图像数据,以此作为训练数据集;

步骤S2:利用卷积神经网络训练行人分类模型,设x为某行人图像,f(x) 为卷积神经网络所提取的特征,而分类模型所训练的损失函数采用基于能量的损失函数;

步骤S3:根据S2中所训练的模型,提取待识别的行人图像特征,并和数据库中的所存储的N个不同行人图像特征比对,以确定待识别的行人身份;

步骤S4:跟S3中的检索结果,通过可视化排序,以确定所识别行人的潜在相似目标和身份;

优选地,所述步骤2中基于能量模型的损失函数建立步骤为:

2.1通过卷积神经网络提取行人图像x的特征f(x);

2.2计算步骤2.1中行人图像特征的目标能量和非目标能量;

E(x,t)=-f

其中,t是目标标签,E(x,t)表示图像的目标能量,E(x,n)表示图像的非目标能量,T为温度常数;

2.3定义基于能量的损失函数

其中max为取最大值函数,α控制损失函数的取值,β控制能量梯度在非目标分量上的分布。最后,根据上述公式作为神经网络训练的损失函数,取代传统 softmax损失函数实现网络的分类训练。

优选地,在步骤3中带检索图像和数据库中的行人图像相似度的比对方法为:

d(x,x

其中x,x

优选地,在步骤4中,将需要重识别的图片输入重识别网络得到描述特征,将图像库的图片也送入重识别网络得到描述特征,对比描述特征进行排序,将排序结果传递到行人重识别可视化软件显示。

本发明的有益效果:对于视频监控场景下行人追踪与搜索。该发明的优点在于上述方法训练速度大幅提高,从而能够节省大量的离线训练时间,同时其目标识别精度得到较大提高。

附图说明

图1是本发明的行人重识别整体流程图。

图2是本发明的行人识别结果。

具体实施方式

下面结合附图详细说明本发明技术方案中所涉及的各个细节问题。应指出的是,所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。

本发明提出了一种跨摄像头的行人重识别方法,该方法在处理流程如图1 所示。第一步先获取训练模型所需数据,通过布设在不同路口的摄像机采集N 个行人的图像,每个行人采集M个不同位置的图像;第二步通过基于能量的卷积神经网络训练行人分类模型;第三步加载训练好的模型作为特征提取工具得到待识别行人图像特征,用以匹配图像库图像,计算相似性度量结果;第四步将结果传入显示模块显示,以便于更方便的观察结果。根据上述流程,具体的实施步骤如下所示:

1、数据获取模块

采集不同路口摄像机下的行人图像,并人工标注行人身份信息及摄像头信息,作为训练数据集。

2、行人重识别模块

将训练集中的数据送入基于能量模型的卷积神经网络中训练,所使用的卷积神经网络类型不限。本发明所提出的能量模型,区别于传统目标分类模型的 softmax函数,具有训练速度快、准确率高等优点。

3、行人匹配模块

待查询行人送入行人重识别特征提取模块,获取图像描述特征,用以进一步计算特征间的距离,并确定待检索行人和数据库中行人的身份对应信息。

4、显示模块

针对待检索或者待识别的行人图像,将后台数据库中的检索结果按照相似度高低使结果直观显示,并给出关键信息,如位置信息、时间信息等,能更好地确定行人时空信息的关联性,以分析行人在多个街道路口的轨迹。

具体技术方案包括如下步骤:

步骤S1:通过摄像头采集城市各路口行人图像N*M个,其中N为行人个数, M为每个行人采集的图像数据,以此作为训练数据集;

步骤S2:利用卷积神经网络训练行人分类模型,设x为某行人图像,f(x) 为卷积神经网络所提取的特征,而分类模型所训练的损失函数采用基于能量的损失函数;

步骤S3:根据S2中所训练的模型,提取待识别的行人图像特征,并和数据库中的所存储的N个不同行人图像特征比对,以确定待识别的行人身份;

步骤S4:跟S3中的检索结果,通过可视化排序,以确定所识别行人的潜在相似目标和身份;

其中,在步骤2中基于能量模型的损失函数为:

2.1通过卷积神经网络提取行人图像x的特征f(x)。

2.2计算步骤2.1中行人图像特征的目标能量和非目标能量。

E(x,t)=-f

t是目标标签,1<=t<=N。E(x,t)表示图像的目标能量,E(x,n)表示图像的非目标能量。T为温度常数,取值0.000001。

2.3定义基于能量的损失函数,

其中max为取最大值函数,α控制损失函数的取值,β控制能量梯度在非目标分量上的分布。最后,根据上述公式作为神经网络训练的损失函数,取代传统 softmax损失函数实现网络的分类训练。

在步骤3中带检索图像和数据库中的行人图像相似度的比对方法为:

d(x,x

其中x,x

d(x,x

在步骤4中,将需要重识别的图片输入重识别网络得到描述特征,将图像库的图片也送入重识别网络得到描述特征,对比描述特征进行排序,将排序结果传递到行人重识别可视化软件显示。

相关技术
  • 一种基于能量模型的行人重识别方法
  • 一种行人重识别模型的构建方法及行人重识别方法
技术分类

06120113194802