掌桥专利:专业的专利平台
掌桥专利
首页

目标物检测方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 10:24:22


目标物检测方法、装置、电子设备及存储介质

技术领域

本发明涉及图像检测技术领域,尤其涉及一种目标物检测方法、装置、电子设备及计算机可读存储介质。

背景技术

应用车道是工程救险、医疗救护、民警执行紧急公务等处理应急事务的车辆使用的专用道。交通法规定,机动车在行使过程中非特殊情况不得占用应急车道,否则予以处罚。目前,对于应急车道的检测可以采用基于区域卷积神经网络的深度学习方法。所述深度学习方法虽然在简单场景下可以达到较高的准确率,但是在雾霾、雨天、夜间、应急车道线模糊等场景下,其准确率相对较低。

发明内容

本发明提供一种目标物检测方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高目标检测的准确性。

为实现上述目的,本发明提供的一种目标物检测方法,包括:

获取待检测图片,对所述待检测图片执行尺寸标准化处理,得到标准图片,通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片;

利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,并利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框;

对所述标准候选框进行回归及分类,得到目标物候选框;

根据所述目标物候选框执行对所述待检测图片的坐标映射,在所述待检测图片中标记出目标物检测结果。

可选的,所述对所述待检测图片执行尺寸标准化处理,得到标准图片,包括:

判断所述待检测图片的尺寸是否大于用户输入的标准图片尺寸;

在所述待检测图片的尺寸大于所述标准图片尺寸时,根据所述标准图片尺寸对所述待检测图片执行裁剪处理,得到标准图片;

在所述待检测图片的尺寸小于所述标准图片尺寸时,则根据所述标准图片尺寸对所述待检测图片执行填充处理,得到标准图片。

可选的,所述利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,包括:

对于所述特征图片上的每一个点,生成预设数量具有不同尺度和宽高比的锚点框;

将所述锚点框输入到区域生成网络的检测框分类层检测框分类层进行分类,判断所述锚点框里面的特征图属于前景还是背景;

将所述锚点框输入到所述区域生成网络的检测框回归层,得到所述锚点框的坐标信息;

选择特征图属于前景的锚点框作为候选框,根据对应的坐标值在所述特征图片上显示所述候选框。

可选的,所述利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框,包括:

将每个所述候选框划分成n*n固定大小的单元;

在每个所述单元中按照预设规则确定采样点,利用双线性插值法计算所述采样点的像素值,对所述采样点的像素值执行最大池化操作以选择所述采样点中像素值最大的像素点;

根据选择的所述像素点,得到每个所述候选框对应的标准候选框。

可选的,所述对所述标准候选框进行回归及分类,得到目标物候选框,包括:

利用框回归函数获得所述标准候选框相对实际位置的偏移量预测值,以对所述标准候选框进行修正;

将所述标准候选框输入至预先训练的神经网络中的全连接层和softmax函数中,计算所述标准候选框中特征图所属的类别,输出类别的得分,根据所述得分,得到目标检测框。

可选的,其特征在于,所述通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片之前,该方法还包括:

根据卷积操作、归一化操作、激活操作构建第一卷积层;

利用合并函数和相加函数,构建第二卷积层;

根据所述第一卷积层和所述第二卷积层构建所述特征提取网络。

可选的,所述目标物为应用车道。

为了解决上述问题,本发明还提供一种一种目标物检测装置,所述装置包括:

图片特征提取模块,用于对所述待检测图片执行尺寸标准化处理,得到标准图片,通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片;

候选框生成模块,用于利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,并利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框;

分类回归模块,用于对所述标准候选框进行回归及分类,得到目标物候选框;

候选框映射模块,用于根据所述目标物候选框执行对所述待检测图片的坐标映射,在所述待检测图片中标记出目标物检测结果。

为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的一种目标物检测方法。

为了解决上述问题,本发明还提供一种计算机可读存储介质,包括存储数据区和存储程序区,其中,所述存储数据区存储创建的数据,所述存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现上述所述的一种目标物检测方法。

本发明实施例通过预构建的特征提取网络对待检测图片进行特征提取,增强了困难场景下的特征表达能力,从而提高了目标物检测,如应急车道检测的整体准确率,同时利用区域生成网络及区域特征集算法生成的候选框,并对所述候选框进行回归及分类,有效缓解了像素偏差问题,改善了目标物检测候选框的回归定位,从而进一步提高了目标物检测的整体准确率。因此,本发明实施例提出的目标物检测方法、装置及计算机可读存储介质,可以提高目标检测的准确性。

附图说明

图1为本发明一实施例提供的一种目标物检测方法的流程示意图;

图2为图1提供的目标物检测方法中其中一个步骤的详细实施流程示意图;

图3为图1提供的目标物检测方法中另一个步骤的详细实施流程示意图;

图4为图1提供的一种目标物检测方法中另一个步骤的详细实施流程示意图;

图5为图1提供的一种目标物检测方法中另一个步骤的详细实施流程示意图;

图6为本发明一实施例提供的一种目标物检测装置的模块示意图;

图7为本发明一实施例提供的实现一种目标物检测方法的电子设备的内部结构示意图;

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本申请实施例提供一种目标物检测方法。所述目标物检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述一种目标物检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。

参照图1所示,为本发明一实施例提供的一种目标物检测方法的流程示意图。在本实施例中,所述目标物检测方法包括:

S1、获取待检测图片,对所述待检测图片执行尺寸标准化处理,得到标准图片,通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片。

本发明实施例中,可以使用各种光学摄像设备获取所述待检测图片,如利用交通监控摄像机每隔指定的时间段对应急车道进行拍摄,并将拍摄得到的应急车道图片上传至数据库,并最终汇总数据库内的应急车道图片,得到所述待检测图片。

详细地,参阅图2所示,所述对所述待检测图片执行尺寸标准化处理,包括:

S10、判断所述待检测图片的尺寸是否大于用户输入的标准图片尺寸;

S11、在所述待检测图片的尺寸大于所述标准图片尺寸时,根据所述标准图片尺寸对所述待检测图片执行裁剪处理,得到标准图片;

S12、在所述待检测图片的尺寸小于所述标准图片尺寸时,根据所述标准图片尺寸对所述待检测图片执行填充处理,得到标准图片。

例如,所述标准图片尺寸可以设置为1000*600。当待检测图片的尺寸为1200*1200,则可通过中心裁剪方法,以图片中心为原点,长为1000,宽为600的尺寸,裁剪得到标准图片;当待检测图片的尺寸为800*400时,则可通过扩边填充方法以图片边框为边界用预设的像素值向外扩充,直至扩充后的尺寸长为1000,宽为600,得到标准图片。

本发明实施例中,所述特征提取网络可以是DarkNet63网络,进一步地,本发明其中一个实施例中,所述通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片之前,还包括构建所述特征提取网络。

详细地,所述特征提取网络通过下述方法构建:根据卷积操作(Conv)、归一化操作(BN)、激活操作(Leaky relu)构建第一卷积层;利用合并函数(Concat)和相加函数(Add)对所述第一卷积层进行组合,构建第二卷积层;根据所述第一卷积层和所述第二卷积层构建所述特征提取网络。

其中,所述卷积操作是2D卷积操作,用于利用不同作用的2D卷积核从所述标准图片中卷积得到特征图;所述归一化操作用于对所述特征图中像素点的像素值利用归一化函数进行降低;所述激活操作利用激活函数降低所述特征图的面积大小;所述合并函数用于连接两个或多个第一卷积层,所述增加函数用于将第一卷积层组成流程执行相加。

S2、利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,并利用区域特征聚类算法将所述候选框池化为固定尺寸,得到标准候选框。

本发明实施例中,所述区域生成网络(RegionProposal Network,RPN)网络用于从所述特征图片中选取候选框。

参阅图3所示,所述利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,包括:

S20、对于所述特征图片上的每一个点,生成预设数量具有不同尺度和宽高比的锚点框(anchor boxes);

S21、将所述锚点框输入到区域生成网络的检测分类层进行分类,判断所述锚点框里面的特征图属于前景还是背景;

S22、将所述锚点框输入到所述区域生成网络的检测框回归层,得到所述锚点框的坐标信息;

S23、选择特征图属于前景的锚点框作为候选框,根据对应的坐标值在所述特征图上显示所述候选框。

本发明实施例中,对于所述特征图片上的每一个点,可以生成9个具有不同尺度和宽高比的锚点框。其中,所述9个锚点框是由3种不同尺寸和3种不同比例得到,例如:3种尺寸分别为8、16、32(也可以设置为其他尺寸),3种不同比例分别为1:1、1:2、2:1(也可以设置为其他比例),因此得到的9个锚点框x分别为(8*8,8*16,16*8,16*16,16*32,32*16,32*32,32*64,64*32)。

进一步地,本发明实施例通过区域生成网络的检测分类层以及检测框回归层分别对得到的所有锚点框中框住的特征图内容进行分类识别,判断所述前景还是背景,及得到所述锚点框的坐标信息,并进一步选择特征图属于前景的锚点框作为候选框,根据对应的坐标值在所述特征图上显示所述候选框。

进一步的,参阅图4所示,本发明实施例中,所述利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框,包括:

S24、将每个所述候选框划分为n*n固定大小的单元;

S25、在每个所述单元按照预设规则确定采样点,利用双线性插值法计算所述采样点的像素值,对每块执行最大池化操作以选择所述采样点中像素值最大的像素点;

S26、根据所述选择的像素点,得到每个所述候选框对应的标准候选框。

本发明实施例对每个所述单元执行最大池化操作以选择所述采样点中像素值最大的像素点,保留含有所述像素值最大的像素点的候选框,并剔除不含所述像素值最大像素点的候选框,得到所述标准候选框。

其中,所述双线性插值法是通过在两个方向上分别进行一次线性插值,利用这两次线性插值所产生的交点作为采样点并确定采样点的像素值。

S3、对所述标准候选框进行回归及分类,得到目标物候选框。

详细地,参阅图5所示,所述对所述标准候选框进行回归及分类,得到目标物候选框,包括:

S30、利用框回归函数获得所述标准候选框相对实际位置的偏移量预测值,以对所述标准候选框进行修正;

S31、将所述标准候选框输入至预先训练的神经网络中的全连接层和softmax函数中,计算所述标准候选框中特征图所属的类别,得到目标检测框。

本发明实施例中,对于标准候选框一般使用四维向量(x,y,w,h)表示,分别表示所述标准候选框的中心点坐标(x,y)、宽w,及高h。使用A表示标准候选框本发明实施例利用框回归函数寻求变换关系F,使得标准候选框经过修正得到实际候选框G,即:

给定A=(A

通过平移和缩放实现F(A)=G;

平移:G

缩放:G

本发明实施例利用框回归函数计算得到所述d

进一步地,本发明实施例将修改后的所述标准候选框输入至预先训练的神经网络中的全连接层和softmax函数中,计算所述标准候选框中特征图所属的类别,得到目标检测框,例如,本发明其中一个实施例讲所述标准候选框中的特征图分类为汽车、路灯、指示标、正常行驶车道、应急车道等类型,从中得到分类为应急车道的标准候选框作为目标检测框。

S4、根据所述目标物候选框执行所述待检测图片的坐标映射,在所述待检测图片中标记出目标物检测结果。

本发明实施例执行坐标映射将所述目标物候选框映射到所述待检测图片中,以在所述待检测图片中标记出识别出的目标,如应急车道。

本发明实施例通过预构建的特征提取网络对待检测图片进行特征提取,增强了困难场景下的特征表达能力,从而提高了目标物检测,如应急车道检测的整体准确率,同时利用区域生成网络及区域特征集算法生成的候选框,并对所述候选框进行回归及分类,有效缓解了像素偏差问题,改善了目标物检测候选框的回归定位,从而进一步提高了目标物检测的整体准确率。因此,本发明实施例可以提高目标检测的准确性。

如图6所示,是本发明一种目标物检测装置的模块示意图。

本发明所述一种目标物检测装置100可以安装于电子设备中。根据实现的功能,所述一种目标物检测装置100可以包括图片特征提取模块101、候选框生成模块102、分类回归103及候选框映射104。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。

在本实施例中,关于各模块/单元的功能如下:

所述图片特征提取模块101,用于对所述待检测图片执行尺寸标准化处理,得到标准图片,通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片。

本发明实施例中,所述图片特征提取模块101可以使用各种光学摄像设备获取所述待检测图片,如利用交通监控摄像机每隔指定的时间段对应急车道进行拍摄,并将拍摄得到的应急车道图片上传至数据库,并最终汇总数据库内的应急车道图片,得到所述待检测图片。

详细地,所述图片特征提取模块101通过下述操作对所述待检测图片执行尺寸标准化处理:

步骤A、判断所述待检测图片的尺寸是否大于用户输入的标准图片尺寸;

步骤B、在所述待检测图片的尺寸大于所述标准图片尺寸时,根据所述标准图片尺寸对所述待检测图片执行裁剪处理,得到标准图片;

步骤C、在所述待检测图片的尺寸小于所述标准图片尺寸时,根据所述标准图片尺寸对所述待检测图片执行填充处理,得到标准图片。

例如,所述标准图片尺寸可以设置为1000*600。当待检测图片的尺寸为1200*1200,则所述图片特征提取模块101可通过中心裁剪方法,以图片中心为原点,长为1000,宽为600的尺寸,裁剪得到标准图片;当待检测图片的尺寸为800*400时,则所述图片特征提取模块101可通过扩边填充方法以图片边框为边界用预设的像素值向外扩充,直至扩充后的尺寸长为1000,宽为600,得到标准图片。

本发明实施例中,所述特征提取网络可以是DarkNet63网络,进一步地,本发明其中一个实施例中,所述通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片之前,还包括构建所述特征提取网络。

详细地,所述特征提取网络通过下述方法构建:第一卷积层以及第二卷积层,根据卷积操作(Conv)、归一化操作(BN)、激活操作(Leaky relu)构建第一卷积层;利用合并函数(Concat)和相加函数(Add)对所述第一卷积层进行组合,构建第二卷积层;根据所述第一卷积层和所述第二卷积层构建所述特征提取网络。

其中,所述卷积操作是2D卷积操作,用于利用不同作用的2D卷积核从所述标准图片中卷积得到特征图;所述归一化操作用于对所述特征图中像素点的像素值利用归一化函数进行降低;所述激活操作利用激活函数降低所述特征图的面积大小;所述合并函数用于连接两个或多个第一卷积层,所述增加函数用于将第一卷积层组成流程执行相加。

所述候选框生成模块102,用于利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,并利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框。

本发明实施例中,所述区域生成网络(RegionProposal Network,RPN)网络用于从所述特征图片中选取候选框。

详细地,所述候选框生成模块102通过下述操作对所述特征图片进行目标检测,根据检测结果生成候选框:

步骤a、对于所述特征图片上的每一个点,生成预设数量具有不同尺度和宽高比的锚点框(anchor boxes);

步骤b、将所述锚点框输入到区域生成网络的检测分类层进行分类,判断所述锚点框里面的特征图属于前景还是背景;

步骤c、将所述锚点框输入到所述区域生成网络的检测框回归层,得到所述锚点框的坐标信息;

步骤d、选择特征图属于前景的锚点框作为候选框,根据对应的坐标值在所述特征图上显示所述候选框。

本发明实施例中,对于所述特征图片上的每一个点,所述候选框生成模块102可以生成9个具有不同尺度和宽高比的锚点框。其中,所述9个锚点框是由3种不同尺寸和3种不同比例得到,例如:3种尺寸分别为8、16、32(也可以设置为其他尺寸),3种不同比例分别为1:1、1:2、2:1(也可以设置为其他比例),因此得到的9个锚点框x分别为(8*8,8*16,16*8,16*16,16*32,32*16,32*32,32*64,64*32)。

进一步地,本发明实施例所述候选框生成模块102通过区域生成网络的检测分类层以及检测框回归层分别对得到的所有锚点框中框住的特征图内容进行分类识别,判断所述前景还是背景,及得到所述锚点框的坐标信息,并进一步选择特征图属于前景的锚点框作为候选框,根据对应的坐标值在所述特征图上显示所述候选框。

进一步的,本发明实施例中,所述利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框,包括:

步骤e、将每个所述候选框划分为n*n固定大小的单元;

步骤f、在每个所述单元按照预设规则确定采样点,利用双线性插值法计算所述采样点的像素值,对每块执行最大池化操作以选择所述采样点中像素值最大的像素点;

步骤g、根据所述选择的像素点,得到每个所述候选框对应的标准候选框。

本发明实施例对每个所述单元执行最大池化操作以选择所述采样点中像素值最大的像素点,保留含有所述像素值最大的像素点的候选框,并剔除不含所述像素值最大像素点的候选框,得到所述标准候选框。

其中,所述双线性插值法是通过在两个方向上分别进行一次线性插值,利用这两次线性插值所产生的交点作为采样点并确定采样点的像素值。

所述分类回归模块103,用于对所述标准候选框进行回归及分类,得到目标物候选框。

详细地,所述分类回归模块103通过下述方法对所述标准候选框进行回归及分类,得到目标物候选框:利用框回归函数获得所述标准候选框相对实际位置的偏移量预测值,以对所述标准候选框进行修正;将所述标准候选框输入至预先训练的神经网络中的全连接层和softmax函数中,计算所述标准候选框中特征图所属的类别,得到目标检测框。

本发明实施例中,对于标准候选框一般使用四维向量(x,y,w,h)表示,分别表示所述标准候选框的中心点坐标(x,y)、宽w,及高h。所述分类回归模块103使用A表示标准候选框本发明实施例利用框回归函数寻求变换关系F,使得标准候选框经过修正得到实际候选框G,即:

给定A=(A

通过平移和缩放实现F(A)=G;

平移:G

缩放:G

本发明实施例所述分类回归模块103利用框回归函数计算得到所述d

进一步地,本发明实施例所述分类回归模块103将修改后的所述标准候选框输入至预先训练的神经网络中的全连接层和softmax函数中,计算所述标准候选框中特征图所属的类别,得到目标检测框,例如,本发明其中一个实施例讲所述标准候选框中的特征图分类为汽车、路灯、指示标、正常行驶车道、应急车道等类型,从中得到分类为应急车道的标准候选框作为目标检测框。

所述候选框映射模块104,用于根据所述目标物候选框执行对所述待检测图片的坐标映射,在所述待检测图片中标记出目标物检测结果。

本发明实施例所述候选框映射模块104,执行坐标映射将所述目标物候选框映射到所述待检测图片中,以在所述待检测图片中标记出识别出的目标,如应急车道。

如图7所示,是本发明实现所述目标物检测方法的电子设备的结构示意图。

所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如一种目标物检测程序12。

其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如一种目标物检测程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行一种目标物检测程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。

所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

图7仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图7示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。

进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。

可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的一种目标物检测程序12是多个指令的组合,在所述处理器10中运行时,可以实现:

获取待检测图片,对所述待检测图片执行尺寸标准化处理,得到标准图片,通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片;

利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,并利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框;

对所述标准候选框进行回归及分类,得到目标物候选框;

根据所述目标物候选框执行对所述待检测图片的坐标映射,在所述待检测图片中标记出目标物检测结果。

具体地,所述处理器10对上述指令的具体实现方法可参考图1至图5对应实施例中相关步骤的描述,在此不赘述。

进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。

本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:

获取待检测图片,对所述待检测图片执行尺寸标准化处理,得到标准图片,通过预构建的特征提取网络提取所述标准图片中的图片特征,得到特征图片;

利用区域生成网络对所述特征图片进行目标检测,根据检测结果生成候选框,并利用区域特征聚集算法将所述候选框池化为固定尺寸,得到标准候选框;

对所述标准候选框进行回归及分类,得到目标物候选框;

根据所述目标物候选框执行对所述待检测图片的坐标映射,在所述待检测图片中标记出目标物检测结果。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。

因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

相关技术
  • 图像中目标物的检测方法、装置、电子设备及存储介质
  • 目标物检测方法、装置、电子设备及存储介质
技术分类

06120112530936