掌桥专利:专业的专利平台
掌桥专利
首页

目标遮挡评估方法、系统、介质及装置

文献发布时间:2023-06-19 10:32:14


目标遮挡评估方法、系统、介质及装置

技术领域

本发明属于图像识别技术领域,具体提供一种目标遮挡评估方法、系统、介质及装置。

背景技术

在视频领域中,通常会对各种目标进行判断,以目标为车辆为例,在车辆识别领域中,为了更好地实现车辆的监控,通常会采集车辆的照片信息用于比对。例如在车辆重识别应用场景中,能够从两张目标车辆的检测框图片中分别提取特征,计算相似度,然后基于相似度判断两个车辆是否为同一目标车辆。通过上述方式,能够使用户准确追踪某一车辆的具体行驶轨迹,为公安机关或者其它需求用户提供技术支持。

在车辆重识别等应用场景中,如果某个车辆在行驶过程中被遮挡,例如在拍照时被路边的广告牌遮挡住大部分车身,此时如果将这种质量过低的车辆纳入车辆重识别的计算模型中进行计算,非但无法保证其真实度,而且由于计算困难,还增加了计算模型的额外负担。因此,在类似上述的许多应用场景中,需要从目标车辆序列中剔除质量过低的目标,或是筛选出质量较高的目标,来为后续其它类似车辆重识别计算模型的计算模型的准确判断以及降低计算量提供支持。

由于遮挡是一个连续出现的情况,无法对每次遮挡都进行人工标注,因此不能直接采用分数拟合的方法。

上述是以车辆被遮挡为例进行说明的,但是其同样可以应用在其它目标群体上,例如对于行人的识别、对于养殖场或动物园的动物的识别等目标同样适用,但是为了更好地说明本发明的方案,下面的目标就以车辆为例进行统一说明。

相应的,本领域需要一种新的目标遮挡评估方法、系统、介质及装置来解决现有的被遮挡目标直接进入计算模型而导致计算准确度低、计算量大的问题。

发明内容

为了解决现有技术中的上述问题,即为了解决现有的被遮挡目标直接进入计算模型而导致计算准确度低、计算量大的问题,本发明提供了一种目标遮挡评估方法,包括:

将待识别图片分割成多个网格并判断每个网格为前景还是背景;

计算所述待识别图片中前景网格的数量占总网格数量的比值,并将其作为遮挡质量分;

将所述遮挡质量分与预设分进行比较;

当所述遮挡质量分小于所述预设分时,确定所述待识别图片中的目标被遮挡;

其中,所述遮挡质量分表示所述目标被遮挡的程度。

在上述方法的优选技术方案中,“将待识别图片分割成多个网格并判断每个网格为前景还是背景”具体包括:

将所述待识别图片输入到已训练的网格分割模型中,以便将所述待识别图片分割成多个网格;

通过所述网格分割模型对所述待识别图片进行预测,得到每个网格对应的输出向量,其中,所述输出向量包括多个双层网格,每一个双层网格具有一层前景得分和一层背景得分;

将所述前景得分与预设值进行比较;

如果所述前景得分大于所述预设值,则确定所述网格为前景;

否则,确定所述网格为背景。

在上述方法的优选技术方案中,所述已训练的网格分割模型的获得方式包括:

根据用于训练的原始图片中目标的检测框对所述原始图片进行图片裁剪并缩放到能输入到预先构建的初始网格分割模型中的尺寸,作为样本图片;

在所述检测框内将所述目标包络起来形成前景的多边形;

根据所述多边形确定所述样本图片中的每一像素属于前景或背景;

将所述样本图片划分为多个网格,并根据每个网格中的像素属于前景或背景来确定每个网格为前景或背景;

将经过网格划分并标签为前景或背景的样本图片输入所述初始网格分割模型进行模型迭代训练,以得到所述已训练的网格分割模型;

其中,如果每个网格中属于前景的像素数量占所述网格的像素数量的比例超过一半,则所述网格为前景,否则所述网格为背景。

在上述方法的优选技术方案中,所述初始网格分割模型的构建过程为:

采用resnet18作为骨干网络,通过反卷积与通道相加构建网格分割模型;

并且,构建交叉熵损失函数作为模型的损失函数。

在上述方法的优选技术方案中,“在所述检测框内将所述目标包络起来形成前景的多边形”具体包括:

当所述目标被遮挡物分隔开时,将属于所述目标的部分包络起来,形成多个前景的多边形;

并且/或者,

“将经过网格划分并标签为前景或背景的样本图片输入所述初始网格分割模型进行模型迭代训练,以得到所述已训练的网格分割模型”具体包括:

在所述网格分割模型每次迭代训练时,根据每次输入的所述样本图片进行预测以获得输出向量;

根据每个网格的前景或背景的类别和所述输出向量,计算每个网格对应的交叉熵损失;

累加所有网格的交叉熵损失获得所述网格分割模型的总损失;

根据总损失调整所述网格分割模型的模型参数,进入下一次模型迭代训练;

当达到模型训练的迭代次数时,结束模型训练,并保留最后一次迭代调整的模型参数,得到所述已训练的网格分割模型。

在上述方法的优选技术方案中,已训练的网格分割模型需要部署至推理引擎中进行运行,所述“推理引擎”为MNN推理引擎、NCNN推理引擎、TensorRT推理引擎或OpenVINO推理引擎;并且/或者,

所述交叉熵损失函数为softmax交叉熵损失函数;并且/或者,

所述检测框为通过目标识别算法获得,所述目标识别算法为RCNN,Fast-RCNN,Faster-RCNN,Mask-RCNN,YOLO,SSD中的一种;并且/或者,

所述网格的分割方法为16×16的粗粒度分割方法;并且/或者,

所述输出向量为16x16的双层网格。

本发明还提供了一种目标遮挡评估的系统,包括:

网格分割标注模块:用于将待识别图片分割成多个网格并判断每个网格为前景还是背景;

遮挡质量分计算模块:用于计算所述待识别图片中前景网格的数量占总网格数量的比值,并将其作为遮挡质量分;

遮挡质量分比较模块:用于将所述遮挡质量分与预设分进行比较;

遮挡确认模块:用于当所述遮挡质量分小于所述预设分时,确定所述待识别图片中的目标被遮挡;

其中,所述遮挡质量分表示所述目标被遮挡的程度。

在上述系统的优选技术方案中,网格分割标注模块具体包括:

待识别图片的输入模块:用于将所述待识别图片输入到已训练的网格分割模型中,以便将所述待识别图片分割成多个网格;

待识别图片的向量预测模块:用于通过所述网格分割模型对所述待识别图片进行预测,得到每个网格对应的输出向量,其中,所述输出向量包括多个双层网格,每一个双层网格具有一层前景得分和一层背景得分;

前景得分比较模块:用于将所述前景得分与预设值进行比较;

待识别图片的网格类别确认模块:用于如果所述前景得分大于所述预设值,则确定所述网格为前景;否则,确定所述网格为背景。

在上述系统的优选技术方案中,所述已训练的网格分割模型的获得所使用的模块包括:

样本图片获得模块:用于根据用于训练的原始图片中目标的检测框对所述原始图片进行图片裁剪并缩放到能输入到预先构建的初始网格分割模型中的尺寸,作为样本图片;

多边形标注模块:用于在所述检测框内将所述目标包络起来形成前景的多边形;

像素类别确认模块:用于根据所述多边形确定所述样本图片中的每一像素属于前景或背景;

样本图片的网格类别确认模块:用于将所述样本图片划分为多个网格,并根据每个网格中的像素属于前景或背景来确定每个网格为前景或背景;

模型迭代训练模块:用于将经过网格划分并标签为前景或背景的样本图片输入所述初始网格分割模型进行模型迭代训练,以得到所述已训练的网格分割模型;

其中,如果每个网格中属于前景的像素数量占所述网格的像素数量的比例超过一半,则所述网格为前景,否则所述网格为背景。

在上述系统的优选技术方案中,所述初始网格分割模型的构建过程为:

架构搭建模块:用于采用resnet18作为骨干网络,通过反卷积与通道相加构建网格分割模型;

架构评估模块:用于构建交叉熵损失函数作为模型的损失函数。

在上述系统的优选技术方案中,多边形标注模块具体包括:

当所述目标被遮挡物分隔开时,将属于所述目标的部分包络起来,形成多个前景的多边形;

并且/或者,

模型迭代训练模块具体包括:

样本图片的向量预测模块:用于在所述网格分割模型每次迭代训练时,根据每次输入的所述样本图片进行预测以获得输出向量;

样本图片的单个网格损失计算模块:用于根据每个网格的前景或背景的类别和所述输出向量,计算每个网格对应的交叉熵损失;

样本图片的总网格损失计算模块:用于累加所有网格的交叉熵损失获得所述网格分割模型的总损失;

模型参数调整模块:用于根据总损失调整所述网格分割模型的模型参数,进入下一次模型迭代训练;

模型参数保留模块:用于当达到模型训练的迭代次数时,结束模型训练,并保留最后一次迭代调整的模型参数,得到所述已训练的网格分割模型。

本发明还提供了一种计算机可读存储介质,所述存储介质中存储有多条程序代码,其特征在于,所述程序代码适用于由处理器加载并运行以执行上述技术方案中任一项的目标遮挡评估方法。

本发明还提供了一种终端装置,该控制装置包括处理器和存储器,所述存储器适用于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行上述技术方案中任一项的目标遮挡评估方法。

本领域人员能够理解的是,在本发明的技术方案中,目标遮挡评估方法具体包括:将待识别图片分割成多个网格并判断每个网格为前景还是背景;计算待识别图片中前景网格的数量占总网格数量的比值,并将其作为遮挡质量分;将遮挡质量分与预设分进行比较;当遮挡质量分小于预设分时,确定待识别图片中的目标被遮挡;其中,遮挡质量分表示目标被遮挡的程度。

通过上述设置方式,使得本发明能够通过网格分割的方法对待识别的车辆进行评估,以获得遮挡质量分,如果遮挡质量分低于预设分,则可以判断其遮挡严重,在后续的图片处理过程中便可以进行相应地处理,包括但不仅限于删除或者降低处理权重,从而提升计算精度以及降低计算量。

附图说明

下面参照附图并结合车辆的识别领域来描述本发明的目标遮挡评估方法、系统、介质及装置。附图中:

图1为本发明的目标遮挡评估方法主要流程图;

图2为图1中步骤S400以及步骤S400之前的补充流程图;

图3为图2中的已训练的网格分割模型的详细获取方式;

图4为图2中的通过目标识别算法获得目标检测框的实际应用图;

图5为图3中的前景的多边形的实际应用图;

图6为图2中的最终标注的实物图片;

图7为本发明的目标遮挡评估的系统主要模块示意图;

图8为已训练的网格分割模型的详细获取方式所使用系统的模块示意图。

1、检测框;2、多边形;3、前景;4、背景。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。本领域技术人员可以根据需要对其作出调整,以便适应具体的应用场合。例如,尽管说明书中图3当中的步骤S940的包络目标的前景的多边形是以人工标注为例进行描述的,但是其显然可以构建其它的算法来替代人工标注样本,这并非本申请所保护的重点,因此并未展开如何进行构建标注的算法,但是,本领域技术人员在知晓能够人工标注的情况下,显然可以通过公知常识性技术来构建一个标注的算法替代人工标注,这些简单的扩展均未超出本发明的发明构思,都应当属于本发明的保护范围。

在本发明的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合,比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似,可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。

对于车辆识别领域来说,例如公安机关需要调取某辆车辆的整个运行轨迹时,需要查看每个摄像头是否有拍摄到这辆车,例如相邻的两个摄像头,需要通过车辆重识别技术来判断这辆车是否经过了这两个摄像头,进而判断车辆的行驶路径。其中,车辆重识别指的是从两张目标车辆的检测框图片中分别提取特征,计算相似度,判断两个车辆是否为同一目标的技术。

然而,摄像头在实际采样过程中,经常会出现车挡车,或者路边的路灯、树干等遮挡车辆的情况,当车辆在被遮挡十分严重的情况下,是无法判断出是否为某一车辆的,而在车辆重识别过程中,由于无法准确判断车辆拍摄的情况,通常会将所有拍摄到的图像进行车辆重识别,由于存在许多无法使用的被遮挡车辆的图片,这将极大地增加系统的运行负担,增加计算时间,从而在车辆追踪过程中将浪费许多时间,而这对于公安机关显然是非常不利的,哪怕每个监控分析过程减少几分钟,都是对于公安机关非常大的帮助。

基于此,为解决现有的被遮挡车辆直接进入计算模型而导致计算准确度低、计算量大的问题,如图1所示,本申请是通过网格分割模的方式获得目标遮挡程度的遮挡质量分,并最终将遮挡质量分与预设分比较,从而确定真实图片是否被遮挡。为了完成上述方案,本申请整体大致分两部分,第一部分是获取已训练的网格分割模型,第二部分是使用该模型进行遮挡质量分的评估。

下面从第一部分“获取已训练的网格分割模型”开始阐述。

如图3至图6所示,在一种可能的实施方式中,获取已训练的网格分割模型的方式具体包括:

S910、采用resnet18作为骨干网络,通过反卷积与通道相加构建网格分割模型;并且,构建交叉熵损失函数作为模型的损失函数。

具体地,resnet18的网络结构已经属于本领域技术人员常用的网络结构,本申请不再详细展开,通过该结构作为骨干网络,并通过反卷积与通道相加,首先构建一个初始的网格分割模型,并且为了在训练过程中了解网格分割模型的准确程度,又构建了交叉熵损失函数作为模型的损失函数。优选地,交叉熵损失函数为softmax交叉熵损失函数,当然还可以是其它交叉熵损失函数,或者相对熵损失函数等,只要能够用于评判网格分割模型的准确性即可。

S920、通过目标识别算法从原始图片中获得目标的检测框。

S930、根据检测框进行图片裁剪并缩放到能输入到预先构建的初始网格分割模型中的尺寸,作为样本图片。

图4虽然是实际使用过程中获得检测框的实际应用图,但其同样适用于获取样本图片,目标识别算法可以是现有技术中常用的RCNN,Fast-RCNN,Faster-RCNN,Mask-RCNN,YOLO,SSD中的一种,以YOLO算法为例进行说明,通过YOLO算法能够对车辆进行识别,并获得目标的长方形的检测框1,如图4所示,当然图4中的车辆并未被遮挡,只是举例进行说明,被遮挡的车辆可以参照图6,然后根据检测框对图片进行裁剪并缩放到能输入到初始网格分割模型的尺寸,即得到了样本图片。

S940、在检测框内将目标包络起来形成前景的多边形。

S950、根据多边形确定样本图片中的每一像素属于前景或背景。

如图5所示,对检测框内的图片当中的车辆的外周进行人工标注,获得一个包络目标前景的多边形2,根据多边形2确定样本图片中的像素属于前景或背景,在多边形2的内部的属于车辆,其像素属于前景,在多边形2的外部不属于车辆,其像素属于背景。当然,图5中显示的车辆也非遮挡车辆,只是举例进行说明,在遮挡物并未将车辆遮挡分割成多个部分时,仍然是仅有一个多边形2便能够将车辆完全包裹,进而区分前景的像素和背景的像素。然而,当车辆被遮挡物直接分割成两部分或多部分时,将会出现两个或多个多边形2,但并不影响对于前景的像素和背景的像素的标注。

S960、将样本图片划分为多个网格,并根据每个网格中的像素属于前景或背景来确定每个网格为前景或背景。

在步骤S950当中,已经将图片的所有像素进行了前景的像素或背景的像素的区分,然后将样本图片整体划分为多个网格,下面以网格的分割方法为16×16的粗粒度分割方法为例进行说明,当然本领域技术人员显然可以进行其它尺寸网格的划分。对于网格的划分方式,现有技术中有类似分割模型mask算法的方案,很多现有技术均能够实现图片的网格划分,因此不再详细举例。

对于16×16个网格当中的每个网格,均包含有多个像素,而在前已经对所有像素进行了分类,在此基础上,对每个网格再次进行分类,如果每个网格中属于前景的像素的数量占网格的像素的数量的比超过一半,则网格的类别为前景,否则网格的类别为背景。通过上述方式,最终确定了每个网格的类别为前景或背景。

S970、将经过网格划分并标签为前景或背景的样本图片输入初始网格分割模型进行模型迭代训练,以得到已训练的网格分割模型。

通过将已经处理完成的样品图片输入初始的网格分割模型进行迭代训练,并通过交叉熵损失函数和之前的每个网格前景或背景的标签确定损失,所有网格算的损失都累加起来,总损失算出来后,调模型参数,迭代预定次数,模型收敛好后,便最终得到已训练的网格分割模型。

具体地,进一步参照图3,步骤S970进一步包括:

S971、在网格分割模型每次迭代训练时,根据每次输入的样本图片进行预测以获得输出向量。

具体地,图片输入后,进行了16×16的网格划分,并分别将所有网格进行了前景和背景的标注,相应地模型会输出一个2×16×16的双层网格的向量,一层为背景层分,一层为前景层分。

S972、根据每个网格的前景或背景的类别和输出向量,计算每个网格对应的交叉熵损失。

S973、累加所有网格的交叉熵损失获得网格分割模型的总损失。

在网格的向量已经确定的情况下,结合交叉熵损失函数,便能够最终获得每个网格的交叉熵损失。将所有的网格的交叉熵损失相加,最终获得网格分割模型的总损失。

S974、根据总损失调整网格分割模型的模型参数,进入下一次模型迭代训练。

S975、当达到模型训练的迭代次数时,结束模型训练,并保留最后一次迭代调整的模型参数,得到已训练的网格分割模型。

在已知总损失的情况下,对初始网格分割模型的模型参数进行调整,从而获得更优化的网格分割模型,然后不断迭代,最终获得已训练的网格分割模型。

上面已经对第一部分的已训练的网格分割模型的获得方式进行了阐述,下面对第二部分的使用该模型进行遮挡质量分的评估方式进行详细阐述。

如图1至图6所示,本发明的目标遮挡评估方法具体包括:

S100、获取原始图片并通过目标识别算法从原始图片中获得目标的检测框。

具体地,可以通过路上的摄像头来获取拍摄有车辆的真实图片,或者路边的商家的摄像头、其他车辆的行车记录仪等,只要能获取到所需时间段内的车辆的真实图片即可,然后对原始图片进行YOLO算法等目标识别算法获得目标的检测框。

S200、对检测框中的图片裁剪并缩放到能输入到已训练的网格分割模型的尺寸,作为待识别图片。

参照图4和图6,对于某一辆车分析时,当获得了图4中的检测框1后,最终处理的图像也是如图6所示的检测框1内的图像,因此,只需要分析检测框1内的图像即可,对于检测框外部的图像无需进行处理。因此,需要先依照检测框1进行剪裁,然后将检测框1内的图片缩放到合适的尺寸,然后才能输入到网格分割模型作为待识别图片。

S300、在推理引擎中部署已训练的网格分割模型。

将已训练的网格分割模型加载上线,放到推理引擎上,为后续的推理计算做准备工作。优选地,“推理引擎”为MNN推理引擎(Mobile Neural Network),推理引擎目前有多种可供选择,MNN是一种轻量级的深度学习端侧推理引擎,后续列出的几种均属于本领域技术人员所能获得的开放式推理引擎,不再赘述)、NCNN推理引擎、TensorRT推理引擎或OpenVINO推理引擎中的一种。

上述步骤已经完成了处理待识别图片的准备工作,下面对步骤S400:“将待识别图片分割成多个网格并判断每个网格为前景还是背景”的一种具体实施方式进行详细阐述。

如图1和图2所示,步骤S400进一步包括:

S410、将待识别图片输入到已训练的网格分割模型中,以便将待识别图片分割成多个网格并基于所述已训练的网格分割模型的输出来判断每个网格为前景还是背景。

其中,“基于所述已训练的网格分割模型的输出来判断每个网格为前景还是背景”的一种可能的实施方式进一步为:

S411、通过网格分割模型对待识别图片进行预测,得到每个网格对应的输出向量,其中,输出向量包括多个双层网格,每一个双层网格具有一层前景得分和一层背景得分。

S412、将前景得分与预设值进行比较。

S413、如果前景得分大于预设值,则确定网格为前景;否则,确定网格为背景。

具体地,在上述网格分割模型的获得过程中对该输出向量已经提及,该向量能够表征每个网格属于前景或者背景,基于输出向量便能够确定每个双层网格的最终前景分值,然后将前景分值与预设值进行比较,如果前景分值大于预设值,则双层网格的类别为前景,否则为背景。

S500、计算待识别图片中前景网格的数量占总网格数量的比值,并将其作为遮挡质量分。

S600、将遮挡质量分与预设分进行比较。

S700、当遮挡质量分小于预设分时,确定待识别图片中的目标被遮挡。

计算前景的双层网格数量在总的双层网格的数量的比值,作为遮挡质量分输出即可。具体地,遮挡质量分能够反映出目标被遮挡的程度,根据不同应用场景的需求,设置不同的预设分,便能够筛选出不同程度的被遮挡的图片,进而在筛选和计算速度当中找到一个合适的平衡,使筛掉的图片在合理范围内,降低对最终结果的影响,还使计算速度能得到显著的提升。例如,如图6所示,前景3占比为0.65,背景4占比为0.35,其车辆遮挡的质量分在0.65,属于遮挡较为严重的情况,依据这个遮挡质量分,便能够准确判断图片是否可以被后续的车辆重识别所使用。

需要指出的是,尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述,但是本领域技术人员可以理解,为了实现本发明的效果,不同的步骤之间并非必须按照这样的顺序执行,其可以同时(并行)执行或以其他顺序执行,这些变化都在本发明的保护范围之内。

下面再结合如图7和图8,对本发明的目标遮挡评估的系统进行详细说明。如图7所示,目标遮挡评估的系统至少包括:

待识别图片的检测框获得模块:用于获取原始图片并通过目标识别算法从所述原始图片中获得目标的检测框。

待识别图片获得模块:用于对所述检测框中的图片裁剪并缩放到能输入到所述已训练的网格分割模型的尺寸,作为所述待识别图片。

模型部署模块:用于在推理引擎中部署所述已训练的网格分割模型。

网格分割标注模块:用于将待识别图片分割成多个网格并判断每个网格为前景还是背景;

遮挡质量分计算模块:用于计算所述待识别图片中前景网格的数量占总网格数量的比值,并将其作为遮挡质量分。

遮挡质量分比较模块:用于将所述遮挡质量分与预设分进行比较。

遮挡确认模块:用于当所述遮挡质量分小于所述预设分时,确定所述待识别图片中的目标被遮挡,其中,所述遮挡质量分表示所述目标被遮挡的程度。

其中,网格分割标注模块具体包括:

待识别图片的输入模块:用于将所述待识别图片输入到已训练的网格分割模型中,以便将所述待识别图片分割成多个网格。

待识别图片的向量预测模块:用于通过所述网格分割模型对所述待识别图片进行预测,得到每个网格对应的输出向量,其中,所述输出向量包括多个双层网格,每一个双层网格具有一层前景得分和一层背景得分。

前景得分比较模块:用于将所述前景得分与预设值进行比较。

待识别图片的网格类别确认模块:用于如果所述前景得分大于所述预设值,则确定所述网格为前景;否则,确定所述网格为背景。

如图8所示,获得已训练的网格分割模型的系统包括:

架构搭建模块:用于采用resnet18作为骨干网络,通过反卷积与通道相加构建网格分割模型。

架构评估模块:用于构建交叉熵损失函数作为模型的损失函数。

样本图片获得模块:用于根据用于训练的原始图片中目标的检测框对所述原始图片进行图片裁剪并缩放到能输入到预先构建的初始网格分割模型中的尺寸,作为样本图片。

多边形标注模块:用于在所述检测框内将所述目标包络起来形成前景的多边形。

像素类别确认模块:用于根据所述多边形确定所述样本图片中的每一像素属于前景或背景。

样本图片的网格类别确认模块:用于将所述样本图片划分为多个网格,并根据每个网格中的像素属于前景或背景来确定每个网格为前景或背景,其中,如果每个网格中属于前景的像素数量占所述网格的像素数量的比例超过一半,则所述网格为前景,否则所述网格为背景。

模型迭代训练模块:用于将经过网格划分并标签为前景或背景的样本图片输入所述初始网格分割模型进行模型迭代训练,以得到所述已训练的网格分割模型。

模型迭代训练模块进一步包括:

样本图片的向量预测模块:用于在所述网格分割模型每次迭代训练时,根据每次输入的所述样本图片进行预测以获得输出向量。

样本图片的单个网格损失计算模块:用于根据每个网格的前景或背景的类别和所述输出向量,计算每个网格对应的交叉熵损失。

样本图片的总网格损失计算模块:用于累加所有网格的交叉熵损失获得所述网格分割模型的总损失。

模型参数调整模块:用于根据总损失调整所述网格分割模型的模型参数,进入下一次模型迭代训练。

模型参数保留模块:用于当达到模型训练的迭代次数时,结束模型训练,并保留最后一次迭代调整的模型参数,得到所述已训练的网格分割模型。

进一步,在本发明的一种计算机可读存储介质的一个实施例中,该计算机存储介质存储多条程序代码,所述程序代码适用于由处理器加载并运行以执行前述的目标遮挡评估方法。计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。

进一步,在本发明的一种控制装置的一个实施例中,包括处理器和存储器,所述存储装置适用于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行前述的目标遮挡评估方法。

进一步,应该理解的是,由于各个模块的设定仅仅是为了说明本发明的系统的功能单元,这些模块对应的物理器件可以是处理器本身,或者处理器中软件的一部分,硬件的一部分,或者软件和硬件结合的一部分。因此,图中的各个模块的数量仅仅是示意性的。

本领域技术人员能够理解的是,可以对系统中的各个模块进行适应性地拆分或合并。对具体模块的这种拆分或合并并不会导致技术方案偏离本发明的原理,因此,拆分或合并之后的技术方案都将落入本发明的保护范围内。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

相关技术
  • 目标遮挡评估方法、系统、介质及装置
  • 一种推荐系统召回策略的离线评估方法、系统、装置及存储介质
技术分类

06120112585207