掌桥专利:专业的专利平台
掌桥专利
首页

一种图像的数据处理方法及装置

文献发布时间:2023-06-19 10:58:46


一种图像的数据处理方法及装置

技术领域

本发明属于图像处理技术领域,特别是涉及一种图像的数据处理方法、装置、计算机设备及计算机可读存储介质。

背景技术

近年来,卷积神经网络在很多计算机视觉场景,例如图像分类、目标检测、语义分割等领域得到了广泛的应用。

为得到精度较高的神经网络模型,需要大量的训练数据,在现有技术中,很多时候并不是仅通过数据采集得到足够多的训练数据,而是将已经得到的数量较少的训练数据,利用数据增强的方式产生更多的训练数据,现有的数据增强的方式主要有:空间变换、颜色扭曲和信息删除,针对从原始图像中删除部分信息的信息删除的方式而言,其删除过程是随机的对原始图像中的部分区域进行裁剪,从而将裁剪后的图像也作为一个训练数据,与原始图像一起共同训练神经网络模型。

但是,在随机删除图像的过程中,若仅删除了背景区域信息,或者删除的信息较少,则不能起到数据增强的作用,可能导致神经网络模型发生过拟合;若删除过量的信息,使图像失去了图像原本的含义,则可能导致神经网络模型欠拟合,从而会使得神经网络模型的预测结果准确度较差。

发明内容

有鉴于此,本发明提供一种图像的数据处理方法、装置、计算机设备及计算机可读存储介质,在一定程度上解决了目前方案中通过信息删除进行图像的数据处理时,随机的进行信息的删除导致训练得到的神经网络模型的预测结果准确度较差的问题。

依据本发明的第一方面,提供了一种图像的数据处理方法,包括:

获取原始图像以及与所述原始图像对应的第一保留比例,所述保留比例为进行数据增强后的增强图像的信息量与所述原始图像的信息量的比值;

将所述原始图像划分为多个形状相同的待删除区域;

对部分或全部所述待删除区域,按照与所述第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到所述增强图像;

利用所述原始图像和所述增强图像训练神经网络模型,得到影像分类模型;

获取待分类影像,并将所述待分类影像输入所述影像分类模型,得到所述待分类影像的分类结果。

依据本发明的第二方面,提供了一种图像的数据处理装置,该装置可以包括:

第一获取模块,用于获取原始图像以及与所述原始图像对应的第一保留比例,所述保留比例为进行数据增强后的增强图像的信息量与所述原始图像的信息量的比值;

划分模块,用于将将所述原始图像划分为多个形状相同的待删除区域;

裁剪模块,用于对部分或全部所述待删除区域,按照与所述第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到所述增强图像;

第一生成模块,用于利用所述原始图像和所述增强图像训练神经网络模型,得到影像分类模型;

第二生成模块,用于获取待分类影像,并将所述待分类影像输入所述影像分类模型,得到所述待分类影像的分类结果。

第三方面,本发明实施例提供了一种计算机设备,所述计算机设备包括:

存储器,用于存储程序指令;

处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如第一方面所述的图像的数据处理方法包括的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的图像的数据处理方法的步骤。

针对在先技术,本发明具备如下优点:

本发明提供的一种图像的数据处理方法,包括:获取原始图像以及与原始图像对应的第一保留比例,保留比例为进行数据增强后的增强图像的信息量与原始图像的信息量的比值;将原始图像划分为多个形状相同的待删除区域;对部分或全部待删除区域,按照与第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到增强图像。本发明首先将需要进行数据增强的原始图像划分为多个形状相同的待删除区域,使得后续根据与第一保留比例的差值在预设范围内的第二保留比例进行的信息的删除是在不同的待删除区域中,从而可以确保对原始图像进行信息的删除时,被删除掉的部分是均匀分散在原始图像中的,避免了仅删除图像中的背景区域信息的可能,同时,可以通过改变保留比例,调整每一个待删除区域中被删除掉的区域和剩余的区域的面积,从而控制被删除的信息量,确保利用原始图像和增强图像训练后得到的影像分类模型的预测结果的准确度。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1是本发明实施例提供的一种图像的数据处理方法的步骤流程图;

图2是本发明实施例提供的一种待删除区域的示意图;

图3是本发明实施例提供的一种增强图像的示意图;

图4是本发明实施例提供的另一种图像的数据处理方法的步骤流程图;

图5是本发明实施例提供的另一种增强图像的示意图;

图6是本发明实施例提供的一种图像的数据处理装置的框图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

图1是本发明实施例提供的一种图像的数据处理方法的步骤流程图,如图1所示,该方法可以包括:

步骤101、获取原始图像以及与所述原始图像对应的第一保留比例,所述保留比例为进行数据增强后的增强图像的信息量与所述原始图像的信息量的比值。

在该步骤中,可以获取需要进行数据增强的原始图像,以及对原始图像进行数据增强时原始图像对应的第一保留比例。

在本发明实施例中,所述原始图像可以为用于对神经网络模型进行训练的图像,所述神经网络模型可以是基于开源的可扩展和高效的目标检测算法的神经网络模型,用于对图像进行分类识别、目标检测、语义分割等,因此,所述原始图像可以是任何涉及到影像分类、检测和语义分割的图像,包括医疗发票影像、费用清单影像、身份证影像、银行卡影像等。

由于神经网络模型往往有上百万的参数,这就需要大量的数据进行模型训练,才能使最终得到的模型具有较高的准确性。模型的预测结果的准确率极大的受到训练数据集的影响,往往使用的训练集数据量越多,得到的模型的检测效果越好,但是很多时候并不能得到足够多的训练数据,因此,需要利用现有的训练数据合成数据,或是使用数据增强的方式对现有的训练数据进行数据增强。

现有的数据增强的方式主要有三种:空间变换、颜色扭曲和信息删除。具体的,可以将输入的原始图像进行左右翻转,这就是一个空间变换的数据增强方式;颜色扭曲的方式主要有改变原始图像的透明度、亮度等;信息删除顾名思义就是删除图像中的部分信息,例如随机删除掉原始图像中的部分区域包含的信息,将剩余的部分区域作为新的一个训练图像。

相应的,采用信息删除的方式进行图像的数据处理时,所述保留比例为进行数据增强后的增强图像的信息量与原始图像的信息量的比值,在所述信息为图像中像素点的像素值的情况下,可以将增强图像中待删除区域包含的像素点的像素值设置为0,从而删除掉所述待删除区域包含的信息,而保持剩余区域包含的像素点的像素值,从而保留所述剩余区域包含的信息,因此,所述保留比例也可以为剩余区域的面积与原始图像的面积的比值。若保留比例过小,即过多地删除了图像中的信息,则会让数据增强后的图像成为噪声,从而影响训练得到的模型的分类效果;若保留比例过大或删除的信息属于原始图像中的背景部分,例如空白部分,则过多地保留了原始图像中的信息,会影响训练得到的模型的泛化能力。

因此,可以预先设置所述保留比例的范围,例如50%-70%,或40%-60%,使得进行数据增强后的增强图像的信息量与原始图像的信息量的比值在合适的范围内,从而确保原始图像中被删除的信息的比例不会过多也不会过少。

步骤102、将所述原始图像划分为多个形状相同的待删除区域。

在该步骤中,可以将原始图像划分为多个形状相同的待删除区域,以供在原始图像的待删除区域中按照第一保留区域进行数据增强,从而确保被删除的信息是均匀分散在原始图像中的,避免了仅删除图像中的背景区域信息的可能。

图2是本发明实施例提供的一种待删除区域的示意图,如图2所示,可以将原始图像10划分为四个形状相同的待删除区域20,在原始图像10不能均匀的划分为多个形状相同的待删除区域20时,可以通过调整待删除区域20与原始图像10侧边之间的距离第一长度A和第二长度B,变更待删除区域20在原始图像10中的位置。

在本发明实施例中,所述待删除区域的形状和尺寸可以为根据原始图像的形状和尺寸预先设置的参数,例如,在所述原始图像为边长为10个像素点的正方形结构时,可以预先设定待删除区域为边长为5个像素点的正方形结构,从而可以将原始图像均匀的划分为4个待删除区域,也可以预先设定待删除区域为边长为2个像素点的正方形结构,从而可以将原始图像均匀的划分为25个待删除区域。

步骤103、对部分或全部所述待删除区域,按照与所述第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到所述增强图像。

在该步骤中,可以对原始图像中的部分或全部待删除区域按照第二保留比例进行信息的删除,从而得到将原始图像进行数据增强后的增强图像。

具体的,可以对原始图像中的全部待删除区域进行信息的删除,也可以对部分待删除区域进行信息的删除,例如,可以按照预先设定的比例,将一定比例的待删除区域进行信息的删除,从而在确保被删除掉的信息均匀分散在原始图像中的同时,还可以确保信息的删除过程具有一定程度的随机性,增加对原始图像进行数据增强的多样性,从而得到更多的增强图像。

此外,在对每个待删除区域进行信息的删除时的第二保留比例,是与第一保留比例的差值在预设范围内的保留比例,所述第一保留比例可以是预先设定增强图像的信息量与原始图像信息量的比值,例如,可以预先设定第一保留比例为60%,即需要删除掉原始图像中40%面积的区域包含的信息,具体的,可以在每一个待删除区域中删除40%的区域包含的信息,保留60%的区域包含的信息,从而可以使最终得到的增强图像的信息量为原始图像信息量的60%。其中,多个待删除区域进行信息删除时的保留比例可以均为第一保留比例,即在每一个待删除区域中删除40%的区域包含的信息,保留60%的区域包含的信息;也可以预先设定预设范围为±5%,根据第一保留比例确定的第二保留比例可以为55%-65%,从而将每一个待删除区域按照55%-65%范围内的第二保留比例进行信息的删除,使得每一个待删除区域进行信息删除时的保留比例互不相同,进一步确保信息删除过程具有一定程度的随机性,增加对原始图像进行数据增强的多样性,从而得到更多的增强图像。

图3是本发明实施例提供的一种增强图像的示意图,如图3所示,对图2中划分得到的多个待删除区域20中的每一个待删除区域20,按照相同的第二保留比例75%进行信息的删除,其中,每一个待删除区域20中包含删除区域21和保留区域22,删除区域21的面积与待删除区域20的比值为25%,保留区域22的面积与待删除区域20的比值为第二保留比例75%。

在本发明实施例中,可以利用掩膜实现从原始图像中进行信息删除的过程,具体的,可以设置与原始图像相匹配的掩膜,在该掩膜中,将每个待删除区域中删除区域包含的像素点对应的像素值设置为0,将保留区域包含的像素点对应的像素值设置为1,从而得到掩膜对应的矩阵M,用于表征掩膜中包含的全部像素点的像素值。此外,还可以得到用于表征原始图像中包含的全部像素点的像素值的矩阵x,将矩阵M与矩阵x的乘积可以确定为增强图像对应的矩阵x~,即x~=x×M,其中,矩阵x~表征增强图像中包含的全部像素点对应的像素值。

由于掩膜中像素值为0的像素点,与原始图像中删除区域包含的像素点对应,因此,在将矩阵M与矩阵x的乘积确定为增强图像对应的矩阵x~时,增强图像中与删除区域对应的像素点的像素值均为0,即增强图像中删除了原始图像的删除区域包含的信息;由于掩膜中像素值为1的像素点,与原始图像中保留区域包含的像素点对应,因此,在将矩阵M与矩阵x的乘积确定为增强图像对应的矩阵x~时,增强图像中与保留区域对应的像素点对应的像素值,与原始图像中保留区域包含的像素点对应的像素值相同,即增强图像中保留了原始图像的保留区域包含的信息。

例如,若原始图像对应的矩阵x为[1 2 3;4 5 6;7 8 9]

需要说明的是,参照图2,若原始图像10不能完全均匀的划分为多个待删除区域20时,在原始图像10中可以通过调整第一长度A和第二长度B,使得在原始图像10中除第一长度A和第二长度B对应的区域之外的目标区域中,均匀的划分出多个待删除区域20,从而在对多个待删除区域20根据第二保留比例进行裁剪的同时,还可以在第一长度A和第二长度B对应的区域内也根据第二保留比例进行信息的删除,从而保证原始图像10全部的范围内均按照第二保留比例进行了信息的删除。

步骤104、利用所述原始图像和所述增强图像训练神经网络模型,得到影像分类模型。

在该步骤中,可以在得到增强图像之后,利用原始图像和增强图像共同作为训练集训练神经网络模型,从而得到用于进行图像分类的影像分类模型,所述影像分类模型可以对输入的多张影像进行类型识别,并将多张图像按照一定的类别顺序进行排序,生成相应的可携带文档格式(Portable Document Format,PDF)的文档传给相关人员查看。

此外,在利用本申请实施例中图像的数据增强方法得到增强图像后,可以根据具体的应用需求,对神经网络模型进行训练,得到适用于不同应用需求的影像分类识别、目标检测和语义分割等模型。

步骤105、获取待分类影像,并将所述待分类影像输入所述影像分类模型,得到所述待分类影像的分类结果。

在该步骤中,在利用原始图像和增强图像训练得到影像分类模型之后,可以进一步获取用户收集并上传的待分类影像,并将该待分类影像输入影像分类模型,从而可以得到待分类影像对应的分类结果。

综上所述,本发明实施例提供的一种图像的数据处理方法,包括:获取原始图像以及与原始图像对应的第一保留比例,保留比例为进行数据增强后的增强图像的信息量与原始图像的信息量的比值;将原始图像划分为多个形状相同的待删除区域;对部分或全部待删除区域,按照与第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到增强图像。本发明首先将需要进行数据增强的原始图像划分为多个形状相同的待删除区域,使得后续根据与第一保留比例的差值在预设范围内的第二保留比例进行的信息的删除是在不同的待删除区域中,从而可以确保对原始图像进行信息的删除时,被删除掉的部分是均匀分散在原始图像中的,避免了仅删除图像中的背景区域信息的可能,同时,可以通过改变保留比例,调整每一个待删除区域中被删除掉的区域和剩余的区域的面积,从而控制被删除的信息量,确保利用原始图像和增强图像训练后得到的影像分类模型的预测结果的准确度。

图4是本发明实施例提供的另一种图像的数据处理方法的步骤流程图,如图4所示,该方法可以包括:

步骤201、获取原始图像以及与所述原始图像对应的第一保留比例,所述保留比例为进行数据增强后的增强图像的信息量与所述原始图像的信息量的比值。

该步骤具体可以参照上述步骤101,此处不再赘述。

步骤202、在所述原始图像和所述待删除区域为矩形结构的情况下,获取预先设置的针对所述原始图像的第一长度和第二长度。

在该步骤中,在原始图像和待删除区域为矩形结构的情况下,若原始图像不能完全均匀的划分为多个待删除区域时,参照图2,可以获取预先设置的针对原始图像的第一长度A和第二长度B,以供在原始图像10中通过调整第一长度A和第二长度B,使得在原始图像10中除第一长度A和第二长度B对应的区域之外的目标区域中,均匀的划分出多个待删除区域20。

其中,所述第一长度A和第二长度B可以是从预先设置的长度范围内随机确定的长度值,该长度范围的最小值可以为0,最大值可以为待删除区域的边长d,即A/B=random(0,d)。

步骤203、根据所述第一长度和所述第二长度,在所述原始图像中确定目标区域,所述目标区域与所述原始图像的一条侧边之间的距离大于所述第一长度,与所述一条侧边相邻的另一条侧边之间的距离大于所述第二长度。

在该步骤中,可以根据确定的第一长度和第二长度,在原始图像中确定用于进行划分待删除区域的目标区域,参照图2,所述第一长度A可以为目标区域与原始图像10左侧边之间的距离,第二长度B可以为目标区域与原始图像10上侧边之间的距离;所述第一长度A也可以为目标区域与原始图像10右侧边之间的距离,相应的,第二长度B可以为目标区域与原始图像10的上侧边或下侧边之间的距离。即目标区域为原始图像10中与原始图像10的一条侧边之间的距离大于第一长度A,且与原始图像10的一条侧边相邻的另一条侧边之间的距离大于第二长度B的区域,从而可以通过调整第一长度A和第二长度B,改变目标区域的位置,进而改变待删除区域的位置,使得对原始图像的信息删除过程具有一定程度的随机性,增加对原始图像进行数据增强的多样性,从而得到更多的增强图像。

步骤204、获取所述待删除区域的边长,所述待删除区域的边长为预先设置的长度范围内的任意一个长度。

在该步骤中,可以在目标区域中划分多个待删除区域之前,获取待删除区域的边长。

其中,所述待删除区域的边长可以为预先设置的长度范围内的任意一个长度,从而可以确保进行信息删除操作的待删除区域的尺寸较为适中,避免待删除区域的边长较小导致的操作步骤较多的问题,以及裁剪区域的边长较大导致的删除信息分布不均匀的问题。

具体的,可以预先设置一个固定的范围(d

步骤205、将所述目标区域划分为多个形状相同的所述待删除区域。

在该步骤中,可以将原始图像中的目标区域划分为多个形状相同的待删除区域,以供在待删除区域中按照第一保留区域进行数据增强,从而确保被裁删除的部分是均匀分散在原始图像中的,避免了仅删除图像中的背景区域信息的可能。

步骤206、在所述删除边框和所述待删除区域为正方形结构的情况下,根据所述第二保留比例和所述待删除区域的边长,确定所述删除边框的边长。

在该步骤中,可以在待删除区域中设置删除边框,其中,删除边框在待删除区域中对应的区域为待删除区域中的删除区域,多个删除边框在原始图像中对应的区域为对原始图像进行数据增强时需要删除的信息所属的区域,即待删除区域中包括删除区域和保留区域,所述删除区域的边框即为所述删除边框。

可选的,步骤206具体可以包括以下子步骤:

子步骤2061、根据所述第二保留比例,确定所述原始图像中所述删除边框对应的删除区域的面积与所述原始图像的面积之间的比值。

在该步骤中,可以根据用于确定对原始图像进行数据增强,即删除操作的第二保留比例,确定原始图像中进行数据增强时需要删除的信息所属的区域的面积与原始图像的面积之间的比值。

由于保留比例为进行数据增强后的增强图像的信息量与原始图像的信息量之间的比值,若所述信息为图像中像素点的像素值,原始图像包括保留区域和需要删除的区域,则第二保留比例K可以为原始图像中的保留区域的面积与原始图像的面积之间的比值,因此,在进行数据增强时,原始图像中需要删除的区域的面积与原始图像的面积的比值C,与第二保留比例K的和为1,即C+K=1,从而可以将数值1与第二保留比例K的差值1-K,确定为所述原始图像中需要删除的区域的面积与原始图像的面积的比值C。

子步骤2062、根据所述比值和所述待删除区域的边长,确定所述删除边框的边长。

在该步骤中,进行数据增强时,原始图像中需要删除的区域的面积与原始图像的面积之间的比值,与每个待删除区域中删除区域的面积与待删除区域的面积之间的比值相等,若所述删除边框和待删除区域均为正方形结构,删除边框的边长为L,则删除区域的面积S

因此,可以确定待删除区域中删除边框的边长

步骤207、根据所述删除边框的边长,确定所述待删除区域中的删除区域,并从所述原始图像中删除多个所述删除区域包含的信息,得到所述增强图像。

在该步骤中,可以对原始图像中的部分或全部待删除区域,在确定了每个待删除区域中的删除区域之后,在每个待删除区域中确定其中删除边框对应的删除区域,并删除所述删除区域中包含的信息,即将删除区域中包含的像素点的像素值设置为0,从而完成在原始图像中删除多个删除区域的操作,从而得到将原始图像进行数据增强后的增强图像。

可选的,步骤207中从所述原始图像中删除多个所述删除区域的步骤,具体可以包括以下子步骤:

子步骤2071、在所述待删除区域中,将所述删除边框旋转预设角度。

在该步骤中,在待删除区域中确定删除边框之后,可以将删除边框旋转预设角度,从而更改在原始图像中进行数据增强需要删除的区域的位置。

图5是本发明实施例提供的另一种增强图像的示意图,如图5所示,原始图像10中划分出多个待删除区域20之后,可以在每个待删除区域20中确定删除边框23,并将删除边框23旋转预设角度,从而最终在待删除区域20中确定需要进行删除的删除区域21。

其中,所述预设角度也可以是从预先设定的角度值范围内随机确定的角度,该角度范围可以为(0,360),从而在确保被裁剪掉的信息均匀分散在原始图像中的同时,还可以确保信息删除过程具有一定程度的随机性,增加对原始图像进行数据增强的多样性,从而得到更多的增强图像。

子步骤2072、从所述原始图像中删除与旋转后的删除边框对应的区域包含的信息。

在该步骤中,在将删除边框旋转预设角度之后,可以从原始图像中删除与旋转后的删除边框对应的区域包含的信息,从而完成对原始图像的信息删除操作,实现对原始图像的数据增强,得到增强图像。

步骤208、利用所述原始图像和所述增强图像训练神经网络模型,得到影像分类模型。

该步骤具体可以参照上述步骤104,此处不再赘述。

步骤209、获取待分类影像,并将所述待分类影像输入所述影像分类模型,得到所述待分类影像的分类结果。

在该步骤中,在利用原始图像和增强图像训练得到影像分类模型之后,可以进一步获取用户收集并上传的待分类影像,并将该待分类影像输入影像分类模型,从而可以得到待分类影像对应的分类结果。

可选的,所述待分类影像包括:医疗发票影像、费用清单影像、身份证影像和银行卡影像中的任意一种或多种。同时,所述原始图像的类型可以根据具体的业务应用场景,即待分类的影像来确定,例如,针对健康险核保或理赔场景,所述原始图像可以为通过网络爬虫或其他任何方式获得的、与健康险核保或理赔相关的医疗发票影像、费用清单影像、身份证影像或银行卡影像,将得到的原始图像以及将原始图像进行数据增强后得到的增强图像,作为训练集训练得到的影像分类模型可以用于对健康险核保或理赔相关的待分类影像进行类型识别,得到待分类影像的分类结果。

具体的,在利用原始图像和增强图像训练得到影像分类模型之后,可以进一步获取用户收集并上传的待分类影像,所述待分类影像可以为用户在健康险核保或理赔过程中产生的相关的图像,并将该待分类影像输入影像分类模型,从而可以得到待分类影像对应的分类结果。

可选地,所述待分类影像的分类结果可以为按照类别顺序排序的影像。例如,输入至影像分类模型的影像可包括医疗发票影像、费用清单影像、身份证影像和银行卡影像。这些影像在输入至影像分类模型后可按照身份证、费用清单、医疗发票、银行卡的顺序进行排序。应理解,类别顺序可以依据实际需要设定,本发明对此不做限定。经排序的影像可以被生成pdf等任何适合的形式的文档,以供相关人员查看。

例如,在输入所述影像分类模型的待分类影像为医疗发票影像的情况下,得到所述待分类影像的分类结果为医疗发票类别,具体的,在所述待分类影像为用户在健康险核保或理赔过程中产生医疗发票影像的情况下,将待分类影像输入影像分类模型中,像分类模型可以输出该待分类影像的分类结果为医疗发票类别;在输入所述影像分类模型的待分类影像为费用清单影像的情况下,得到所述待分类影像的分类结果为费用清单类别,具体的,在所述待分类影像为用户在健康险核保或理赔过程中产生费用清单影像的情况下,将待分类影像输入影像分类模型中,像分类模型可以输出该待分类影像的分类结果为费用清单类别;在输入所述影像分类模型的待分类影像为身份证影像的情况下,得到所述待分类影像的分类结果为身份证类别,具体的,在该步骤中,在所述待分类影像为用户在健康险核保或理赔过程中产生身份证影像的情况下,将待分类影像输入影像分类模型中,像分类模型可以输出该待分类影像的分类结果为身份证类别;在输入所述影像分类模型的待分类影像为银行卡影像的情况下,得到所述待分类影像的分类结果为银行卡类别,具体的,在所述待分类影像为用户在健康险核保或理赔过程中产生银行卡影像的情况下,将待分类影像输入影像分类模型中,像分类模型可以输出该待分类影像的分类结果为银行卡类别。

综上所述,本发明实施例提供的一种图像的数据处理方法,包括:获取原始图像以及与原始图像对应的第一保留比例,保留比例为进行数据增强后的增强图像的信息量与原始图像的信息量的比值;将原始图像划分为多个形状相同的待删除区域;对部分或全部待删除区域,按照与第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到增强图像。本发明首先将需要进行数据增强的原始图像划分为多个形状相同的待删除区域,使得后续根据与第一保留比例的差值在预设范围内的第二保留比例进行的信息的删除操作是在不同的待删除区域中,从而可以确保对原始图像进行信息的删除时,被删除掉的部分是均匀分散在原始图像中的,避免了仅删除图像中的背景区域信息的可能,同时,可以通过改变保留比例,调整每一个待删除区域中被删除掉的区域和剩余的区域的面积,从而控制被删除的信息量,确保利用原始图像和增强图像训练后得到的影像分类模型的预测结果的准确度。

此外,还可以通过调整原始图像中的第一长度和第二长度,或者调整待删除区域的边长、待删除区域中删除边框旋转的预设角度等,灵活的改变原始图像中进行数据增强时需要删除的区域的位置和大小,从而确保数据增强过程具有一定的随机性,增加对原始图像进行数据增强的多样性,从而得到更多的增强图像用于对神经网络模型进行训练,从而进一步确保利用原始图像和增强图像训练后得到的影像分类模型的预测结果的准确度。

图6是本发明实施例提供的一种图像的数据处理装置的框图,如图6所示,该装置可以包括:

第一获取模块301,用于获取原始图像以及与所述原始图像对应的第一保留比例,所述保留比例为进行数据增强后的增强图像的信息量与所述原始图像的信息量的比值;

划分模块302,用于将将所述原始图像划分为多个形状相同的待删除区域;

裁剪模块303,用于对部分或全部所述待删除区域,按照与所述第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到所述增强图像;

第一生成模块304,用于利用所述原始图像和所述增强图像训练神经网络模型,得到影像分类模型;

第二生成模块305,用于获取待分类影像,并将所述待分类影像输入所述影像分类模型,得到所述待分类影像的分类结果。

可选的,所述待删除区域包括删除边框,所述删除边框在所述待删除区域中对应的区域为删除区域;所述裁剪模块303,包括:

第一确定子模块,用于在所述删除边框和所述待删除区域为正方形结构的情况下,根据所述第二保留比例和所述待删除区域的边长,确定所述删除边框的边长;

第二确定子模块,用于根据所述删除边框的边长,确定所述待删除区域中的删除区域,并从所述原始图像中删除多个所述删除区域包含的信息,得到所述增强图像。

可选的,所述第二确定子模块,包括:

旋转单元,用于在所述待删除区域中,将所述删除边框旋转预设角度;

删除单元,用于从所述原始图像中删除与旋转后的删除边框对应的区域包含的信息。

可选的,所述装置还包括:

第二获取模块,用于获取所述待删除区域的边长,所述待删除区域的边长为预先设置的长度范围内的任意一个长度。

可选的,第一确定子模块,包括:

第一确定单元,用于根据所述第二保留比例,确定所述原始图像中所述删除边框对应的删除区域的面积与所述原始图像的面积之间的比值;

第二确定单元,用于根据所述比值和所述待删除区域的边长,确定所述删除边框的边长。

可选的,所述划分模块302,包括:

获取子模块,用于在所述原始图像和所述待删除区域为矩形结构的情况下,获取预先设置的针对所述原始图像的第一长度和第二长度;

第三确定子模块,用于根据所述第一长度和所述第二长度,在所述原始图像中确定目标区域,所述目标区域与所述原始图像的一条侧边之间的距离大于所述第一长度,与所述一条侧边相邻的另一条侧边之间的距离大于所述第二长度;

划分子模块,用于将所述目标区域划分为多个形状相同的所述待删除区域。

可选的,所述待分类影像包括:医疗发票影像、费用清单影像、身份证影像和银行卡影像中的任意一种或多种;

其中,所述待分类影像的分类结果为按照类别顺序排序的影像。

综上所述,本发明实施例提供的一种图像的数据处理装置,包括:获取原始图像以及与原始图像对应的第一保留比例,保留比例为进行数据增强后的增强图像的信息量与原始图像的信息量的比值;将原始图像划分为多个形状相同的待删除区域;对部分或全部待删除区域,按照与第一保留比例的差值在预设范围内的第二保留比例进行信息的删除,得到增强图像。本发明首先将需要进行数据增强的原始图像划分为多个形状相同的待删除区域,使得后续根据与第一保留比例的差值在预设范围内的第二保留比例进行的信息的删除是在不同的待删除区域中,从而可以确保对原始图像进行信息的删除时,被删除掉的部分是均匀分散在原始图像中的,避免了仅删除图像中的背景区域信息的可能,同时,可以通过改变保留比例,调整每一个待删除区域中被删除掉的区域和剩余的区域的面积,从而控制被删除的信息量,确保利用原始图像和增强图像训练后得到的影像分类模型的预测结果的准确度。

对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

优选的,本发明实施例还提供一种计算机设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述图像的数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述图像的数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。

在此提供的图像的数据处理方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图像的数据处理方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

相关技术
  • 图像数据处理方法、用于图像数据处理方法的程序、记录有用于图像数据处理方法的程序的记录介质和图像数据处理装置
  • 图像数据处理装置、图像数据处理方法以及图像显示装置
技术分类

06120112756822