掌桥专利:专业的专利平台
掌桥专利
首页

一种车道线检测图像的录入方法

文献发布时间:2023-06-19 18:37:28


一种车道线检测图像的录入方法

技术领域

本发明属于图像录入技术领域,具体为一种车道线检测图像的录入方法。

背景技术

随着网络和终端技术的发展,越来越多的业务被搬到互联网上处理,如保险理赔,在保险事故发生之后的约定时间内,用户可以通过终端设备拍摄理赔材料的照片,并上传至保险公司的服务端进行报案,保险公司收到报案及理赔材料之后,会对理赔材料进行审核,如果审核通过,进行立案及赔付等操作,由于被保人员在保险公司进行理赔时,会提供大量与该理赔案件相关的文档图像,但是在这些文档图像中,会存在大量的因为用户拍照时的不规范操作导致这些图像出现很大的视角变换(一头大一头小),这会导致录入人员在对这些图像中的信息进行录入时出现很大的难度。

发明内容:

本发明的目的就在于为了解决上述问题而提供一种车道线检测图像的录入方法,解决了背景技术中提到的问题。

为了解决上述问题,本发明提供了一种技术方案:

一种车道线检测图像的录入方法,包括以下步骤:

S1、接收用户提供的目标理赔材料,对该材料进行拍照,将拍照的图片进行增强处理并上传;

S2、利用图片边界线的几何性质,将图片边界线定义为直线、样条曲线和抛物线等几何模型;

S3、通过计算公式获得图片边界线的模型参数,根据求得的参数拟合图片边界线;

S4、构建全卷积车道线检测网络模型,根据图片边界线提取信息设计全卷积网络结构,然后对图片边界线信息进行处理;

S5、根据图片边界线定位文件内容区域,通过透视变换的倾斜矫正算法对图像中的文档进行自动视角矫正,生成矫正后的图像;

S6、对矫正后的图像进行二值化灰度处理,识别内容信息,并对内容进行纠正处理;

S7、将纠正后的文档生成新的图像,并录入到数据库中。

作为优选,所述S1中增强处理后材料图片的分辨率调整为1080×512。

作为优选,所述S3中的计算公式为霍夫变换、RANSAC和最小二乘法中的一种。

作为优选,所述S4中全卷积网络结构包含4个卷积层,前3个卷积层采用2.5×2.5尺寸的卷积核,最后一个卷积层采用2×2尺寸的卷积核。

作为优选,所述S4中对图片边界线信息为:通过FCN采用反卷积层对最后一个卷积层的feature map进行上采样,使它恢复到输入图像相同的尺寸,并对每个像素都产生预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。

作为优选,所述S5中定位文件内容区域的方法为:

A1、对材料图片进行像素曝光;

A2、计算材料图片中每个像素点的RGB值;

A3、计算材料图片中每个像素点的RGB值与正常曝光图片中RGB值之间的曝光差值;

A4、若所述曝光差值在阈值范围之内,则认定为文档区域;若所述曝光差值超过阈值范围,则认定为非文档区域。

作为优选,所述S5中透视变换的倾斜矫正算法为:对图像进行旋转、分割、在水平或/和垂直方向进行平移,获得矫正图像,并检测矫正图像数据集中各个图像中边界线延伸至图像边界处。

作为优选,所述步骤S6中对文档内容纠正包括以下步骤:

B1、对文档内容进行分段处理;

B2、对图片边界线和分段之外的黑线进行消除,同时将文字和图像区域之外的噪点消除;

B3、识别文字内容,并根据上下文信息对文档信息进行纠正。

作为优选,所述S7中成新图像的分辨率为2560×1920。

本发明的有益效果是:通过对车道线检测技术进行改进,从而能将图像中的文档边界检测转化为车道线检测问题,可以对文件材料的边界进行自动抓取,并通过二次处理去除材料上的黑线以及斑点信息,最后在透视变换矫正算法模块的作用下将图像中的文档完成自动视角矫正,进而生成矫正后的图像,从而方便录入人员进行录入,有利于提高工作人员的效率以及文件录入的准确率。

附图说明:

为了易于说明,本发明由下述的具体实施及附图作以详细描述。

图1是本发明工作流程示意图。

具体实施方式:

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置的例子。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本具体实施方式采用以下技术方案:

实施例1:

一种车道线检测图像的录入方法,包括以下步骤:

S1、接收用户提供的目标理赔材料,对该材料进行拍照,将拍照的图片进行增强处理并上传;

S2、利用图片边界线的几何性质,将图片边界线定义为直线、样条曲线和抛物线等几何模型;

S3、通过计算公式获得图片边界线的模型参数,根据求得的参数拟合图片边界线;

S4、构建全卷积车道线检测网络模型,根据图片边界线提取信息设计全卷积网络结构,然后对图片边界线信息进行处理;

S5、根据图片边界线定位文件内容区域,通过透视变换的倾斜矫正算法对图像中的文档进行自动视角矫正,生成矫正后的图像;

S6、对矫正后的图像进行二值化灰度处理,识别内容信息,并对内容进行纠正处理;

S7、将纠正后的文档生成新的图像,并录入到数据库中。

通过对车道线检测技术进行改进,从而能将图像中的文档边界检测转化为车道线检测问题,可以对文件材料的边界进行自动抓取,并通过二次处理去除材料上的黑线以及斑点信息,最后在透视变换矫正算法模块的作用下将图像中的文档完成自动视角矫正,进而生成矫正后的图像,从而方便录入人员进行录入,有利于提高工作人员的效率以及文件录入的准确率。

其中,所述S1中增强处理后材料图片的分辨率调整为1080×512。

其中,所述S3中的计算公式为霍夫变换、RANSAC和最小二乘法中的一种。

其中,所述S4中全卷积网络结构包含4个卷积层,前3个卷积层采用2.5×2.5尺寸的卷积核,最后一个卷积层采用2×2尺寸的卷积核。

其中,所述S4中对图片边界线信息为:通过FCN采用反卷积层对最后一个卷积层的feature map进行上采样,使它恢复到输入图像相同的尺寸,并对每个像素都产生预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。

其中,所述S5中定位文件内容区域的方法为:

A1、对材料图片进行像素曝光;

A2、计算材料图片中每个像素点的RGB值;

A3、计算材料图片中每个像素点的RGB值与正常曝光图片中RGB值之间的曝光差值;

A4、若所述曝光差值在阈值范围之内,则认定为文档区域;若所述曝光差值超过阈值范围,则认定为非文档区域。

其中,所述S5中透视变换的倾斜矫正算法为:对图像进行旋转、分割、在水平或/和垂直方向进行平移,获得矫正图像,并检测矫正图像数据集中各个图像中边界线延伸至图像边界处。

其中,所述步骤S6中对文档内容纠正包括以下步骤:

B1、对文档内容进行分段处理;

B2、对图片边界线和分段之外的黑线进行消除,同时将文字和图像区域之外的噪点消除;

B3、识别文字内容,并根据上下文信息对文档信息进行纠正。

其中,所述S7中成新图像的分辨率为2560×1920。

实施例2:

S1、接收用户提供的目标理赔材料,对该材料进行拍照,将拍照的图片进行增强处理,将其分辨率调整为1080×512,然后进行上传;

S2、利用图片边界线的几何性质,将图片边界线定义为直线、样条曲线和抛物线等几何模型;

S3、通过霍夫变换、RANSAC和最小二乘法中的一种计算公式获得图片边界线的模型参数,根据求得的参数拟合图片边界线;

S4、构建全卷积车道线检测网络模型,根据图片边界线提取信息设计全卷积网络结构,然后对图片边界线信息进行处理,所述S4中全卷积网络结构包含4个卷积层,前3个卷积层采用2.5×2.5尺寸的卷积核,最后一个卷积层采用2×2尺寸的卷积核,并通过FCN采用反卷积层对最后一个卷积层的feature map进行上采样,使它恢复到输入图像相同的尺寸,并对每个像素都产生预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类;

S5、根据图片边界线定位文件内容区域:

A1、对材料图片进行像素曝光;

A2、计算材料图片中每个像素点的RGB值;

A3、计算材料图片中每个像素点的RGB值与正常曝光图片中RGB值之间的曝光差值;

A4、若所述曝光差值在阈值范围之内,则认定为文档区域;若所述曝光差值超过阈值范围,则认定为非文档区域;

随后通过透视变换的倾斜矫正算法对图像中的文档进行旋转、分割、在水平或/和垂直方向进行平移,获得矫正图像,并检测矫正图像数据集中各个图像中边界线延伸至图像边界处,从而进行自动视角矫正,生成矫正后的图像;

S6、对矫正后的图像进行二值化灰度处理,随后对文档内容进行分段处理;对图片边界线和分段之外的黑线进行消除,同时将文字和图像区域之外的噪点消除;识别文字内容,并根据上下文信息对文档信息进行纠正。

S7、将纠正后的文档生分辨率为2560×1920的图像,并录入到数据库中。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围由下面的权利要求指出。

技术分类

06120115630944