掌桥专利:专业的专利平台
掌桥专利
首页

车载领域图像识别方法、识别模型建立方法、装置、电子设备和可读存储介质

文献发布时间:2023-06-19 11:02:01


车载领域图像识别方法、识别模型建立方法、装置、电子设备和可读存储介质

技术领域

本申请涉及计算机网络技术领域,具体而言,涉及一种车载领域图像识别方法、识别模型建立方法、装置、电子设备和可读存储介质。

背景技术

目前,现有的信息识别方法中,多数是针对自然场景下的信息识别,目前还未有针对特殊场景下的信息识别方法。自然场景下的信息识别技术会将图像中的所有具有相同属性的信息都识别出来,如果使用开源的自然场景的信息识别方式,不符合一些特殊场景下,识别只需从多个具有相同属性的信息中识别出部分信息的要求。

发明内容

有鉴于此,本申请的目的在于提供一种车载领域图像识别方法、识别模型建立方法、装置、电子设备和可读存储介质,能够通过从多个具有相同属性的区域中标定出目标区域进而识别,可提高识别效率。

第一方面,本申请实施例提供一种车载领域图像识别方法,所述方法包括:

获取待识别图像,所述待识别图像具有多个包含内容信息的区域;

利用预先建立的识别模型对所述待识别图像进行处理,根据各所述区域的位置信息从所述多个区域中确定出目标区域,对所述目标区域进行信息识别,得到识别结果;

其中,所述识别模型为预先利用多张标记有目标区域的位置信息的训练正样本进行训练获得,每张训练正样本具有多个包含内容信息的区域。

在可选的实施方式中,所述识别模型包括检测子模型和识别子模型;

所述利用预先建立的识别模型对所述待识别图像进行处理,根据各所述区域的位置信息从所述多个区域中确定出目标区域,对所述目标区域进行信息识别,得到识别结果的步骤,包括:

利用预先建立的检测子模型基于位置信息检测以从所述多个区域中确定出目标区域;

利用预先建立的识别子模型对所述待识别图像的目标区域进行信息识别,得到识别结果,所述识别子模型为预先基于多张训练正样本以及根据多张训练正样本的内容信息扩展得到的多张扩展样本进行训练获得。

在可选的实施方式中,所述利用预先建立的识别子模型对所述待识别图像的目标区域进行信息识别,得到识别结果的步骤,包括:

利用预先建立的识别子模型获得所述待识别图像的目标区域中包含的文字信息和数字信息,并根据所述数字信息得到对应的日期信息。

在可选的实施方式中,所述利用预先建立的检测子模型基于位置信息检测以从所述多个区域中确定出目标区域的步骤,包括:

利用预先建立的检测子模型基于矩形框和角点坐标的检测,从所述多个区域中确定出目标区域。

在可选的实施方式中,所述利用预先建立的检测子模型基于矩形框和角点坐标的检测,从所述多个区域中确定出目标区域的步骤,包括:

利用预先建立的检测子模型基于矩形框和角点坐标的检测,从所述多个区域中确定出初步目标区域;

根据所述初步目标区域的角点坐标和边线,构建所述初步目标区域的最小外接框;

检测所述最小外接框的尺寸是否属于预设范围内,若属于预设范围内,则确定所述初步目标区域为目标区域。

在可选的实施方式中,所述对所述待识别图像的目标区域进行信息识别,得到识别结果的步骤之前,所述方法还包括:

检测所述最小外接框的方位信息是否满足预设要求,若不满足所述预设要求,则对所述目标区域进行旋转矫正。

在可选的实施方式中,所述识别模型还包括分类子模型,所述分类子模型为预先利用多张训练正样本和多张训练负样本对分类器进行训练获得;

所述利用预先建立的识别模型对所述待识别图像进行处理,根据各所述区域的位置信息从所述多个区域中确定出目标区域,对所述目标区域进行信息识别,得到识别结果的步骤,还包括:

利用所述分类子模型对确定出的目标区域进行分类识别,得到分类结果,所述分类结果表征所述目标区域中是否包含与所述训练正样本的目标区域中的内容信息对应的信息。

第二方面,本申请实施例提供一种车载领域图像识别模型建立方法,所述方法包括:

针对获取的多张训练正样本中的每张训练正样本,获得所述训练正样本中包含内容信息的多个区域;

从所述多个区域中标定出目标区域,并获得所述目标区域的位置信息;

利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,得到识别模型。

在可选的实施方式中,所述识别模型包括检测子模型和识别子模型,所述利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,得到识别模型的步骤,包括:

利用标记有目标区域的位置信息的多张训练正样本对构建的第一神经网络模型进行训练,得到检测子模型;

根据所述多张训练正样本的目标区域中的内容信息进行样本扩展,得到多张扩展样本;

利用多张训练正样本和多张扩展样本对构建的第二神经网络模型进行训练,得到识别子模型。

在可选的实施方式中,所述识别模型还包括分类子模型,所述利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,得到识别模型的步骤,还包括:

利用获取的多张训练负样本和标记有目标区域的位置信息的多张训练正样本对构建的分类器进行训练,得到分类子模型。

在可选的实施方式中,所述目标区域中的内容信息包含文字和数字,所述根据所述多张训练正样本的目标区域中的内容信息进行样本扩展,得到多张扩展样本的步骤,包括:

提取出各张所述训练正样本的目标区域中包含的数字,构成数字集合;

对所述数字集合中包含的数字进行组合得到多个数字组合;

基于所述多个数字组合和所述文字,得到多个扩展样本。

在可选的实施方式中,所述数字表征日期,所述对所述数字集合中包含的数字进行组合得到多个数字组合的步骤,包括:

针对预先设置的各个扩展日期,获得所述扩展日期所需的扩展数字;

从所述数字集合中随机抽取与所述扩展数字对应的数字,以构成表征所述扩展日期的数字组合。

在可选的实施方式中,所述提取出各张所述训练正样本的目标区域中包含的数字,构成数字集合的步骤,包括:

提取出各张所述训练正样本的目标区域中包含的数字;

获取包含携带不同书写信息的多个数字的扩充集合;

将所述扩充集合中的数字和多个训练正样本中的数字构成数字集合。

在可选的实施方式中,所述基于所述多个数字组合和所述文字,得到多个扩展样本的步骤,包括:

针对各所述训练正样本,扣取出所述训练正样本的目标区域中的数字以得到对应的扩展模板;

将各所述数字组合填充至任一所述扩展模板中,得到对应的扩展样本。

在可选的实施方式中,所述位置信息包括所述目标区域的角点坐标以及框定所述目标区域的矩形框;

所述利用标记有目标区域的位置信息的多张训练正样本对构建的第一神经网络模型进行训练,得到检测子模型的步骤,包括:

利用携带有目标区域的角点坐标以及框定所述目标区域的矩形框的多张训练正样本,对构建的第一神经网络模型进行训练,得到检测子模型。

第三方面,本申请实施例提供一种车载领域图像识别装置,所述装置包括:

获取模块,用于获取待识别图像,所述待识别图像具有多个包含内容信息的区域;

识别模块,用于利用预先建立的识别模型对所述待识别图像进行处理,根据各所述区域的位置信息从所述多个区域中确定出目标区域,对所述目标区域进行信息识别,得到识别结果;

其中,所述识别模型为预先利用多张标记有目标区域的位置信息的训练正样本进行训练获得,每张训练正样本具有多个包含内容信息的区域。

在可选的实施方式中,所述识别模型包括检测子模型和识别子模型;

所述识别模块用于通过以下方式得到识别结果:

利用预先建立的检测子模型基于位置信息检测以从所述多个区域中确定出目标区域;

利用预先建立的识别子模型对所述待识别图像的目标区域进行信息识别,得到识别结果,所述识别子模型为预先基于多张训练正样本以及根据多张训练正样本的内容信息扩展得到的多张扩展样本进行训练获得。

在可选的实施方式中,所述识别模块用于通过以下方式得到识别结果:

利用预先建立的识别子模型获得所述待识别图像的目标区域中包含的文字信息和数字信息,并根据所述数字信息得到对应的日期信息。

在可选的实施方式中,所述识别模块用于通过以下方式确定出目标区域:

利用预先建立的检测子模型基于矩形框和角点坐标的检测,从所述多个区域中确定出目标区域。

在可选的实施方式中,所述识别模块用于通过以下方式确定出目标区域:

根据各所述区域的角点坐标和矩形框,从所述多个区域中确定出初步目标区域;

根据所述初步目标区域的角点坐标和边线,构建所述初步目标区域的最小外接框;

检测所述最小外接框的尺寸是否属于预设范围内,若属于预设范围内,则确定所述初步目标区域为目标区域。

在可选的实施方式中,所述车载领域图像识别装置还包括矫正模块;

所述矫正模块,用于检测所述最小外接框的方位信息是否满足预设要求,若不满足所述预设要求,则对所述目标区域进行旋转矫正。

在可选的实施方式中,所述识别模型还包括分类子模型,所述分类子模型为预先利用多张训练正样本和多张训练负样本对分类器进行训练获得;

所述识别模块还用于通过以下方式对所述待识别图像进行分类判断:

利用所述分类子模型对确定出的目标区域进行分类识别,得到分类结果,所述分类结果表征所述目标区域中是否包含与所述训练正样本的目标区域中的内容信息对应的信息。

第四方面,本申请实施例提供一种车载领域图像识别模型建立装置,所述装置包括:

获得模块,用于针对获取的多张训练正样本中的每张训练正样本,获得所述训练正样本中包含内容信息的多个区域;

标定模块,用于从所述多个区域中标定出目标区域,并获得所述目标区域的位置信息;

训练模块,用于利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,得到识别模型。

在可选的实施方式中,所述识别模型包括检测子模型和识别子模型,所述训练模块用于通过以下方式得到检测子模型和识别子模型:

利用标记有目标区域的位置信息的多张训练正样本对构建的第一神经网络模型进行训练,得到检测子模型;

根据所述多张训练正样本的目标区域中的内容信息进行样本扩展,得到多张扩展样本;

利用多张训练正样本和多张扩展样本对构建的第二神经网络模型进行训练,得到识别子模型。

在可选的实施方式中,所述识别模型还包括分类子模型,所述训练模块还用于通过以下方式得到分类子模型:

利用获取的多张训练负样本和标记有目标区域的位置信息的多张训练正样本对构建的分类器进行训练,得到分类子模型。

在可选的实施方式中,所述目标区域中的内容信息包含文字和数字,所述训练模块用于通过以下方式得到扩展样本:

提取出各张所述训练正样本的目标区域中包含的数字,构成数字集合;

对所述数字集合中包含的数字进行组合得到多个数字组合;

基于所述多个数字组合和所述文字,得到多个扩展样本。

在可选的实施方式中,所述数字表征日期,所述训练模块用于通过以下方式获得数字组合:

针对预先设置的各个扩展日期,获得所述扩展日期所需的扩展数字;

从所述数字集合中随机抽取与所述扩展数字对应的数字,以构成表征所述扩展日期的数字组合。

在可选的实施方式中,所述训练模块用于通过以下方式构成数字集合:

提取出各张所述训练正样本的目标区域中包含的数字;

获取包含携带不同书写信息的多个数字的扩充集合;

将所述扩充集合中的数字和多个训练正样本中的数字构成数字集合。

在可选的实施方式中,所述训练模块用于通过以下方式得到扩展样本:

针对各所述训练正样本,扣取出所述训练正样本的目标区域中的数字以得到对应的扩展模板;

将各所述数字组合填充至任一所述扩展模板中,得到对应的扩展样本。

在可选的实施方式中,所述位置信息包括所述目标区域的角点坐标以及框定所述目标区域的矩形框;

所述训练模块用于通过以下方式获得检测子模型:

利用携带有目标区域的角点坐标以及框定所述目标区域的矩形框的多张训练正样本,对构建的第一神经网络模型进行训练,得到检测子模型。

第五方面,本申请实施例提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如前述实施方式任一所述方法的步骤。

第六方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如前述实施方式任一所述方法的步骤。

第七方面,本申请实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如前述实施例方式任一项所述的方法。

基于上述任一方面,本申请在获得具有多个包含内容信息的区域的待识别图像后,利用预先建立的识别模型对待识别图像进行处理,根据各区域的位置信息从多个区域中确定出目标区域,对目标区域进行信息识别得到识别结果。其中,该识别模型为预先利用多张标记有目标区域的位置信息的训练正样本进行训练获得,每张训练正样本具有多个包含内容信息的区域。本方案中,避免了现有技术中对于包含有内容信息的区域进行无差别识别,所造成的难以着重对所需区域进行重点识别的问题,避免了其他区域对识别结果造成干扰的问题。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的车载领域图像识别方法的应用场景示意图;

图2示出了本申请实施例提供的一种车载领域图像识别方法的流程图;

图3为本申请实施例提供的训练正样本的示意图;

图4示出了本申请实施例提供的车载领域图像识别模型建立方法的流程图;

图5示出了本申请实施例提供的车载领域图像识别模型建立方法中,建立检测子模型和识别子模型的具体方法的流程图;

图6示出了本申请实施例提供的一种标定目标区域的矩形框的示意图;

图7示出了本申请实施例提供的建立识别子模型的方法中,得到扩展样本的具体方法的流程图;

图8示出了本申请实施例提供的得到扩展样本的方法中,构建数字集合的具体方法的流程图;

图9示出了本申请实施例提供的得到扩展样本的方法中,构建数字组合的具体方法的流程图;

图10示出了本申请实施例提供的得到扩展样本的具体方法的另一流程图;

图11(a)示出了本申请实施例提供的扩展模板的示意图;

图11(b)示出了本申请实施例提供基于扩展模板得到的扩展样本;

图12示出了本申请实施例提供的车载领域图像识别方法中,得到目标区域和识别结果的具体方法的流程图;

图13示出了本申请实施例提供的车载领域图像识别方法中,确定目标区域的具体方法的流程图;

图14示出了本申请实施例提供的构建的目标区域的最小外接框的示意图;

图15示出了本申请实施例提供的宽高比检测和分类判别的示意图之一;

图16示出了本申请实施例提供的宽高比检测和分类判别的示意图之二;

图17示出了本申请实施例提供的车载领域图像识别装置的功能模块框图;

图18示出了本申请实施例提供的车载领域图像识别模型建立装置的功能模块框图;

图19示出了本申请实施例提供的电子设备的结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。

另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕“网约车”进行描述,但是应该理解,这仅是一个示例性实施例。

需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。

本申请中的术语“乘客”、“请求方”、“服务请求方”、“服务需求方”、“客户”、“服务请求端”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”、“供应商”和“服务提供端”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”主要是指代请求服务、订购服务的个人、实体或工具。例如,用户可以是乘客。

本申请中的术语“服务请求”和“服务”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的请求。接受该“服务请求”或“服务”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务请求可以是收费的或免费的。

本申请中使用的定位技术可以基于全球定位系统(Global Positioning System,GPS)、全球导航卫星系统(Global Navigation Satellite System,GLONASS),罗盘导航系统(COMPASS)、伽利略定位系统、准天顶卫星系统(Quasi-Zenith Satellite System,QZSS)、无线保真(Wireless Fidelity,WiFi)定位技术等,或其任意组合。一个或多个上述定位系统可以在本申请中互换使用。

本申请的一个方面涉及一种识别系统,该系统可以在获得具有多个包含内容信息的区域的待识别图像后,利用预先建立的识别模型对待识别图像进行处理,根据各区域的位置信息从多个区域中确定出目标区域,对目标区域进行信息识别得到识别结果。其中,该识别模型为预先利用多张标记有目标区域的位置信息的训练正样本进行训练获得,每张训练正样本具有多个包含内容信息的区域。如此,避免了现有技术中对于包含有内容信息的区域进行无差别识别,所造成的难以着重对所需区域进行重点识别的问题,避免其他区域对识别结果造成干扰的问题。

值得注意的是,在本申请提出申请之前,在进行信息识别时,在图像包含有多个具有相同属性的区域时,一般是无差别地对该多个区域的信息进行识别。这种方式难以应用在一些只需要识别出具有相同属性的多个区域中的部分区域信息的场景。例如,针对包含有多个具有内容信息(如文字信息、数字信息、图形信息等)的区域的图像,其中,图像中某些区域的信息一直是固定不变的,而有些区域的信息是变动的,要求能够识别出其中变动的信息。

因此,虽然其中一些区域也包含内容信息,但是由于这些区域的内容信息固定不变,且内容无关紧要,因此,在识别时无需对这些区域中的内容信息进行识别。但是,目前的自然场景下的信息识别方式,往往会无差别地对各个包含有内容信息的区域进行识别。这种方式导致识别效率低,且识别出的无需的信息还会对结果造成影响。

然而,本申请提供的识别方式,可以利用得到的识别模型从多个区域中确定出目标区域,对目标区域进行信息识别得到识别结果。可着重对其中的目标区域进行识别,以避免现有方式中的无差别识别所存在的难以对所需区域进行重点识别的问题。

第一实施例

图1是本申请实施例提供的一种识别系统100的架构示意图。例如,识别系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。识别系统100可以包括服务器110、网络120、服务请求端130、服务提供端140、和数据库150中的一种或多种。

在一些实施例中,服务器110可以包括处理器。处理器可以对服务提供端140发送的信息进行分析处理,以执行本申请中描述的一个或多个功能。例如,处理器可以对服务提供端140发送的多张图像进行分析处理,进而实现识别模型的建立。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(M))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、专用指令集处理器(Application SpecificInstruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital SignalProcessor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(Reduced Instruction Set Computing,RISC)、或微处理器等,或其任意组合。

在一些实施例中,服务请求端130和服务提供端140对应的设备类型可以是移动设备,比如可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,也可以是平板计算机、膝上型计算机、或机动车辆中的内置设备等。

在一些实施例中,数据库150可以连接到网络120以与识别系统100中的一个或多个组件(例如,服务器110,服务请求端130,服务提供端140等)通信。识别系统100中的一个或多个组件可以经由网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接连接到识别系统100中的一个或多个组件,或者,数据库150也可以是服务器110的一部分。

下面结合上述图1示出的识别系统100中描述的内容,对本申请实施例提供的车载领域图像识别方法进行详细说明。

第二实施例

参照图2所示,为本申请实施例提供的一种车载领域图像识别方法的流程示意图,该方法可以由识别系统100中的服务器110来执行。应当理解,在其它实施例中,本实施例所述的车载领域图像识别方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。该识别方法的详细步骤介绍如下。

步骤S40,获取待识别图像,所述待识别图像具有多个包含内容信息的区域。

步骤S50,利用预先建立的识别模型对所述待识别图像进行处理,根据各所述区域的位置信息从所述多个区域中确定出目标区域,对所述目标区域进行信息识别,得到识别结果。

作为一种可能的应用场景,为了保证乘客的出行安全,一般会要求司机按要求定期对提供出行服务的车辆进行消毒处理,尤其是在例如流行性、传染性疾病较为严重的情形下。并且,需要司机在车辆内放置或者在车辆内部粘贴包含有消毒信息的图片,如车贴,还需拍摄获得包含有该车贴的图像以上传至服务器。为了确保司机对车内完成消毒并填写消毒车贴日期,管理人员需要对司机上传的包含车贴的图像进行人工审核,但是由于每天的订单量巨大,人工审核的人物艰巨且人力成本高。为了降低人工审核的工作量和节约人力成本,可采用计算机视觉技术来自动对车贴图像进行信息识别。从而,以此来监督司机能够按要求定期对车辆进行消毒处理。

需要说明的是,本实施例所提供的识别方案也可应用在其他的应用场景下,本申请只是以车载领域中包含消毒信息的图像的识别处理为例进行说明。

本实施例中,待识别图像可以是服务器接收到的服务提供方发送的图像,服务器可对待识别图像进行分析处理,以检测待识别图像中的信息是否符合相关规范。

其中,识别模型为预先利用多张标记有目标区域的位置信息的训练正样本进行训练获得,每张训练正样本具有多个包含内容信息的区域。例如,如图3中所示,待识别图像中可以包含车贴中一些消毒处理的宣传用语,例如“司乘防疫,安全贴士”等字样,还可以包含一些解释性用语,例如用于向乘客解释该车贴的目的的语言,此外,还需包含有具体的消毒日期的信息。此外,由于车贴位于车辆内的不同位置,例如,可以位于车辆的后座靠背上,可以位于车辆的前座后背上,还可以位于车门的内侧等。因此,拍摄获得的图像除了包括车内的车贴之外,还可能包含有车内或车外的其他部分区域图像,这些区域图像均有可能对识别造成干扰。

本实施例中,最终所需的重点识别的信息即为上述的包含有具体的消毒日期的信息,因为该区域内的信息是变动的,后续需要识别模型能够准确识别出其中变动的信息,例如日期,从而判断司机是否按规定每日对车辆进行消毒。而上述的如包含宣传用语、解释性用语的区域以及可能的车内或车外的其他的部分区域,这些区域内的信息对于后续监督司机是否进行消毒处理无实际帮助,因此,这些区域内的信息可不作重点识别。

因此,本实施例中,可从待识别图像包含的多个区域中确定出目标区域,该目标区域即为上述包含有变动信息的(具体的消毒日期的)的区域。

考虑到各个车辆内的车贴一般样式均一致,目标区域在图像中的位置变动不大,因此,可以获得待识别图像中各个区域的位置信息。

由于训练得到的识别模型着重基于训练正样本中目标区域的位置信息学习训练得到,因此,针对待识别图像,基于识别模型可基于各个区域的位置信息确定出目标区域,从而将基于包含有所需信息的目标区域进行信息识别。避免了其他区域对识别结果造成的干扰。

本实施例所提供的车载领域图像识别方法,避免了现有的针对自然场景下的信息识别技术所存在的,对于都包含有内容信息的区域进行无差别识别,造成的难以着重对其中包含所需信息的区域进行重点识别,其他区域的信息对识别结果造成干扰的问题。

本申请实施例还提供一种车载领域图像识别模型建立方法,请参阅图4,以下首先对该识别模型建立方法中预先训练得到识别模型的过程进行详细说明:

步骤S10,针对获取的多张训练正样本中的每张训练正样本,获得所述训练正样本中包含内容信息的多个区域。

步骤S20,从所述多个区域中标定出目标区域,并获得所述目标区域的位置信息。

步骤S30,利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,得到识别模型。

在上述应用场景下,本实施例中的训练正样本即为历史中已获取的司机所上传的包含消毒的相关信息的图像。其中,由于出行平台上的服务提供方数量众多,各个服务提供方所拍摄的图像的角度、大小等均可能不同。因此,预先获取的训练正样本可以包括多张由不同的服务提供方上传的、不同图像大小、不同角度以及不同时期所拍摄的图像。从而丰富训练样本的多样性。

本实施例中,获得的正样本可如图3中所示,利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,如此,可以着重基于目标区域的位置信息对训练正样本进行特征学习,使得训练得到的识别模型后续可以准确从待识别的图像包含的多个区域中准确识别出目标区域,进而基于目标区域中的信息进行识别检测。

本实施例中,基于一些应用场景下,仅需对图像中的多个具有内容信息的区域中的部分区域进行信息识别时,现有的自然场景识别方式下存在的对全部区域均进行学习以得到识别模型,所存在的一方面学习一些不必要的特征信息对后续识别模型的识别结果造成影响,另一方面,存在降低识别模型的识别效率的问题。因此,本实施例所提供的车载领域图像识别模型建立方法,针对性地采用了先标定出图像中多个区域中的目标区域,并利用标记有目标区域的位置信息的样本对识别模型进行训练的方式,如此,使得识别模型可着重对其中的目标区域的特征进行学习,可提供后续识别模型的识别效率。

本实施例中,识别模型包括检测子模型和识别子模型,其中,检测子模型的学习训练可主要基于训练正样本中标记的目标区域的位置信息进行训练,以用于后续从待识别的图像中检测出目标区域以排除开一些对识别结果造成影响的其他区域。识别子模型的学习训练可基于目标区域中包含的具体信息进行训练,以用于后续对待识别的图像中的目标区域中的信息进行分析识别。

此外,在本实施例中,考虑到预先采集到的训练正样本的数量有限,并且,由于需要识别出图像中的日期的要求,而日期受时间的限制。因此,采集到的训练正样本中的日期可能仅是一年中的部分日期,并未包括后续进行识别时所需识别的日期。例如,以该项目从2月1日开始,当前时间为7月15日,则采集到的训练正样本为2月1日至7月15日期间的样本,而缺少7月15日至次年2月1日期间的样本。

因此,若仅仅以获得的历史中的训练正样本进行模型的训练,会存在样本不平衡的问题,这样使得日期已经出现过的图像的识别准确率较高,但是日期没有出现在样本中的图像的识别准确率较低。从而导致模型过拟合的问题,对已出现的样本识别率高,而泛化能力差,对未出现过的样本识别率低得到的识别模型的识别准确率较低。

基于上述考虑,本实施例采用了对训练正样本进行扩展的方式以解决上述问题,请结合参阅图5,本实施例中,可通过以下方式训练得到识别模型。

步骤S31,利用标记有目标区域的位置信息的多张训练正样本对构建的第一神经网络模型进行训练,得到检测子模型。

步骤S32,根据所述多张训练正样本的目标区域中的内容信息进行样本扩展,得到多张扩展样本。

步骤S33,利用多张训练正样本和多张扩展样本对构建的第二神经网络模型进行训练,得到识别子模型。

本实施例中,可预先构建第一神经网络模型和第二神经网络模型,第一神经网络模型和第二神经网络模型可采用但不限于卷积神经网络模型(Convolutional NeuralNetworks,CNN)。其中,第一神经网络模型可采用轻量级的MobileNet模型,可基于RetinaFace检测方法实现学习训练。该检测方法拥有较高的准招性能,并且,具有较高的处理效率。

预先在标定训练正样本的目标区域的位置信息时,以目标区域的角点坐标和框定目标区域的矩形框标定目标区域的位置信息。

基于此,在训练检测子模型时,可利用携带有目标区域的角点坐标以及框定目标区域的矩形框的多张训练正样本,对构建的第一神经网络模型进行训练,得到检测子模型。

考虑到车贴中包含具体地日期信息的目标区域的形状一般为矩形。本实施例中,利用目标区域的角点坐标标定目标区域的位置信息,在目标区域为矩形时,该角点可以是目标区域的四个边角点。此外,目标区域的形状也可以是其他的不规则形状,在目标区域为其他的不规则形状时,该角点可以是不规则形状的外边缘的多个边缘点。

利用角点坐标可准确标定出目标区域在图像中的相对位置信息,检测子模型基于目标区域的角点坐标进行训练可学习到目标区域准确的位置信息。

此外,考虑到所采集的训练正样本的大小、拍摄角度等的差异,因此,在不同的训练正样本中,目标区域在整个图像中相对的角点坐标可能存在差异,因此,若仅对目标区域的角点坐标进行学习,由于角点坐标的多样性,导致学习效果不佳,后续难以准确确定出待识别图像中的目标区域。

因此,基于上述考虑,本实施例中在标定目标区域时,还添加了框定目标区域的矩形框。该矩形框的方位可以是端正的,即矩形框的边线分别为水平线或垂直线。目标区域的边缘点可以是落在矩形框的边线上,或者整个目标区域也可完全处于矩形框的内部,例如图6中所示,标定有目标区域的四个角点,以及框定该目标区域的端正的矩形框。

利用框定目标区域的矩形框可标定出目标区域在整个图像中的大致位置,如此,结合目标区域的角点坐标和矩形框,则可分别从目标区域的准确地位置信息和目标区域的大致位置信息进行学习。在提高得到的检测子模型对目标区域的位置的检测准确性的基础上,避免由于位置多样性对学习造成的干扰。

通过以上方式,可以训练得到用于进行目标区域检测的检测子模型。本实施例中,考虑到虽然可以以目标区域的位置信息从图像包含的多个区域中确定出目标区域,但是,由于拍摄时的背景以及拍摄角度等问题,可能导致图像中的其他区域,例如背景中的部分区域图像可能与目标区域的位置接近而导致被误判为目标区域。

因此,为了避免上述问题,本实施例中,识别模型还包括分类子模型,可通过以下方式预先训练得到分类子模型:

利用获取的多张训练负样本和标记有目标区域的位置信息的多张训练正样本对构建的分类器进行训练,得到分类子模型。

其中,训练正样本即为包含具有所需内容信息的目标区域的样本,其中,所需内容信息即为上述的包含消毒日期的内容信息。而训练负样本即为包含有与训练正样本中的目标区域相同位置信息的部分区域的样本,但该部分区域中并未包含上述所需内容信息。

利用训练正样本和训练负样本对分类器进行训练,训练得到的分类子模型可以判断出图像中是否包含所需内容信息。如此,在利用训练得到的检测子模型检测出图像中的目标区域后,基于分类子模型可判断出该目标区域中是否包含所需内容信息,即是否为真实的消毒车贴图像。

本实施例中,分类子模型仅需进行目标区域中是否包含所需内容信息的判断,而目标区域中包含的具体信息的识别需利用训练得到的识别子模型进行识别。由上述可知,为了避免训练正样本的不均衡的问题,可基于训练正样本进行样本的扩展。

其中,各张训练正样本的目标区域中的内容信息包含文字和数字,由上述可知,其中,目标区域中的内容信息的变动主要是数字的变动,即消毒日期的变动,而文字一般仅是解释性的说明,是固定不变的。而消毒车贴中的日期一般是司机手写上的,不仅不能包含一年中的所有日期,而且还存在手写上数字形态的差别,因此,请参阅图7,本实施例中,可通过以下方式基于训练正样本进行样本的扩展:

步骤S321,提取出各张所述训练正样本的目标区域中包含的数字,构成数字集合。

步骤S322,对所述数字集合中包含的数字进行组合得到多个数字组合。

步骤S323,基于所述多个数字组合和所述文字,得到多个扩展样本。

由上述可知,训练正样本的目标区域中包含文字和数字,其中,数字为日期信息,例如2月26日,此外,也可以包含年份。目标区域中的内容信息可以是,例如“今日已消毒2月26日”。目标区域中的数字在目标区域中具有相对固定位置,在扩展时,主要需要对其中的日期进行扩展。因此,可提取目标区域中包含的数字,如月份对应位置处的月份,如1至7,以及日对应位置处的数字,如01至30。将提取出的所有数字构成一个数字集合。

本实施例中,在该数字集合中可包括多个子集合,各个子集合中可包含数字相同但书写形态不同的数字,例如,所有的数字1可构成一个子集合,所有的数字2可构成一个子集合。

在进行数字日期的扩展时,则可以分别从各个数据子集合中提取出数字以进行组合,可以得到多个数字组合,再结合目标区域中包含的文字以及得到的多个数字组合,从而扩展得到多个扩展样本。

本实施例中,考虑到针对同一个数字可能有很多种不同的写法,而采集到的训练正样本中已出现的书写形态可能并不全面,因此,为了进一步丰富用于学习训练的数字的特征,以进一步提高得到的识别子模型的识别准确性,请参阅图8,本实施例中,在上述构成数字集合的步骤中,可通过以下方式实现:

步骤S3211,提取出各张所述训练正样本的目标区域中包含的数字。

步骤S3212,获取包含携带不同书写信息的多个数字的扩充集合。

步骤S3213,将所述扩充集合中的数字和多个训练正样本中的数字构成数字集合。

本实施例中,可预先获取扩充集合,该扩充集合可以是手写体数据集,该数据集中包含多个书写信息不同的0至9之间的多个数字。该扩充集合中包含的各个数字可以是在其他场景下采集到的数字。对于手写体的数字而言,同一个数字由不同人或同一个人不同时间、不同场景下书写出来,其书写信息一般均不相同。因此,同一个数字其书写信息也是多种多样。

在提取出训练正样本的目标区域中包含的数字之后,可将扩充集合中的数字与多个训练正样本中的数字构成数字集合。利用扩充集合中多个书写信息不同的数字以丰富数字特征信息,可使识别子模型学习到更多样的数字特征,有利于后续对待识别的日期的识别准确性。

请参阅图9,在本实施例中,在上述基于数字集合中的数字得到多个数字组合时,可以通过以下方式实现:

步骤S3221,针对预先设置的各个扩展日期,获得所述扩展日期所需的扩展数字。

步骤S3222,从所述数字集合中随机抽取与所述扩展数字对应的数字,以构成表征所述扩展日期的数字组合。

本实施例中,可预先设置多个扩展日期,以上述为例,扩展日期可以是从7月16日至次年的2月1日之间的各个日期,如此,可与现有采集到的训练正样本中包含的2月1日至7月15日包含的各个日期,以构成全年中包含的所有日期。

再针对各个扩展日期,例如12月5日,则该扩展日期所需的扩展数字为1、2、5。因此,可从包含数字1的数字子集合中提取一个数字、从包含数字2的数字子集合中提取一个数字,以作为月份,再从包含数字5的数字子集合中提取一个数字,作为日,从而得到与扩展日期12月5日对应的数字组合。

按上述方式,则可以得到与各个扩展日期对应的数字组合,并且,各个扩展日期可对应多个具有相同数字但书写形态不同的数字组合。

在上述得到所需的扩展日期对应的数字组合后,还需基于数字组合得到扩展样本,请参阅图10,本实施例中,可通过以下方式生成扩展样本:

步骤S3231,针对各所述训练正样本,扣取出所述训练正样本的目标区域中的数字以得到对应的扩展模板。

步骤S3232,将各所述数字组合填充至任一所述扩展模板中,得到对应的扩展样本。

本实施例中,针对各个训练正样本,可采用利用白色图像格或黑色图像格填充训练正样本的目标区域中的数字的方式得到扩展模板。如此,可得到多张不同拍摄场景,如不同大小、不同背景图像、不同角度等的扩展模板。

再将得到的各个数字组合填充至任一扩展模板中,具体地,将数字组合填充至扩展模板中的日期信息对应的位置处,以与扩展模板中已有的其他信息构成扩展样本。如图11(a)所示可表示得到的扩展模板,图11(b)可表示将得到的数字组合填充至扩展模板后得到的扩展样本(扩展样本包含的目标区域)。

此外,除了可以采用扣取出训练正样本中的数字以制作扩展模板之外,还可采集不同场景下获得的空白模板作为扩展模板,该空白模板为相较训练正样本而言缺少其中的数字的模板,即日期对应位置处为空白的模板。

通过以上步骤,可以通过预先标定出训练正样本中目标区域的位置信息,以标记有目标区域的位置信息的训练正样本对第一神经网络模型进行训练得到检测子模型。使得训练得到的检测子模型可学习训练得到目标区域的位置信息,进而后续针对待识别的图像可定位出其中的目标区域,排除开其他一些也包含内容信息的区域对识别造成的影响。

进一步地,为了避免有些位置与目标区域位置相近的区域造成的干扰,利用训练正样本和训练负样本对分类器进行训练得到分类子模型。后续可利用分类子模型对检测子模型检测出的目标区域中的内容信息进行判别,以判断目标区域中是否包含有所需的内容信息,例如日期信息。

此外,考虑到本申请主要是对目标区域中的日期信息进行识别,而采用的训练正样本中由于日期形成有限,导致样本不均衡。因此,基于训练正样本进行扩展得到扩展样本,利用训练正样本和扩展样本对第二神经网络模型进行训练得到识别子模型。可提高识别子模型后续对于各个日期的图像的识别准确性。

在通过以上方式获得识别模型之后,由上述可知,识别模型包括检测子模型和识别子模型,其中,识别子模型为预先基于多张训练正样本以及根据多张训练正样本的内容信息扩展得到的多张扩展样本进行训练获得。上述对待识别图像进行处理,得到识别结果的步骤S50中,可以通过以下方式实现,请参阅图12:

步骤S51,利用预先建立的检测子模型基于位置信息检测以从所述多个区域中确定出目标区域。

步骤S52,利用预先建立的识别子模型对所述待识别图像的目标区域进行信息识别,得到识别结果。

本实施例中,基于训练正样本扩展得到扩展样本的详细过程可参见上述实施例。利用基于训练正样本和扩展样本训练得到的识别子模型对待识别图像的目标区域中的内容信息进行识别,可提高识别的准确性。避免了待识别图像中包含训练正样本中未出现过的日期信息时,识别子模型识别准确率低的问题。

本实施例中,为了能够准确定位出图像中目标区域的位置信息,在进行检测子模型训练时,可标定出目标区域的角点坐标和框定目标区域的矩形框,具体可参见上述实施例。因此,在利用检测子模型确定待识别图像中的目标区域时,可利用预先建立的检测子模型基于矩形框和角点坐标的检测,从所述多个区域中确定出目标区域。

如此,可以基于学习到的目标区域的大致位置信息(矩形框表征的)以及目标区域的准确位置信息(角点坐标表征的)相结合,以确定出待识别图像中的目标区域。并且,还避免了由于图像中目标区域的角度多样,单独检测矩形框的方式可能导致目标区域中的文字信息、数字信息等在矩形框中的占比很小,影响到后续的识别效果的问题。

在本实施例中,通过检测子模型可将待识别图像中所有可能是目标区域的部分检测出,但是检测子模型的检测准确率不可能达到100%的准确率,因此,会存在一些误检的情况。若对这些误检的区域不作处理,而送入后续的识别子模型进行识别,将产生错误的识别结果。因此,请参阅图13,在本实施例中,上述从多个区域中确定出目标区域的步骤中,可通过以下方式执行:

步骤S511,利用预先建立的检测子模型基于矩形框和角点坐标的检测,从所述多个区域中确定出初步目标区域。

步骤S512,根据所述初步目标区域的角点坐标和边线,构建所述初步目标区域的最小外接框。

步骤S513,检测所述最小外接框的尺寸是否属于预设范围内,若属于预设范围内,则确定所述初步目标区域为目标区域。

本实施例中,考虑到目标区域的形状一般为矩形,因此,在利用检测子模型基于矩形框和角点坐标确定出初步目标区域后,可构建初步目标区域的最小外接框。即沿初步目标区域的边线和角点划分的最小外接框,如图14中所示,其中,外部的框为上述的矩形框,沿内部边缘框定的框为最小外接框。根据先验知识,实际的目标区域的尺寸应当在一定范围时,因此,可通过检测最小外接框的尺寸是否在预设范围内,从而判断是否为真实的目标区域。其中,该尺寸可以是最小外接框的高度、宽度或者是宽高比等等。

例如,根据先验知识,图像中的目标区域的宽高比一般在6:1至9:1之间,因此,一些判定为初步目标区域的宽高比若不在该宽高比范围时,则可以将其排除。

在此基础上,考虑到一些区域可能与实际的目标区域位置信息相近而被判定为目标区域,但是实际上这些区域未包含所需的信息,例如,可能是拍摄背景中的某个区域,因此,在本实施例中,在识别模型中还加入了分类子模型。该分类子模型为预先基于采集的训练正样本和训练负样本对分类器进行训练获得的,具体地训练过程可参见上述实施例。

利用分类子模型对确定出的目标区域进行分类识别,得到分类结果,该分类结果可表征目标区域中是否包含与训练正样本的目标区域中的内容信息对应的信息。也即,分类子模型可识别判断确定出的目标区域中是否包含与消毒相关的日期信息。

例如,请结合图15中所示,首先可对确定出的各个初步目标区域进行宽高比检测,若输出为假,即宽高比不符合要求,则无需进行后续的处理,若输出为真,即宽高比符合要求,则进行后续的目标区域中是否包含所需的内容信息的分类判别,若判别结果为真,则继续后续的对目标区域内的内容信息进行识别的处理,若判别结果为假,则无需进行后续的识别处理。其中,图15中上方框定出的区域为拍摄背景中的区域,通过宽高比的检测可以将该区域排除掉,图15中下方框定出的区域通过宽高比检测以及分类判别之后,可判定该目标区域为包含所需内容信息的区域,可用于后续的识别处理。

此外,可结合参阅图16中所示,其中,图16中的上方框定的区域为拍摄背景中的区域,但是由于该区域与真实的目标区域的尺寸相近,因此,利用宽高比检测的方式检测时输出为真,但是,再利用分类子模型进行真假分类判别时,可确定该区域中未包含所需的内容信息,即分类判别结果为假,因此,无需进行后续的识别处理。而图16中下方框定的区域的宽高比检测结果为真,且分类判别结果为真,可送入后续的识别处理流程。

本实施例中,加入分类子模型对确定出的目标区域中的信息的真假进行判断,可进一步地筛除一些并未包含所需信息而被误判为目标区域的区域。

由上述可知,图像的目标区域中包含文字信息和数字信息,在进行识别时,可利用预先建立的识别子模型获得待识别图像的目标区域中包含的文字信息和数字信息,并根据数字信息得到对应的日期信息。

考虑到待识别图像中的文字信息和数字信息的角度可能倾斜而影响到识别效果,因此,可检测上述划定的最小外接框的方位信息是否满足预设要求,若不满足预设要求,则对目标区域进行旋转矫正。基于旋转矫正后的目标区域进行信息识别。

需要说明的是,本实施例中的车载领域图像识别方法基于实施例上述所构建的识别模型实现,本实施例中与识别模型相关的描述未详尽之处可参见上述实施例的相关描述,本实施例在此不作赘述。

第三实施例

基于同一申请构思,本申请实施例中还提供了与车载领域图像识别方法对应的车载领域图像识别装置220,请参阅图17,由于本申请实施例中的装置解决问题的原理与本申请实施例上述车载领域图像识别方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

请参阅图17,为本申请实施例提供的一种车载领域图像识别装置220的示意图,所述装置包括:获取模块221和识别模块222。

获取模块221,用于获取待识别图像,所述待识别图像具有多个包含内容信息的区域。

可以理解,该获取模块221可以用于执行上述步骤S40,关于该获取模块221的详细实现方式可以参照上述对步骤S40有关的内容。

识别模块222,用于利用预先建立的识别模型对所述待识别图像进行处理,根据各所述区域的位置信息从所述多个区域中确定出目标区域,对所述目标区域进行信息识别,得到识别结果;

其中,所述识别模型为预先利用多张标记有目标区域的位置信息的训练正样本进行训练获得,每张训练正样本具有多个包含内容信息的区域。

可以理解,该识别模块222可以用于执行上述步骤S50,关于该识别模块222的详细实现方式可以参照上述对步骤S50有关的内容。

一种可能的实施方式中,所述识别模型包括检测子模型和识别子模型;

所述识别模块222用于通过以下方式得到识别结果:

利用预先建立的检测子模型基于位置信息检测以从所述多个区域中确定出目标区域;

利用预先建立的识别子模型对所述待识别图像的目标区域进行信息识别,得到识别结果,所述识别子模型为预先基于多张训练正样本以及根据多张训练正样本的内容信息扩展得到的多张扩展样本进行训练获得。

一种可能的实施方式中,所述识别模块222用于通过以下方式得到包含日期信息的识别结果:

利用预先建立的识别子模型获得所述待识别图像的目标区域中包含的文字信息和数字信息,并根据所述数字信息得到对应的日期信息。

一种可能的实施方式中,所述识别模块222用于通过以下方式确定出目标区域:

利用预先建立的检测子模型基于矩形框和角点坐标的检测,从所述多个区域中确定出目标区域。

一种可能的实施方式中,所述识别模块222用于通过以下方式确定出目标区域:

根据各所述区域的角点坐标和矩形框,从所述多个区域中确定出初步目标区域;

根据所述初步目标区域的角点坐标和边线,构建所述初步目标区域的最小外接框;

检测所述最小外接框的尺寸是否属于预设范围内,若属于预设范围内,则确定所述初步目标区域为目标区域。

一种可能的实施方式中,所述车载领域图像识别装置220还包括矫正模块;

所述矫正模块,用于检测所述最小外接框的方位信息是否满足预设要求,若不满足所述预设要求,则对所述目标区域进行旋转矫正。

一种可能的实施方式中,所述识别模型还包括分类子模型,所述分类子模型为预先利用多张训练正样本和多张训练负样本对分类器进行训练获得;

所述识别模块222还用于通过以下方式对所述待识别图像进行分类判断:

利用所述分类子模型对确定出的目标区域进行分类识别,得到分类结果,所述分类结果表征所述目标区域中是否包含与所述训练正样本的目标区域中的内容信息对应的信息。

此外,基于同一申请构思,本申请实施例中还提供了与车载领域图像识别模型建立方法对应的车载领域图像识别模型建立装置210,请参阅图18,由于本申请实施例中的装置解决问题的原理与本申请实施例上述车载领域图像识别模型建立方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

请参阅图18,为本申请提供的一种车载领域图像识别模型建立装置210的示意图,所述装置包括:获得模块211、标定模块212、训练模块213。

获得模块211,用于针对获取的多张训练正样本中的每张训练正样本,获得所述训练正样本中包含内容信息的多个区域。

可以理解,该获得模块211可以用于执行上述步骤S10,关于该获得模块211的详细实现方式可以参照上述对步骤S10有关的内容。

标定模块212,用于从所述多个区域中标定出目标区域,并获得所述目标区域的位置信息。

可以理解,该标定模块212可以用于执行上述步骤S20,关于该标定模块212的详细实现方式可以参照上述对步骤S20有关的内容。

训练模块213,用于利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,得到识别模型。

可以理解,该训练模块213可以用于执行上述步骤S30,关于该训练模块213的详细实现方式可以参照上述对步骤S30有关的内容。

一种可能的实施方式中,所述识别模型包括检测子模型和识别子模型,所述训练模块213用于通过以下方式得到检测子模型和识别子模型:

利用标记有目标区域的位置信息的多张训练正样本对构建的第一神经网络模型进行训练,得到检测子模型;

根据所述多张训练正样本的目标区域中的内容信息进行样本扩展,得到多张扩展样本;

利用多张训练正样本和多张扩展样本对构建的第二神经网络模型进行训练,得到识别子模型。

一种可能的实施方式中,所述识别模型还包括分类子模型,所述训练模块213还用于通过以下方式得到分类子模型:

利用获取的多张训练负样本和标记有目标区域的位置信息的多张训练正样本对构建的分类器进行训练,得到分类子模型。

一种可能的实施方式中,所述目标区域中的内容信息包含文字和数字,所述训练模块213用于通过以下方式得到扩展样本:

提取出各张所述训练正样本的目标区域中包含的数字,构成数字集合;

对所述数字集合中包含的数字进行组合得到多个数字组合;

基于所述多个数字组合和所述文字,得到多个扩展样本。

一种可能的实施方式中,所述数字表征日期,所述训练模块213用于通过以下方式获得数字组合:

针对预先设置的各个扩展日期,获得所述扩展日期所需的扩展数字;

从所述数字集合中随机抽取与所述扩展数字对应的数字,以构成表征所述扩展日期的数字组合。

一种可能的实施方式中,所述训练模块213用于通过以下方式构成数字集合:

提取出各张所述训练正样本的目标区域中包含的数字;

获取包含携带不同书写信息的多个数字的扩充集合;

将所述扩充集合中的数字和多个训练正样本中的数字构成数字集合。

一种可能的实施方式中,所述训练模块213用于通过以下方式得到扩展样本:

针对各所述训练正样本,扣取出所述训练正样本的目标区域中的数字以得到对应的扩展模板;

将各所述数字组合填充至任一所述扩展模板中,得到对应的扩展样本。

一种可能的实施方式中,所述位置信息包括所述目标区域的角点坐标以及框定所述目标区域的矩形框;

所述训练模块213用于通过以下方式获得检测子模型:

利用携带有目标区域的角点坐标以及框定所述目标区域的矩形框的多张训练正样本,对构建的第一神经网络模型进行训练,得到检测子模型。

第四实施例

请参阅图19,本申请实施例还提供了一种电子设备300,该电子设备300可为上述的服务器110。该电子设备300包括:处理器310、存储器320、和总线330。所述存储器320存储有所述处理器310可执行的机器可读指令,当电子设备300运行时,所述处理器310与所述存储器320之间通过总线330通信,所述机器可读指令被所述处理器310执行时执行如下处理:

一种可能的实施方式中,处理器310执行的指令中,包括如下过程:

针对获取的多张训练正样本中的每张训练正样本,获得所述训练正样本中包含内容信息的多个区域;

从所述多个区域中标定出目标区域,并获得所述目标区域的位置信息;

利用标记有目标区域的位置信息的多张训练正样本对构建的神经网络模型进行训练,得到识别模型。

另一种可能的实施方式中,处理器310执行的指令中,包括如下过程:

获取待识别图像,所述待识别图像具有多个包含内容信息的区域;

利用预先建立的识别模型对所述待识别图像进行处理,根据各所述区域的位置信息从所述多个区域中确定出目标区域,对所述目标区域进行信息识别,得到识别结果;

其中,所述识别模型为预先利用多张标记有目标区域的位置信息的训练正样本进行训练获得,每张训练正样本具有多个包含内容信息的区域。

关于电子设备300运行时,处理器310执行的指令中所涉及的过程,可以参照上述方法实施例中的相关说明,这里不再详述。

第五实施例

本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述车载领域图像识别模型建立方法或车载领域图像识别方法的步骤。

本申请实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述车载领域图像识别模型建立方法或车载领域图像识别方法的步骤。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述车载领域图像识别模型建立方法或车载领域图像识别方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 车载领域图像识别方法、识别模型建立方法、装置、电子设备和可读存储介质
  • 音乐识别方法、音符识别模型建立方法、装置及电子设备
技术分类

06120112773432