掌桥专利:专业的专利平台
掌桥专利
首页

图像识别方法、装置及电子设备

文献发布时间:2024-01-17 01:18:42


图像识别方法、装置及电子设备

技术领域

本申请涉及汽车技术领域,尤其涉及自动驾驶技术领域,具体涉及一种图像识别方法、装置及电子设备。

背景技术

计算机视觉方法已经广泛应用于自动驾驶和辅助驾驶系统中,使用纯视觉或者点云图像融合技术的识别方法已经广泛应用于基于人工智能(artificial intelligence,AI)的各级辅助驾驶和自动驾驶系统中。

对于视觉部分,车辆上安装的摄像头由于视角、景深、安装位置等参数的不同,导致相同型号的摄像头在不同的车辆上对同一物体进行拍摄,得到的图像也不一样。增加了图像识别的难度。

发明内容

本申请的目的之一在于提供一种图像识别方法、装置及电子设备,以解决降低图像识别的难度。

为了实现上述目的,本申请采用的技术方案如下:

根据本申请涉及的第一方面,提供一种图像识别方法,应用于安装有摄像头的车辆。该方法包括:响应于车辆的启动操作,控制摄像头拍摄当前时刻车辆所处道路的道路图像,该道路图像为待校正的图像。根据摄像头的第一参数信息以及第二参数信息对道路图像进行校正,得到校正后的道路图像。第一参数信息为处于校正位置的摄像头的参数信息,第二参数信息为处于第一位置的摄像头的参数信息。第一位置为当前时刻摄像头在车辆上的位置。该摄像头在校正位置的设置参数与在第一位置的设置参数存在偏差,设置参数包括朝向角度和/或位置信息。对校正后的道路图像进行识别,得到车辆行驶的道路上的目标对象的信息。

根据上述技术手段,本申请提供的图像识别方法,在获取到车辆上的摄像头拍摄的道路图像之后,可以根据处于校正位置的摄像头的参数信息以及当前时刻车辆的摄像头的参数信息,对该道路图像进行校正,用以将图像投影到校正位置。由于车辆的摄像头的实际安装位置与标准位置之间的偏差,导致拍摄的图像不够精确。而本申请中,校正后的图像处于校正位置。由于处于校正位置的图像更容易被识别,因此,降低了图像识别的难度。

在一种可能的实施方式中,摄像头的参数信息包括内参和外参。上述方法还包括:响应于摄像头在处于车辆上处于目标位置,通过摄像头拍摄多帧图像。其中,目标位置包括校正位置或第一位置。基于该多帧图像,确定摄像头处于目标位置时的参数信息。当目标位置为校正位置时,参数信息包括摄像头处于校正位置时的标准内参和标准外参。当目标位置为第一位置时,参数信息包括摄像头处于第一位置时的实际内参和实际外参。

根据上述技术手段,本申请提供的图像识别方法中,可以摄像头的内参和外参,准确的对图像进行校正。

在一种可能的实施方式中,上述“根据摄像头的第一参数信息和第二参数信息对道路图像进行校正,得到校正后的道路图像”包括:根据摄像头的标准内参与标准外参,以及实际内参与实际外参,确定摄像头的校正系数,并根据校正系数对道路图像进行校正,得到校正后的道路图像。

根据上述技术手段,本申请提供的图像识别方法中,由于摄像头处于不同位置的内参和外参能够反映摄像头的偏移情况,因此,基于摄像头在标准位置的内参与外参,以及在第一位置的内参与外参,可以准确的确定摄像头的校正系数。如此,基于该校正系数,可以快速的对图像进行校正。

在一种可能的实施方式中,摄像头的校正系数为摄像头的标准内参与标准外参的乘积和摄像头的实际内参与实际外参的乘积之间的比值。

根据上述技术手段,本申请提供的图像识别方法中,能够快速的计算得到摄像头的校正系数。

在一种可能的实施方式中,上述“基于多帧图像,确定摄像头处于目标位置时的参数信息”包括:基于多帧图像,根据预设标定算法,确定摄像头的旋转矩阵以及平移矢量、焦距、多帧图像的中心像素点的坐标,并根据摄像头的旋转矩阵以及平移矢量,得到摄像头的外参矩阵,根据摄像头的焦距以及多帧图像的中心像素点的坐标,得到摄像头的内参矩阵,以获取摄像头的参数信息。

根据上述技术手段,本申请提供的图像识别方法中,能够根据标定算法对多帧校正图像进行标定,得到摄像头的多个参数,并基于该多个参数,准确的得到摄像头的内参和外参。

在一种可能的实施方式中,上述“对校正后的道路图像进行识别,得到车辆行驶的道路上的目标物体的信息”包括:将校正后的道路图像输入图像识别模型,得到车辆行驶的道路上的目标物体的信息。图像识别模型具备识别图像中的物体的信息的功能。

根据上述技术手段,本申请提供的图像识别方法中,基于图像识别模型可以快速的识别图像中的对象的信息。

根据本申请提供的第二方面,提供一种图像识别装置,应用于安装有摄像头的车辆。该装置包括:控制单元,用于响应于车辆的启动操作,控制摄像头拍摄当前时刻车辆所处道路的道路图像,该道路图像为待校正的图像。校正单元,用于根据摄像头的第一参数信息以及第二参数信息对道路图像进行校正,得到校正后的道路图像。第一参数信息为处于校正位置的摄像头的参数信息,第二参数信息为处于第一位置的摄像头的参数信息。第一位置为当前时刻摄像头在车辆上的位置。该摄像头在校正位置的设置参数与在第一位置的设置参数存在偏差,设置参数包括朝向角度和/或位置信息。识别单元,用于对校正后的道路图像进行识别,得到车辆行驶的道路上的目标对象的信息。

在一种可能的实施方式中,摄像头的参数信息包括内参和外参。该装置还包括:确定单元,用于响应于摄像头在处于车辆上处于目标位置,通过摄像头拍摄多帧图像。其中,目标位置包括校正位置或第一位置。基于该多帧图像,确定摄像头处于目标位置时的参数信息。当目标位置为校正位置时,参数信息包括摄像头处于校正位置时的标准内参和标准外参。当目标位置为第一位置时,参数信息包括摄像头处于第一位置时的实际内参和实际外参。

在一种可能的实施方式中,校正单元,具体用于根据摄像头的标准内参与标准外参,以及实际内参与实际外参,确定摄像头的校正系数,并根据校正系数对道路图像进行校正,得到校正后的道路图像。

在一种可能的实施方式中,摄像头的校正系数为摄像头的标准内参与标准外参的乘积和摄像头的实际内参与实际外参的乘积之间的比值。

在一种可能的实施方式中,确定单元,具体用于基于多帧图像,根据预设标定算法,确定摄像头的旋转矩阵以及平移矢量、焦距、多帧图像的中心像素点的坐标,并根据摄像头的旋转矩阵以及平移矢量,得到摄像头的外参矩阵,根据摄像头的焦距以及多帧图像的中心像素点的坐标,得到摄像头的内参矩阵,以获取摄像头的参数信息。

在一种可能的实施方式中,识别单元,具体用于将校正后的道路图像输入图像识别模型,得到车辆行驶的道路上的目标物体的信息。图像识别模型具备识别图像中的物体的信息的功能。

根据本申请提供的第三方面,提供一种电子设备,应用于安装有摄像头的车辆。电子设备包括存储器和处理器,存储器和处理器耦合;存储器用于存储计算机程序代码,计算机程序代码包括计算机指令;当处理器执行计算机指令时,电子设备执行上述第一方面及其任一种可能的实施方式提供的图像识别方法。

根据本申请提供的第四方面,提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在电子设备上运行时,使得电子设备执行上述第一方面及其任一种可能的实施方式提供的图像识别方法。

根据本申请提供的第五方面,提供一种车辆,包括上述第三方面提供的电子设备。

根据本申请提供的第六方面,提供一种计算机程序产品,计算机程序产品包括计算机指令,当计算机指令在在电子设备上运行时,使得电子设备执行上述第一方面及其任一种可能的实施方式提供的图像识别方法。

由此,本申请的上述技术特征具有以下有益效果:

(1)在获取到车辆上的摄像头拍摄的道路图像之后,可以根据处于校正位置的摄像头的参数信息以及当前时刻车辆的摄像头的参数信息,对该道路图像进行校正,用以将图像投影到校正位置。由于车辆的摄像头的实际安装位置与标准位置之间的偏差,导致拍摄的图像不够精确。而本申请中,校正后的图像处于校正位置。由于处于校正位置的图像更容易被识别,因此,降低了图像识别的难度。

(2)基于摄像头在不同位置的内参和外参,准确的确定摄像头的校正系数,并基于该校正系数对图像进行校正。

(3)基于校正后的图像,可以准确的对图像进行检测,确定车辆周围的物体的信息。

需要说明的是,第二方面至第六方面中的任一种实现方式所带来的技术效果可参见第一方面中对应实现方式所带来的技术效果,此处不再赘述。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

图1是根据一示例性实施例示出的一种车辆的结构示意图;

图2是根据一示例性实施例示出的一种图像识别方法的流程图;

图3是根据一示例性实施例示出的又一种图像识别方法的流程图;

图4是根据一示例性实施例示出的一种图像识别装置的框图;

图5是根据一示例性实施例示出的一种图像识别装置的框图。

具体实施方式

以下将参照附图和优选实施例来说明本申请的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本申请,而不是为了限制本申请的保护范围。

需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,遂图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。

在实施例的描述中,除非另有说明,“/”表示“或”的意思,例如,A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”“多个”是指两个或两个以上。“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。

纯视觉或者点云图像融合技术的识别方法已经广泛应用于自动驾驶技术。基于激光雷达的方法点云图像可以基于激光雷达的方法获取。基于激光雷达的方法主要由于激光雷达本身硬件成本高和可靠性问题导致落地困难,而且单点云的数据缺乏图像视觉的语意信息,对于远处小物体和目标分类来说具有难度。

通常情况下,车辆的纯视觉和各自动驾驶方案供应商的视觉或雷射融合方法为主。对于视觉部分,行车上安装的各摄像头由于焦距、视角、景深和安装位置等参数的不同,导致不同摄像头下同一个物体拍出不一样的图像。这样的数据不利用后续的识别模型(如神经网络模型)的训练,所以在模型训练之前,需将摄像头标准化为一个提前合成的虚拟相机上。这样的一种统一参数的的图像输入,不仅可以使后续视觉模型训练的精度提高,还可以降低训练时间。

基于虚拟相机技术,在不影响用户操作体验的同时,可以让用户通过各个角度查看虚拟对象。例如,基于虚拟相机技术的多媒体数据(如视频),可以提高多媒体数据的画面的切换流畅度。

对于在自动驾驶的视觉感知领域的虚拟相机,虚拟相机技术暂时未得到广泛应用和发展。

在基于视觉的自动驾驶任务上,深度学习的方法可以更好的进行目标检测和识别。而车辆的摄像头拍摄的图像的质量的好坏,是深度学习的前提。因此,除了摄像头本身的畸变等内在因素,统一的摄像头的安装位置也可以提供深度学习的稳定性和可靠性。

一种示例中,摄像头在安装过程中,由于人工或机器的误差,可能会导致摄像头的实际安装位置与标准位置之间出现偏差。例如,车辆的摄像头相对于标准位置有一定的选择或者平移。这样一来,若基于出现偏差的摄像头拍摄的图像进行模型训练,则可能会降低训练得到的模型的识别结果的准确性。而为了增加准确性,可以通过人工标注的方式对图像进行校准,但在图像较多时,人工和时间成本较高。

例如,在自动驾驶视觉成像系统中,涉及到车辆的自车坐标系、相机坐标系、像素坐标系。其中,自车坐标系一般以车辆后轴中心为原点,建立右手坐标系。该右手坐标系统中,x轴向前,y轴向左,z轴向上。相机坐标系统以摄像头的光圈为原点,x轴向右,y轴向下。像素坐标系以图形左上角为原点,x轴向右,y轴向下。本申请实施例中,向前是指朝向车辆正方,向下是指朝向地面。同一物体可以在上述多个坐标系中通过不同的坐标表示。因此,摄像头的任何角度和安装位置的偏差都会导致最终的成像出现改变。

鉴于此,本申请实施例提供了一种提基于视觉方法的自动驾驶中的虚拟相机。同一车型上各摄像头的安装位置应该完全相同,但实际情况下会出现朝向角度和位置偏移的误差。本申请实施例提供的技术方案,可以将同一车型上相应位置的摄像头投影到虚拟相机位置,具有低功耗、实时性和可靠性等优点。

一种示例中,为了实现将同一车型上相应位置的摄像头投影到虚拟相机位置,本申请实施例提供了一种基于摄影变换的方法,将摄像头拍摄的图像转换为虚拟相机位置拍摄的图像。基于该方法,简单且易部署。同时还不增加计算量和时延。也无需人工标注,简化了模型训练。

图1示出一种车辆。如图1所示,该车辆可以安装有多个摄像头(图1中仅示出了6个,还可以包括更多)。例如,该多个摄像有可以安装在车辆的不同位置(具体的可以如图1所示,分别安装在车辆的前端、后端、左侧、右侧等位置)。不同位置的摄像头可以拍摄车辆不同方位的图像。

一种应用场景中,对于同一型号的车辆,各个摄像头在车辆的安装位置应用是相同的(该位置可以称为标准位置)。然后,由于人工或机器的误差,可能会导致不同车辆的摄像头的按照位置或拍摄角度会出现偏差。

在一些实施例中,车辆还可以部署有电子设备,该电子设备可以与多个摄像头通信连接。例如,可以通过控制器局域网总线(controller area network,CAN)连接。该电子设备可以用于对多个摄像头拍摄的图像进行识别,以获取车辆所处道路的信息(如周围车辆的数量、路况信息等)。

在一些实施例中,车辆还可以包括其他装置或系统,例如,可以包括自动驾驶系统,该自动驾驶系统可以基于电子设备的识别结果,控制车辆的运行状态。

图2是根据一些示例性实施例示出的一种图像识别方法的流程示意图。在一些实施例中,上述图像识别方法可以应用到如图1所示的车辆或者车辆中的电子设备。以下,本申请实施例以图像识别方法应用于车辆为例,对上述图像识别方法进行说明。

如图2所示,本申请实施例提供的图像识别方法,包括下述S201-S203。

S201、响应于车辆的启动操作,控制摄像头拍摄当前时刻车辆所处道路的道路图像。

其中,车辆可以为图1中的车辆。摄像头可以为图1所示的车辆中的任一个摄像头。

一种示例中,响应于驾驶员启动车辆的操作,可以触发摄像头拍摄车辆周围的图像。如此,车辆可以在行驶过程中,周期性的拍摄车辆所行驶的道路上的道路图像。

S202、根据摄像头的第一参数信息以及第二参数信息对道路图像进行校正,得到校正后的道路图像。

其中,第一参数信息可以是指车辆的摄像头处于校正位置时的参数信息,也可以是指车辆的摄像头处于标准位置时的参数信息。第二参数信息可以是指车辆的摄像头处于第一位置时的参数信息,第一位置可以是指摄像头在车辆的实际安装位置。例如,车辆的参数信息可以包括内参(或内参矩阵)和外参(或外参矩阵)。摄像头在校正位置的设置参数与在第一位置的设置参数存在偏差。设置参数包括摄像头的朝向角度和/或在车辆上的位置信息。

一种可能的实现方式中,车辆可以分别对处于校正位置的摄像头以及处于第一位置的摄像头进行标定,得到该摄像头在校正位置时的参数信息以及在第一位置时的参数信息。

一种应用场景中,当车辆出厂之前,响应于测试操作,车辆可以通过摄像头拍摄多帧图像。基于该一帧或多帧图像,车辆可以确定摄像头处于目标位置时的参数信息。测试操作可以是控制车辆的摄像头拍摄图像的操作。例如,可以是指测试人员启动车辆的操作。

又一种示例中,响应于将摄像头调整至校正位置,车辆可以通过摄像头拍摄多帧图像。基于该一帧或多帧图像,车辆可以确定摄像头处于校正位置时的参数信息。

一种可能的实现方式中,车辆可以根据预设的标定算法,对多帧图像进行标定,确定摄像头的旋转矩阵、平移矢量、焦距以及图像的中心像素点的坐标。

其中,标定算法可以根据需要设置,例如,可以包括张正有标定法、或基于列文伯格-马夸尔特法(levenberg-marquardt,L-M)算法优化后的张正友标定法。

一种示例中,车辆可以根据摄像头的旋转矩阵以及平移矢量,得到摄像头的外参矩阵,并根据摄像头的脚尖以及图像的中心像素点的坐标,得到摄像头的内参矩阵。

下面对基于L-M算法优化后的张正有标定法的标定方法进行说明。

1、获取张正有标定法的棋盘格,并控制该摄像头从各个角度对该棋盘格进行拍摄,得到一组图像。

2、检测每帧图像的特征点(如角点)得到图像的像素在的像素坐标系中的坐标,并基于图像的坐标系与车辆的自身坐标系之间的换算关系,计算得到图像的像素在车辆的自身坐标系中的坐标。

3、基于图像的像素在像素坐标系中的坐标以及在车辆的自身坐标系中的坐标,确定摄像头的焦距和图像的中心像素点的坐标、旋转矩阵和平移向量。

具体的,确定摄像头的焦距和中心像素点的坐标、旋转矩阵、平移向量、的方法可以参照现有技术,不予赘述。

一种示例中,摄像头的内参矩阵可以为

又一种示例中,摄像头的外参矩阵可以为

进一步的,该可以获取摄像头的径向畸变参数。径向畸变参数可以用于对图像进行进一步的校正。也即,后续在根据摄像头在不同位置的参数信息对图像进行校正之后,还可以使用径向畸变参数对校正后的图像进行进一步的校正,以使得校正的图像更加准确。

类似的,基于上述标定方法,车辆可以获取摄像头处于校正位置以及处于第一位置的参数信息。

进一步的,在得到上述参数信息之后,车辆可以根据摄像头处于校正位置以及处于第一位置的参数信息,计算得到校正系数。

一种示例中,校正系数可以为第一数值与第二数值的比值。其中,第一数值可以为摄像头处于校正位置的内参与外参的乘积。第二数值可以为摄像头处于第一位置的内参与外参的乘积。

例如,校正系数可以为KsPs/KP。其中,Ks为摄像头处于校正位置的内参矩阵,Ps为摄像头处于校正位置的外参矩阵,K为摄像头处于第一位置的内参矩阵,P为摄像头处于第一位置的外参矩阵。

进一步的,由于摄像头的旋转矩阵是固定的,因此,上述校正系统还可以简化为KsTs/KT。其中,Ts为摄像头处于校正位置的平移向量,T为摄像头处于第一位置的平移向量。

结合上述校正系数,校正后的道路图像可以为KsTs/KT*S。其中,S为S201中的道路图像或者道路图像数据。

S203、对校正后的道路图像进行识别,得到车辆行驶的道路上的目标对象的信息。

其中,道路上的目标对象的信息可以是指道路上的车辆、行人、指示牌、路标等物体的信息。

一种示例中,车辆可以将校正后的道路图像输入图像识别模型,得到车辆行驶的道路上的目标对象的信息。

其中,图像识别模型可以具备识别图像中的对象的功能。例如,该图像识别模型可以为上述神经网络模型。该图像识别模型可以根据预设算法对多个处于校正位置的摄像头拍摄的图像进行训练得到的。该预设算法可以为神经网络算法等,不予限制。

需要说明的是,本申请实施例中,处于校准位置的摄像头到目标对象的距离与处于第一位置的摄像头到目标对象的距离相同。

基于图2的实施例,本申请实施例提供的方案,在获取到车辆上的摄像头拍摄的道路图像之后,可以根据处于校正位置的摄像头的参数信息以及当前时刻车辆的摄像头的参数信息,对该道路图像进行校正,用以将图像投影到校正位置。由于车辆的摄像头的实际安装位置与标准位置之间的偏差,导致拍摄的图像不够精确。而本申请中,校正后的图像处于校正位置。由于处于校正位置的图像更容易被识别,因此,降低了图像识别的难度。

一些实施例中,如图3所示,本申请实施例提供的方法还可以包括S301。

S301、使用校正后的道路图像以及对应的识别结果对图像识别模型进行迭代训练,得到训练后的图像识别模型。

其中,道路图像的识别结果可以包括道路图像中包括的目标对象以及目标对象的信息。

一种示例,车辆可以使用预设算法以及校正后的道路图像及识别结果,重新对图像识别模型进行训练,得到训练后的图像识别模型。

基于此,由于道路图像的识别结果能够反映道路当前时刻的道路信息。因此,通过校准后的图像及对应的识别结果训练后的模型,能够更加准确的进行图像识别,提高了图像识别模型的准确度。

一些实施例中,本申请实施例提供的方法还可以包括:获取第二时刻车辆的摄像头的第三参数信息,并根据摄像头的第一参数信息以及第三参数信息对摄像头在第三时刻拍摄的图像进行校正,的校正后的道路图像。

其中,第二时刻位于第一时刻之后,第三时刻位于第二时刻之后。

一种场景中,随着车辆的行驶时长超过预设时长或者行驶路程超过预设公里,摄像头可能会受到外部的因素(如误碰、外力扭动)的影响,导致摄像头的朝向或位置再次偏移。在这种情况下,车辆可以响应于重新标定的操作,重新确定摄像头的参数信息。具体的,可以参照上述标定方法,不予赘述。

进一步的,车辆可以周期性或响应于测试人员的重标定操作,对车辆的摄像头进行重新标定,并根据重新标定后的参数信息,对图像进行校正。

基于该实施例,车辆可以重新对摄像头的参数信息进行标定,以使得摄像头的参数更加准确。

上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,图像识别装置包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法,示例性的对图像识别装置进行功能模块的划分,例如,图像识别装置可以包括对应各个功能划分的各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

图4为本申请实施例提供的一种图像识别装置的结构示意图。该图像识别装置用于执行上述图像识别方法。如图4所示,图像识别装置40包括控制单元401、校正单元402以及识别单元403。

控制单元401,用于响应于车辆的启动操作,控制摄像头拍摄当前时刻车辆所处道路的道路图像,该道路图像为待校正的图像。

校正单元402,用于根据摄像头的第一参数信息以及第二参数信息对道路图像进行校正,得到校正后的道路图像。第一参数信息为处于校正位置的摄像头的参数信息,第二参数信息为处于第一位置的摄像头的参数信息。第一位置为当前时刻摄像头在车辆上的位置。该摄像头在校正位置的设置参数与在第一位置的设置参数存在偏差,设置参数包括朝向角度和/或位置信息。

识别单元403,用于对校正后的道路图像进行识别,得到车辆行驶的道路上的目标对象的信息。

可选的,摄像头的参数信息包括内参和外参。如图4所示,该装置还包括确定单元404,用于响应于摄像头在处于车辆上处于目标位置,通过摄像头拍摄多帧图像。其中,目标位置包括校正位置或第一位置。基于该多帧图像,确定摄像头处于目标位置时的参数信息。当目标位置为校正位置时,参数信息包括摄像头处于校正位置时的标准内参和标准外参。当目标位置为第一位置时,参数信息包括摄像头处于第一位置时的实际内参和实际外参。

可选的,校正单元402,具体用于根据摄像头的标准内参与标准外参,以及实际内参与实际外参,确定摄像头的校正系数,并根据校正系数对道路图像进行校正,得到校正后的道路图像。

可选的,摄像头的校正系数为摄像头的标准内参与标准外参的乘积和摄像头的实际内参与实际外参的乘积之间的比值。

可选的,确定单元404,具体用于基于多帧图像,根据预设标定算法,确定摄像头的旋转矩阵以及平移矢量、焦距、多帧图像的中心像素点的坐标,并根据摄像头的旋转矩阵以及平移矢量,得到摄像头的外参矩阵,根据摄像头的焦距以及多帧图像的中心像素点的坐标,得到摄像头的内参矩阵,以获取摄像头的参数信息。

可选的,识别单元403,具体用于将校正后的道路图像输入图像识别模型,得到车辆行驶的道路上的目标物体的信息。图像识别模型具备识别图像中的物体的信息的功能。

图5是根据一示例性实施例示出的一种图像识别装置50的框图。如图5所示,图像识别装置50包括但不限于:处理器501和存储器502。

其中,上述的存储器502,用于存储上述处理器501的可执行指令。可以理解的是,上述处理器501被配置为执行指令,以实现上述实施例中的图像识别方法。

需要说明的是,本领域技术人员可以理解,图5中示出的图像识别装置结构并不构成对图像识别装置的限定,图像识别装置可以包括比图5所示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

处理器501是图像识别装置的控制中心,利用各种接口和线路连接整个图像识别装置的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行图像识别装置的各种功能和处理数据,从而对图像识别装置进行整体监控。处理器501可包括一个或多个处理单元。可选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。

存储器502可用于存储软件程序以及各种数据。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能模块所需的应用程序(比如确定单元、处理单元等)等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器502,上述指令可由图像识别装置50的处理器501执行以实现上述实施例中的图像识别方法。

在实际实现时,图4中的控制单元401、校正单元402、识别单元403的功能均可以由图5中的处理器501调用存储器502中存储的计算机程序实现。其具体的执行过程可参考上实施例中的图像识别方法部分的描述,这里不再赘述。

可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,该非临时性计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存储存储器(Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,本申请实施例还提供了一种包括上述图像识别装置的车辆。

在示例性实施例中,本申请实施例还提供了一种包括一条或多条指令的计算机程序产品,该一条或多条指令可以由图像识别装置的处理器501执行以完成上述实施例中的图像识别方法。

需要说明的是,上述计算机可读存储介质中的指令或计算机程序产品中的一条或多条指令被图像识别装置的处理器执行时实现上述图像识别方法实施例的各个过程,且能达到与上述图像识别方法相同的技术效果,为避免重复,这里不再赘述。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全分类部或者部分功能。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全分类部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全分类部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全分类部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 图像识别方法、图像识别装置和电子设备
  • 图像中文本的识别方法及装置、电子设备、存储介质
  • 图像处理方法、图像处理装置和电子设备
  • 采集图像数据的方法、装置、图像采集设备和电子设备
  • 基于遮挡图像生成三维人脸图像方法、装置及电子设备
  • 图像识别方法及装置、眼底图像识别方法和电子设备
  • 图像识别模型训练方法、图像识别方法、装置及电子设备
技术分类

06120116122288