掌桥专利:专业的专利平台
掌桥专利
首页

图像识别装置

文献发布时间:2023-06-19 10:32:14


图像识别装置

技术领域

本发明涉及图像识别装置。

背景技术

近年来,对驾驶辅助、自动驾驶等所需的图像识别装置的性能提升要求在不断提高。例如在针对行人的碰撞安全功能中,在汽车评估中追加对夜间行人的碰撞安全试验等,要求性能的提升。为实现这一目的,需要对行人等立体物的高识别性能。

专利文献1中提出了一种识别装置,在某一移动立体物与其他立体物相重叠的状况下,所述识别装置通过对内包立体物的规定区域内部的特征点进行跟踪来检测存在于区域内部的行人等移动立体物。

现有技术文献

专利文献

专利文献1:日本专利特开2017-142760号公报

发明内容

发明要解决的问题

但以往的装置在未能顺利检测到整个立体物的情况下存在识别性能降低这一问题。

解决问题的技术手段

本发明的第1形态的图像识别装置具备:立体物区域设定部,其针对拍摄部拍摄到的图像上设定的立体物的检测区域而根据所述立体物的检测特性信息来扩大或缩小所述立体物的检测区域,从而设定立体物区域;以及识别处理部,其对所述立体物区域设定部设定的所述立体物区域进行确定所述立体物的类别的识别处理。

本发明的第2形态的图像识别装置具备:立体物区域设定部,其针对拍摄部拍摄到的图像上设定的立体物的检测区域而根据所述立体物的第1特性信息来扩大或缩小所述立体物的检测区域,从而设定立体物区域;识别倍率设定部,其以所述立体物区域设定部求出的所述立体物区域为基准尺寸,根据所述立体物的第2特性信息来规定多个尺寸的识别区域;扫描区域设定部,其根据所述立体物的第3特性信息对所述识别倍率设定部规定的多个所述识别区域设定比所述识别区域大的多个扫描区域;以及识别处理部,其使用所述扫描区域设定部设定的所述扫描区域来进行识别处理。

发明的效果

根据本发明,可以提供一种准确地检测立体物、提高了识别性能的图像识别装置。

附图说明

图1为表示图像识别装置的整体构成的框图。

图2为表示图像识别装置的动作的流程图。

图3为表示通过检测处理在图像上设定的立体物区域的图。

图4为表示识别处理的详情的流程图。

图5为说明立体物区域设定处理的原理的图。

图6为说明识别倍率设定处理的原理的图。

图7为说明识别倍率设定处理中的归一化的图。

图8为说明扫描区域设定处理的原理的图。

图9为说明每倍率扫描识别处理的原理的图。

图10为说明最佳倍率设定处理的原理的图。

图11为说明详细识别位置决定处理的原理的图。

图12为说明详细识别处理的原理的图。

图13为表示变形例的图像识别装置的整体构成的框图。

具体实施方式

图1为表示本实施方式的图像识别装置100的整体构成的框图。图像识别装置100搭载于车辆上,具备配置在车辆前方的左右的左摄像机101和右摄像机102。摄像机101、102构成立体摄像机,例如拍摄行人、车辆、信号灯、标识、白线、车的尾灯、前照灯等立体物。图像识别装置100根据摄像机101、102拍摄到的车辆前方的图像信息来识别车外环境。继而,车辆(自身车辆)根据图像识别装置100的识别结果对制动、转向等进行控制。

图像识别装置100从图像输入接口103导入摄像机101、102拍摄到的图像。从图像输入接口103导入的图像信息经由内部总线109被送至图像处理部104。继而,在运算处理部105中加以处理,处理中途的结果和最终结果的图像信息等被存储至存储部106。

图像处理部104对从左摄像机101的摄像元件获得的第1图像与从右摄像机102的摄像元件获得的第2图像进行比较,对各图像进行摄像元件所引起的装置固有的偏差的修正、噪声插补等图像修正,并将其存储至存储部106。进一步地,计算在第1图像与第2图像之间相互对应的部位来求视差信息,将其作为与图像上的各像素相对应的距离信息存储至存储部106。图像处理部104经由内部总线109连接到运算处理部105、CAN接口107、控制处理部108。

运算处理部105使用存储部106中积存的图像信息及距离信息(视差信息)来进行立体物的识别,以掌握车辆周边的环境。立体物的识别结果、中间的处理结果的一部分被存储至存储部106。运算处理部105在对拍摄到的图像进行立体物的识别之后使用识别结果来进行车辆控制的计算。作为车辆控制的计算的结果而得到的车辆的控制方针、识别结果的一部分经由CAN接口107被传输至车载网络CAN 110,由此进行车辆的控制。

控制处理部108监视各处理部是否发生了异常动作、数据传送时是否发生了错误等,防止异常动作。图像处理部104、运算处理部105以及控制处理部108可由单个或多个计算机单元构成。

图2为表示图像识别装置100的动作的流程图。

通过图像识别装置100中配备的左摄像机101和右摄像机102来拍摄图像,对拍摄到的各图像信息203、204进行用于吸收摄像元件所具有的固有缺陷的修正等图像处理205。图像处理205的处理结果被积存至图像缓冲器206。图像缓冲器206设置在图1的存储部106中。

接着进行视差处理207。具体而言,使用修正后的2个图像来进行图像彼此的对照,由此获得通过左摄像机101、右摄像机102得到的图像的视差信息。利用左右图像的视差、根据三角测量的原理而以到立体物的距离的形式求出立体物的图像上的某一着眼点。图像处理205及视差处理207在图1的图像处理部104中进行,最终得到的图像信息以及视差信息被积存至存储部106。

继而,在接下来的检测处理208中,使用通过视差处理207得到了左右图像的各像素的视差或距离的视差信息来检测三维空间上的立体物。图3为表示通过检测处理208在图像上设定的立体物的检测区域的图。图3中,检测处理208的结果是在图像上展示通过摄像机101、102检测到的行人的检测区域301和车辆的检测区域302。这些检测区域301、302可像图3所示那样为矩形,也可为根据视差和距离获得的不定形区域。为了在后面的处理中使计算机中的处理变得容易,通常处理为矩形。在本实施方式中,下面将区域处理为矩形,主要使用行人作为立体物的一例来进行说明。

接着,在识别处理209中,对通过检测处理208在图像上设定的检测区域进行确定立体物的类别的识别处理。识别处理209得到的识别对象的立体物例如为行人、车辆、信号灯、标识、白线、车的尾灯或前照灯等,确定其类别是这些当中的哪一种。为了该识别处理209稳定地进行立体物的识别,图像上的检测区域与想要识别的对象的区域须一致。但在摄像机101、102中,由于外部环境的亮度、摄像机间的摄像性能的偏差等,有时无法使想要识别的图像上的区域完全一致。这在组合毫米波雷达等雷达与摄像机等图像传感器的情况下也是一样的。解决了该问题的识别处理209的详情于后文叙述。

接着,在车辆控制处理210中,考量立体物的识别结果和自身车辆的状态(速度、舵角等)而例如向乘员发出警告、进行自身车辆的制动或舵角调整等控制。或者,规定对识别出的立体物的规避控制,并将其结果作为自动控制信息经由CAN接口107输出。识别处理209及车辆控制处理210在图1的运算处理部105中进行。

再者,可以通过配备有CPU、存储器等的计算机来执行图2的流程图以及后文叙述的图4的流程图中展示的程序。也可通过硬逻辑电路来实现全部处理或一部分处理。进而,该程序可以预先存储在图像识别装置100的存储介质中来加以提供。或者,也可以在独立的存储介质中存储程序来加以提供,或者通过网络线路将程序记录、存储至图像识别装置100的存储介质。也能以数据信号(载波)等各种形态的计算机可读入的计算机程序产品的形式加以供给。

图4为表示识别处理209的详情的流程图。如图4所示,该流程图进行立体物区域设定处理401、识别倍率设定处理402、扫描区域设定处理403、每倍率扫描识别处理404、最佳倍率设定处理406、详细识别位置决定处理407、详细识别处理408。下面,依序对各处理进行说明。再者,这些处理中,是以立体摄像机为前提来进行说明。

[立体物区域设定处理]

在立体物区域设定处理401中,根据立体物的检测特性信息来扩大或缩小通过检测处理208得到的立体物的检测区域301而设定立体物区域501。

图5为说明立体物区域设定处理401的原理的图。图5中展示根据立体物的检测特性信息来扩大行人的检测区域301而设定立体物区域501的例子。检测特性信息例如为(1)立体物的识别性、(2)与立体物的距离、(3)立体物的大小、(4)立体物的设想尺寸、(5)外部环境的亮度、(6)前照灯的朝向、(7)立体物所存在的路面的高度、(8)传感器分辨率等。下面,对这些检测特性信息进行说明。

关于(1)立体物的识别性,例如考虑摄像机101、102中因与背景区域的组合而难以获得立体物的情况。与路面同色的行人的服装、夜间的行人的头顶部等就相当于这一情况。此外,还考虑摄像机101、102因雨滴等的影响而导致对象的一部分发生模糊、立体物区域出现缺失的情况。在这样的情况下,将检测区域扩大。此外,有时还会变为三维空间中的人与人以外的区域结合而成的立体物。其原因在于,像路边的电线杆、栅栏等立体物与人的结合那样,难以在识别前加以分离。在这样的情况下,根据图像的颜色、亮度、边缘来缩小检测区域。此外,在雷达传感器等不同种类的传感器或者摄像机101、102中水平方向的安装高度不一样的情况下,主要在上部方向上发生隐没,立体物显得较小。在具有这样的构成的处理特性的情况下,将检测区域扩大。

关于(2)与立体物的距离,若较远,则将立体物区域扩大得较大,若较近,则将立体物区域缩小得较小。该扩大率可根据包括摄像机101、102在内的传感器分辨率来决定。其原因在于,对象越往远方去,每1像素占据三维空间的尺寸便越大、越会出现误差。

关于(3)立体物的大小,若立体物较小,则扩大立体物区域,若立体物较大,则缩小立体物区域。

关于(4)立体物的设想尺寸,例如将立体物设想为行人,对于设想为行人而过小的立体物,将立体物区域扩大,对于设想为行人而过大的立体物,将立体物区域缩小。将到哪一程度为止视为对象可将(5)外部环境的亮度、(6)前照灯的朝向也考虑进去来决定。例如,若是白天的明亮环境,则缩小立体物区域,若是夜晚的昏暗环境,则扩大立体物区域。此外,根据前照灯的朝向,例如,若前照灯的朝向为近光,则由于光照到脚部,因此在高度方向上扩大立体物区域。若前照灯的朝向为远光,则由于光照到全身,因此缩小立体物区域。此外,也可根据到立体物的距离、(7)立体物所存在的位置的路面的高度来扩大或缩小立体物区域。例如,在路面的高度较低的情况下,若为远光,则光不会照到脚部,因此在下方向上扩大立体物区域。

关于(8)传感器分辨率,若传感器为摄像机101、102,则每1像素的尺寸根据距离而变化,因此通过与立体物的尺寸、对象的距离加以组合来扩大或缩小立体物区域。例如,在立体物处于附近的情况下,每1像素的三维空间的分辨率较高,因此扩大立体物区域。在立体物较远的情况下,每1像素的三维空间的分辨率较低,因此缩小立体物区域。此外,根据作为立体物区域加以获取的区域的特性的不同,将立体物区域缩小。所谓作为立体物区域加以获取的区域的特性,例如是得到了立体物区域的有视差的区域或者传感器响应区域设定得更大的情况,在这样的情况下,将立体物区域缩小。

对根据立体物的检测特性信息来设定立体物区域501的例子进行说明。例如关于行人,图像上的变化较大的手脚区域容易缺失而变小。此外,在夜间的情况下,若是黑发的人,则头与背景混杂而难以检测到。在这样的情况下,根据每1像素在三维空间上的尺寸来变更图像上的立体物区域501。例如,若是明亮的白天,则被认为是头部的区域的扩大取0cm,脚部区域的扩大取10cm,若是夜间,则头部区域的扩大取10cm,脚部区域的扩大取10cm。进一步地,若是车辆的近光所达的范围,则头部区域的扩大取10cm,脚部区域的扩大取0cm。横宽也同样地酌情加以扩大缩小。此外,也可根据时间序列下的横宽的变化量来实施修正。此外,根据后面的识别处理的内容的不同,也可缩小识别区域。例如,若是行人,则仅靠上半身来实施识别的情况等。扩大缩小的尺寸能以规定比例或者图像上的尺寸来决定,而通过以三维空间上的尺寸为基准来设定,可以将识别对象不可能有的尺寸排除掉。

此外,由于三维空间上的距离与像素的关系,该扩大缩小下的立体物区域501的尺寸有时也与检测区域301相同。

以上,对检测特性信息进行了说明,在立体物区域设定处理401中,通过将这些检测特性信息中的多种加以组合来更高精度地设定立体物区域501。例如,将距离、外部环境的亮度、灯的朝向、路面高度、传感器分辨率等加以组合,由此来设定进一步减轻了昼夜的影响的立体物区域501。此外,此处所述的像素数、尺寸为一例,并不限定于该范围。

[识别倍率设定处理]

接着,对图4所示的识别倍率设定处理402进行说明。

当将立体物区域设定处理401中设定的立体物区域501作为识别处理209的基准尺寸时,该基准尺寸未必是用于识别的最佳识别区域。因此,在识别倍率设定处理402中,使用立体物的识别特性信息来规定多个尺寸的识别区域。此时,由于最佳识别区域不明,因此根据基准尺寸来扩大或缩小识别区域而规定多个尺寸的识别区域。识别特性信息例如为(1)与立体物的距离、(2)立体物的大小、(3)立体物的极限尺寸、(4)传感器分辨率等。下面,对这些识别特性信息进行说明。

(1)与立体物的距离成为决定进行识别区域的扩大或缩小的情况下的扩大量或缩小量的指标。例如,在立体物处于远方的情况下,每1像素的立体物尺寸变大。在该情况下,由于输入至进行识别处理的后文叙述的识别器901的是图像,因此,在立体物处于远方时,扩大或缩小的像素数比处于附近时小。因此,基于基准尺寸、根据与立体物的距离来扩大或缩小识别区域而规定多个尺寸的识别区域。

(2)立体物的大小成为决定进行识别区域的扩大或缩小的情况下的扩大量或缩小量的指标。例如,在立体物较大的情况下,在图像上进行扩大或缩小时的像素数比立体物较小的情况下小。此外,在根据实际空间上的尺寸来规定多个尺寸的识别区域的情况下,在处于远方时,在图像上进行扩大或缩小时的像素数比处于附近时小。在不以子像素单位来设定识别区域的情况下,有时也与基准尺寸相同。

(3)立体物的极限尺寸是立体物为识别对象的情况下设想的极限尺寸。例如,在立体物为行人的情况下,若立体物的高度较大超过2.5米等,则在缩小方向上设定区域。反过来,若高度较小低于0.8米等,则在扩大方向上设定区域。若是它们中间,则在两个方向上设定区域。设定的区域的上限下限可根据识别对象的立体物、识别处理的限制等来决定。

关于(4)传感器分辨率,例如若传感器为摄像机101、102,则每1像素的尺寸根据距离而变化。因此,可以根据传感器分辨率来规定扩大或缩小的范围。例如,在每1像素在三维空间中的尺寸超过20cm这样的远方时,在1像素、2像素等较小的范围内规定扩大或缩小的范围。反过来,在每1像素在三维空间中的尺寸低于1cm这样的近距离下,在10像素、20像素等较大的范围内进行扩大或缩小。

再者,图像上的尺寸可利用三维空间中的立体物尺寸进行逆运算来求出。此外,关于在立体物区域设定处理401中未考虑到立体物区域501的设定中的检测特性信息,可在识别倍率设定处理402中使用检测特性信息来设定识别区域的变化。在该情况下,根据检测特性信息的哪一条件来扩大还是缩小识别区域与立体物区域设定处理401中说明过的内容相同。此外,此处所述的像素数、尺寸为一例,并不限定于该范围。

图6为说明识别倍率设定处理402的原理的图。识别倍率设定处理402将立体物区域501作为基准尺寸的识别区域来规定将其扩大或缩小得到的识别区域601、602。识别区域501为基准尺寸的识别区域,识别区域601为缩小基准尺寸得到的识别倍率小的识别区域,识别区域602为扩大基准尺寸得到的识别倍率大的识别区域。图6的例子中展示的是相对于基准尺寸进行扩大或缩小得到的2种识别区域,而若是识别处理时间有富余,则该数量可具有大量变化。此外,也可通过检测处理208和立体物区域设定处理401的设定来仅设定扩大和缩小中的某一方。根据识别特性信息来设定识别区域的扩大量或缩小量。在该情况下,与立体物区域设定处理401一样,根据图像的分辨率的不同,有时也与基准尺寸的识别区域相同。

图7为说明识别倍率设定处理402中的归一化的图。

如图7所示,规定在实施后面的识别处理的情况下将识别区域(501、601、602)归一化的区域。识别区域表示在后文叙述的识别处理中进行识别处理的范围。识别区域501为基准尺寸的识别区域,识别区域601为缩小基准尺寸得到的识别倍率小的识别区域,识别区域602为扩大基准尺寸得到的识别倍率大的识别区域。

在识别处理中,须协调输入信息的维数。基准尺寸的识别区域501不保证对象物体捕捉得干净利落,此外,装置中部署的识别处理的特性使得如何捕捉为宜存在变化。因此,预先设定进行归一化的区域。图7的例子中,识别区域501大致囊括了头和脚,相对于此,识别倍率小的识别区域601露出了头顶部和手脚,识别倍率大的识别区域602反过来出现了头顶部和脚部的余白。若将这些识别区域归一化为相同尺寸,则像图7所示那样成为归一化后的识别区域701、702、703,可以在后文叙述的识别处理中实施同样的处理。但该归一化处理在识别倍率设定处理402中不是必定实施的。也能以后文叙述的每倍率扫描识别处理404或者后文叙述的详细识别处理408的处理的一部分的形式加以实施。

[扫描区域设定处理]

接着,对图4的扫描区域设定处理403进行说明。扫描区域设定处理403中,根据立体物的配置特性信息对各识别区域设定比识别区域大的扫描区域。扫描区域被设定为图像上的区域,在识别处理中,利用识别区域在设定好的扫描区域内进行扫描。即,识别区域表示在后文叙述的识别处理中进行识别处理的范围,扫描区域是使该识别区域在扫描区域的范围内移动的范围。由此,一边使识别区域在扫描区域的范围内移动一边进行识别处理。决定扫描区域的大小的配置特性信息例如为(1)立体物的远近位置、(2)立体物所存在的路面高度等。下面,对这些配置特性信息进行说明。

(1)立体物的远近位置成为进行扫描区域的设定的情况下的指标。例如,在立体物处于近处的情况下,图像上的扫描区域规定得较大。此外,在立体物处于远方的情况下,扫描区域规定得较小。其原因在于,在处于近处的情况下,传感器分辨率高、扫描1像素的情况下的三维空间上的扫描量为几mm左右,相对于此,在远方时超过10cm。扫描区域也取决于因立体物检测而产生的检测的偏移量等特性。例如,在使用取立体物的横向位置中心时最大程度发挥性能的识别处理的情况下,可根据立体物的横向位置中心与实际的识别对象的横向位置中心的偏移量和分散而设定为识别对象的横向位置中心处于扫描区域内。

(2)立体物所存在的路面高度成为进行扫描区域的设定的情况下的指标。例如,在路面上升、立体物(行人等)处于比自身车辆高的位置的情况下,头侧的隐没增加,高度显得比实际小。此外,在立体物(行人等)处于较低位置的情况下,考虑因视场角等而拍不到脚部、被保险杠遮挡等情况。根据这样的状态来扩大或缩小扫描区域。

此外,关于在立体物区域设定处理401、识别倍率设定处理402中未考虑到立体物区域、识别区域的设定中的检测特性信息、识别特性信息,可使用它们在扫描区域设定处理403中规定扫描区域。在该情况下,根据哪一条件来扩大还是缩小扫描区域与立体物区域设定处理401、识别倍率设定处理402中相同。此外,此处所述的像素数、尺寸为一例,并不限定于该范围。

图8为说明扫描区域设定处理403的原理的图。扫描区域设定处理403中,对各识别区域501、601、602分别规定扫描区域801、802、803。扫描区域801、802、803是与识别区域501、601、602相同或者比它们大的区域。其中,利用识别区域501、601、602在扫描区域801、802、803内进行扫描,因此扫描量不一定多。关于扫描区域801、802、803,根据配置特性信息来规定图像上的区域。此时,根据图像的分辨率的不同,识别区域与扫描区域的图像上有时也相同。扫描区域是针对各识别区域单独加以规定,但若是处理时间有富余,则也可采用最大的1个扫描区域。此外,在处理时间没有富余的情况下,可对各识别区域运用1个较小的扫描区域。

[每倍率扫描识别处理]

接着,对图4所示的每倍率扫描识别处理404进行说明。在每倍率扫描识别处理404中,利用识别区域501、601、602在与扫描区域801、802、803相对应的图像及视差区域(距离区域)内进行扫描,针对各尺寸的每一扫描位置实施识别处理,判别对象的扫描位置是否为立体物。

此处,若识别处理的性能足够,则可像图4的虚线405所示那样使用每倍率扫描识别处理404的结果来实施车辆控制处理210。每倍率扫描识别处理404有时会因倍率、扫描位置等而具有多个结果,但会通过选择识别结果最优的1个等处理来实施精简。

图9为说明每倍率扫描识别处理404的原理的图。一边利用识别区域501、601、602在各扫描区域801、802、803内进行扫描,一边求进行识别处理的识别器901识别出的结果的响应位置902。图9中以×表示响应位置902。响应位置902的数量越多,表示识别处理越良好。关于利用识别器901在扫描区域801、802、803内进行识别得到的结果的一例,像扫描区域801'、802'、803'的响应位置902所示那样,扫描区域801'最多。

识别器901可使用机械学习,也可使用启发式的阈值判定。若该判定结果充分,则可像图4的虚线405所示那样使用该结果来结束识别。在该情况下,例如采用识别处理最良好的结果。

在每倍率扫描识别处理404中,在因识别处理的计算成本的削减等而导致识别处理的性能不足的情况下,可使用每倍率扫描识别处理404的结果来实施详细处理。在本实施方式中,对设置有最佳倍率设定处理406、详细识别位置决定处理407、详细识别处理408作为详细处理的情况进行说明。

[最佳倍率设定处理]

图4所示的最佳倍率设定处理406中,从识别倍率设定处理402中制作出的多个尺寸的识别区域当中选择最适于详细识别处理的识别区域。关于选择方法,例如使用通过扫描得到的识别处理结果中的被判定为识别对象的个数及其可靠度、被判定为非识别对象的个数及其可靠度、识别结果的分布等在多个尺寸的识别区域之间对响应数的量、可靠度进行比较,使用最佳识别区域。若处理时间没有足够的富余,则最佳倍率设定处理406也可省略。

图10为说明最佳倍率设定处理406的原理的图。从多个倍率的识别结果当中选择响应最佳的最佳倍率。如前文所述,最佳倍率是使用识别处理的扫描区域内的响应数及其可靠度来选择。图10的例子中选择的是响应数最多的扫描区域801',该扫描区域801'对应于基准尺寸的扫描区域801,基准尺寸的扫描区域801对应于基准尺寸的识别区域501。

[详细识别位置决定处理]

图4所示的详细识别位置决定处理407中,针对最佳倍率设定处理406中得到的最佳倍率来决定实施详细识别的代表位置。关于详细识别,例如选择每倍率扫描识别处理404中得到的识别处理的可靠度最大的位置。或者,也可使用均值漂移法(Mean Shift法)之类的聚类方法来决定位置。在不进行最佳倍率设定处理406的情况下,可对各倍率实施详细识别位置决定处理407。

图11为说明详细识别位置决定处理407的原理的图。根据从每倍率扫描识别处理404得到的一个以上的响应位置来决定进行详细识别处理408的代表位置111。在存在多个反应点的情况下,例如使用Mean Shift法之类的聚类技术。以决定好的代表位置111为中心的区域成为详细识别区域。

[详细识别处理]

图4所示的详细识别处理408中,对详细识别位置决定处理407中决定的代表位置111实施详细识别,算出对象的类别、可靠度。或者,使用根据每倍率扫描识别处理404得到的响应位置选择的最佳尺寸的识别区域来实施详细识别,算出对象的类别、可靠度。详细识别处理408使用识别器120,所述识别器120具有与每倍率扫描识别处理404中使用过的识别处理同等性能以上的类别分类性能。

图12为说明详细识别处理408的原理的图。使用识别器120对通过详细识别位置决定处理407求出的代表位置111进行详细的识别处理,决定立体物的类别。所谓立体物的类别,例如为行人、车辆、信号灯、标识、白线、车的尾灯或前照灯等。

每倍率扫描识别处理404和详细识别处理408中使用的识别处理例如可列举如下技术。使用模板匹配的技术,所述模板匹配是对预先准备的具有识别对象样子的模板与识别区域进行比较。利用识别器的技术,所述识别器是将亮度图像、HOG、Haar-Like等特征量与支持向量机、Ada-Boost、DeepLearning等机械学习方法组合而成。此外,也可通过人为决定边缘形状等的阈值判定来进行识别。每倍率扫描识别处理404和详细识别处理408中包含用于实施这些处理所需的尺寸变更、平滑化、边缘提取、归一化、孤立点去除、梯度提取、颜色变换、直方图制作等图像处理。

(变形例)

在本实施方式中,以使用立体摄像机的图像识别装置100来进行了说明。但也可使用不用立体摄像机的图像识别装置100'来实现。

图13为表示图像识别装置100'中的处理动作的图。对与图2所示的图像识别装置100相同的部位标注同一符号并省略其说明。

图像识别装置100'具备光学摄像机1301和雷达传感器1302。由此来检测立体物。利用光学摄像机1301来拍摄图像,对拍摄到的图像信息进行用于吸收摄像元件所具有的固有缺陷的修正等图像处理205。图像处理205的处理结果积存至图像缓冲器206。此外,利用雷达传感器1302来获得到立体物的距离。检测处理1303中,根据到立体物的距离来检测三维空间上的立体物。识别处理209中,对通过检测处理1303设定的检测区域进行确定立体物的类别的识别处理。

以从雷达传感器1302输出的到立体物的距离为输入的检测处理1303须进行考虑了用于距离测量的雷达传感器1302的传感器特性的检测处理,而决定了检测区域之后的处理可以与图像识别装置100中说明过的基于立体摄像机的构成相同。此外,图像识别装置100'在图像处理205中不需要多个图像。

根据以上说明过的实施方式,获得以下作用效果。

(1)图像识别装置100、100'具备:立体物区域设定处理401,即,针对摄像机101、102拍摄到的图像上设定的立体物的检测区域301而根据立体物的检测特性信息来扩大或缩小立体物的检测区域301,从而设定立体物区域501;以及识别处理209,即,对通过立体物区域设定处理401设定的立体物区域501进行确定立体物的类别的识别处理。检测特性信息例如为立体物的识别性、与立体物的距离、立体物的大小、立体物的设想尺寸、外部环境的亮度、前照灯的朝向、立体物所存在的路面的高度、拍摄部的传感器分辨率中的至少一种。由此,可以提供一种准确地检测立体物、提高了识别性能的图像识别装置。

(2)图像识别装置100、100'具备:立体物区域设定处理401,即,针对摄像机101、102拍摄到的图像上设定的立体物的检测区域301而根据立体物的第1特性信息来扩大或缩小立体物的检测区域301,从而设定立体物区域501;识别倍率设定处理402,即,以通过立体物区域设定处理401求出的立体物区域501为基准尺寸,根据立体物的第2特性信息来规定多个尺寸的识别区域601、602;扫描区域设定处理403,即,根据立体物的第3特性信息对通过识别倍率设定处理402规定的多个识别区域601、602设定比识别区域601、602大的多个扫描区域802、803;以及识别处理209,即,使用通过扫描区域设定处理403设定的扫描区域802、803来进行识别处理。第1特性信息至第3特性信息例如为立体物的识别性、与立体物的距离、立体物的大小、立体物的设想尺寸、外部环境的亮度、前照灯的朝向、立体物所存在的路面的高度、拍摄部的传感器分辨率、立体物的极限尺寸、立体物的远近位置、立体物所存在的路面高度中的至少一种。由此,可以提供一种准确地检测立体物、提高了识别性能的图像识别装置。

本发明不限定于上述实施方式,只要无损本发明的特征,则在本发明的技术思想的范围内思索的其他形态也包含在本发明的范围内。此外,也可采用上述实施方式与变形例组合而成的构成。

符号说明

100、100'…图像识别装置,101、102…摄像机,103…图像输入接口,104…图像处理部,105…运算处理部,106…存储部,107…CAN接口,108…控制处理部,109…内部总线,110…车载网络CAN。

相关技术
  • 信息检索系统、信息检索方法、信息检索装置、信息检索程序、图像识别装置、图像识别方法及图像识别程序、以及销售系统
  • 图像识别装置、图像识别方法以及图像识别单元
技术分类

06120112579643