掌桥专利:专业的专利平台
掌桥专利
首页

计数装置、学习器制造装置、计数方法和学习器制造方法

文献发布时间:2023-06-19 09:29:07


计数装置、学习器制造装置、计数方法和学习器制造方法

技术领域

本发明涉及对计数对象的个数进行计数的计数装置等。

背景技术

以往,存在一种方法,其在计数对象物的集合体的拍摄图像中,通过进行使用了形状模型的匹配处理,对计数对象进行计数,其中,使用拍摄引导自动地生成所述形状模型(例如,参照专利文献1)。

现有技术文献

专利文献

专利文献1:日本特开2018-022395号公报

发明内容

本发明所要解决的技术问题

然而,在以往的计数方法中,由于进行使用了形状模型的匹配处理,因此存在以下问题:即,在未适当地生成形状模型的情况下,计数的精度有可能变低。另外,可以认为,在多个计数对象物的形状中存在微小的差异的情况下,计数的精度变低。

本发明是为了解决上述技术问题而做出的,其目的在于提供一种能够提高计数的精度的计数装置等。

用于解决技术问题的技术方案

为了达成上述目的,基于本发明的计数装置具备:存储部,存储使用多个训练用输入图像与训练用输出图像的组进行了学习的学习器,所述训练用输入图像是拍摄了相同形状的多个计数对象物的图像,所述训练用输出图像包含配置在多个计数对象物各自的位置的教师图形;拍摄图像取得部,取得多个计数对象物的拍摄图像;输出图像取得部,通过将拍摄图像应用于学习器,取得包含在拍摄图像中的各计数对象物被转换为计数对象图形的输出图像;计数部,使用包含在输出图像中的多个计数对象图形对计数对象物的个数进行计数;以及输出部,输出通过计数部计数得到的计数对象物的个数。

根据这种结构,能够通过使用学习器将包含在拍摄图像中的计数对象物转换为计数对象图形,取得计数对象物的个数。另外,由于将计数对象物转换为计数对象图形时的精度高,因此能够更高精度地对计数对象物进行计数。例如,通过使用利用在形状上存在微小的差异的计数对象物的训练用输入图像进行了学习的学习器,对于在形状上存在微小的差异的计数对象物,也能够适当地进行计数。

另外,在基于本发明的计数装置中,也可以进一步具备置信度取得部,所述置信度取得部针对包含在输出图像中的每个计数对象图形,取得计数对象图形的属性越接近教师图形的属性则越为高值的置信度,计数部对置信度超过阈值的计数对象图形的个数进行计数。

根据这种结构,能够通过使用从计数对象图形取得的置信度,进行精度更高的计数。另外,例如,通过适当地调整阈值,即使在多个计数对象物的形状上存在微小的差异,也能够进行适当的计数。

另外,在基于本发明的计数装置中也可以是,计数对象物存在与大小相关的多个种类,学习器针对计数对象物的每个大小使用不同的属性的教师图形进行了学习,计数部通过使用包含在输出图像中的计数对象图形的属性以及置信度,对未学习的大小的计数对象物,也计数个数。

根据这种结构,也能够对未进行学习的计数对象物的个数进行计数。

另外,基于本发明的学习器制造装置具备:训练图像受理部,受理多个训练用输入图像与训练用输出图像的组,所述训练用输入图像是拍摄了相同形状的多个计数对象物的图像,所述训练用输出图像包含配置在多个计数对象物各自的位置的教师图形;学习器制造部,通过学习训练用输入图像与训练用输出图像的多个组来制造学习器;以及学习器输出部,输出学习器。

根据这种结构,能够制造用于计数对象物的计数的学习器。

另外,在基于本发明的学习器制造装置中也可以是,计数对象物存在多个种类,训练图像受理部针对计数对象物的每个种类受理包含不同的属性的教师图形的训练用输出图像。

根据这种结构,能够通过使用制造出的学习器,进行与多个种类的计数对象相关的计数。

另外,在基于本发明的学习器制造装置中,训练图像受理部也可以受理计数对象物的每个种类的训练用输入图像与训练用输出图像的组。

根据这种结构,与使用包含多个种类的计数对象物的一个训练用输入图像进行学习的情况相比,能够通过更少的训练用输入图像与训练用输出图像的组生成学习器。

另外,在基于本发明的学习器制造装置中,计数对象物的种类也可以是与计数对象物的大小相关的种类。

根据这种结构,能够通过使用制造出的学习器,按照多个大小单位进行计数对象物的计数。

另外,在基于本发明的学习器制造装置中,教师图形也可以是无方向性的图形。

根据这种结构,由于可以不考虑教师图形的方向,因此训练用输出图像的准备变得简单,并且能够使用较少的训练用图像高效地进行学习。

另外,在基于本发明的学习器制造装置中,教师图形也可以是根据训练用输入图像中的计数对象物的方向设定了方向的、具有方向性的图形。

根据这种结构,例如,对于由于重力等的影响而方向对齐的计数对象物,能够实现更高精度的计数。例如,在计数装置中,通过不对除了被认为计数对象图形对齐的方向以外的角度的计数对象图形进行计数,即使在计数对象物的背景等中包含与计数对象图形类似的形状的物体的情况下,在这种形状的物体的角度与计数对象图形的角度不同时,能够防止错误地对该物体进行计数,能够实现更高精度的计数。

另外,基于本发明的学习器是训练用输入图像与训练用输出图像的多个组的学习结果的学习器,所述训练用输入图像是拍摄了相同形状的多个计数对象物的图像,所述训练用输出图像包含配置在多个计数对象物各自的位置的教师图形,当应用多个计数对象物的拍摄图像时,能够取得包含在拍摄图像中的各计数对象物被转换为计数对象图形的输出图像。

另外,基于本发明的计数方法具备:拍摄图像取得步骤,取得多个计数对象物的拍摄图像;输出图像取得步骤,通过将拍摄图像应用于使用多个训练用输入图像与训练用输出图像的组进行了学习的学习器,取得包含在拍摄图像中的各计数对象物被转换为计数对象图形的输出图像,所述训练用输入图像是拍摄了相同形状的多个计数对象物的图像,所述训练用输出图像包含配置在多个计数对象物各自的位置的教师图形;计数步骤,使用包含在输出图像中的多个计数对象图形对计数对象物的个数进行计数;以及输出步骤,输出在计数步骤中计数得到的计数对象物的个数。

另外,基于本发明的学习器制造方法具备:训练图像受理步骤,受理多个训练用输入图像与训练用输出图像的组,所述训练用输入图像是拍摄了相同形状的多个计数对象物的图像,所述训练用输出图像包含配置在多个计数对象物各自的位置的教师图形;学习器制造步骤,通过学习训练用输入图像与训练用输出图像的多个组来制造学习器;以及学习器输出步骤,输出学习器。

发明的效果

根据基于本发明的计数装置等,能够实现精度高的计数。

附图说明

图1是示出基于本发明的实施方式的计数装置的结构的框图。

图2是示出基于该实施方式的学习器制造装置的结构的框图。

图3是示出基于该实施方式的计数装置的动作的流程图。

图4是示出基于该实施方式的学习器制造装置的动作的流程图。

图5A是示出该实施方式中的训练用输入图像的一例的图。

图5B是示出该实施方式中的训练用输出图像的一例的图。

图5C是示出该实施方式中的参考用的合成图像的一例的图。

图6A是示出该实施方式中的训练用输入图像的一例的图。

图6B是示出该实施方式中的训练用输出图像的一例的图。

图6C是示出该实施方式中的参考用的合成图像的一例的图。

图7A是示出该实施方式中的训练用输入图像的一例的图。

图7B是示出该实施方式中的训练用输出图像的一例的图。

图7C是示出该实施方式中的参考用的合成图像的一例的图。

图8A是示出该实施方式中的训练用输入图像的一例的图。

图8B是示出该实施方式中的训练用输入图像的一例的图。

图8C是示出该实施方式中的训练用输出图像的一例的图。

图8D是示出该实施方式中的训练用输出图像的一例的图。

图8E是示出该实施方式中的参考用的合成图像的一例的图。

图8F是示出该实施方式中的参考用的合成图像的一例的图。

图9是示出该实施方式中的计数对象图形与置信度的对应的一例的图。

图10A是示出该实施方式中的拍摄图像的一例的图。

图10B是示出该实施方式中的输出图像的一例的图。

图10C是示出该实施方式中的参考用的合成图像的一例的图。

图11A是示出该实施方式中的拍摄图像的一例的图。

图11B是示出该实施方式中的输出图像的一例的图。

图11C是示出该实施方式中的参考用的合成图像的一例的图。

图12A是示出该实施方式中的拍摄图像的一例的图。

图12B是示出该实施方式中的输出图像的一例的图。

图12C是示出该实施方式中的参考用的合成图像的一例的图。

图13A是示出该实施方式中的拍摄图像的一例的图。

图13B是示出该实施方式中的输出图像的一例的图。

图13C是示出该实施方式中的参考用的合成图像的一例的图。

图14A是示出该实施方式中的、构成神经网络的各层的一例的图。

图14B是用于说明该实施方式中的神经网络中的放大层的图。

图15A是示出该实施方式中的训练用输入图像的一例的图。

图15B是示出该实施方式中的训练用输出图像的一例的图。

图15C是示出该实施方式中的参考用的合成图像的一例的图。

图15D是示出该实施方式中的拍摄图像的一例的图。

图15E是示出该实施方式中的输出图像的一例的图。

图15F是示出该实施方式中的参考用的合成图像的一例的图。

图16A是用于说明该实施方式中的机器学习的其他的一例的图。

图16B是用于说明该实施方式中的机器学习的其他的一例的图。

图17是示出该实施方式中的计算机系统的外观的一例的示意图。

图18是示出该实施方式中的计算机系统的结构的一例的图。

具体实施方式

以下,使用实施方式,对基于本发明的计数装置以及学习器制造装置进行说明。此外,在以下的实施方式中,赋予相同附图标记的构成要素以及步骤是相同或者相当的,省略再次说明。基于本实施方式的计数装置通过使用学习器,将包含在拍摄图像中的计数对象物转换为图形,来对计数对象物的个数进行计数,其中所述学习器使用训练用输入图像与训练用输出图像进行了学习。另外,基于本实施方式的学习器制造装置能够通过使用训练用输入图像与训练用输出图像的多个组进行学习,来制造用于计数对象物的计数的学习器。

图1是示出基于本实施方式的计数装置1的结构的框图。基于本实施方式的计数装置1具备存储部11、拍摄图像取得部12、输出图像取得部13、置信度取得部14、计数部15以及输出部16。计数装置1例如既可以是个人计算机,也可以是智能手机或平板电脑终端、PDA(Personal Digital Assistant;个人数字助理)等等的可携带的信息处理终端,也可以是进行计数处理的专用的装置,还可以是服务器等。

在存储部11中存储学习器。该学习器使用多个作为拍摄了相同形状的多个计数对象物的图像的训练用输入图像、与包含配置在该多个计数对象物各自的位置的教师图形的训练用输出图像的组进行了学习。也可以将训练用输入图像与训练用输出图像的组称为训练图像。学习器例如既可以是神经网络(NN:Neural Network)的学习结果,也可以是支持向量机(SVM:Support Vector Machine)或支持向量回归(SVR:Support Vector Regression)的学习结果,或者,还可以是其他的机器学习的学习结果。

神经网络例如既可以是卷积神经网络(CNN:Convolutional Neural Network),也可以是其他的神经网络(例如,由全连接层构成的神经网络等)。卷积神经网络是指,具有一个以上的卷积层的神经网络。另外,在神经网络具有至少一个中间层(隐藏层)的情况下,也可以认为该神经网络的学习是深层学习(深度学习,Deep Learning)。另外,在机器学习中使用神经网络的情况下,也可以使用适当地选择该神经网络的层数、各层中的节点数、各层的种类(例如,卷积层、全连接层等)等的神经网络。此外,输入层与输出层的节点数通常根据包含在训练图像中的训练用输入图像与训练用输出图像来确定。在本实施方式中,主要对学习器为CNN的学习结果的情况进行说明,对于其他的情况将在后面进行说明。

此外,在存储部11中存储有学习器例如既可以是指存储有学习器本身(例如,相对于输入输出值的函数和学习结果的模型等),也可以是指存储有用于构成学习器所需的参数等的信息。这是因为,在后者的情况下,也能够使用该参数等的信息构成学习器,因此能够认为实质上在存储部11中存储有学习器。在本实施方式中,主要对在存储部11中存储有学习器本身的情况进行说明。

在存储部11中存储学习器的过程不限。例如,既可以通过存储介质在存储部11中存储学习器,也可以在存储部11中存储通过通信线路等发送来的学习器。存储部11中的存储既可以是RAM等中的临时的存储,或者,也可以是长期的存储。存储部11可以通过规定的存储介质(例如,半导体存储器和磁盘、光盘等)来实现。

在此,对学习器的生成进行说明。图2是示出基于本实施方式的学习器制造装置2的结构的框图。基于本实施方式的学习器制造装置2具备训练图像受理部21、学习器制造部22以及学习器输出部23。学习器制造装置2通常是进行学习的信息处理装置,但是例如,既可以是可携带的信息处理终端等的通用的装置,也可以是进行学习的专用的装置,还可以是服务器等。

训练图像受理部21受理多个作为拍摄了相同形状的多个计数对象物的图像的训练用输入图像、与包含配置在该多个计数对象物各自的位置的教师图形的训练用输出图像的组。

如上述那样,多个计数对象物优选为相同形状。此外,相同形状既可以是严格相同的形状,也可以是实质上相同的形状。另外,多个计数对象物也可以是相同大小。相同大小既可以是严格相同的大小,也可以是实质上相同的大小。例如,在计数对象物为农作物等的自然产物的情况下,严格而言,也有可能各计数对象物的形状和大小存在微小的差异,但是只要能够判断为实质上是相同形状、相同大小,则也可以认为是相同形状、相同大小。具体而言,可以认为大豆、米、植物的种子等是相同形状以及大小。另外,例如,在计数对象物为螺钉、螺栓等的人工产物的情况下,虽然相比于自然产物而言,可以认为差异程度较小,但是严格而言,也有可能各计数对象物的形状和大小存在微小的差异。在这种情况下,也只要能够判断为实质上是相同形状、相同大小,则也可以认为是相同形状、相同大小。此外,通常根据与像素数相应的大小判断是否为相同大小。另外,优选为在包含在训练用输入图像中的多个计数对象物中包含想要计数的计数对象物的形状和大小的变化。例如,如上述那样,在计数对象物为自然产物的情况下,有时也会在形状和大小中包含微小的差异,但是优选为包含这种微小的差异的各种计数对象物包含在训练用输入图像中。通过这样,能够实现不受这种差异的影响的计数。此外,在本实施方式中,主要对多个计数对象物为相同形状以及相同大小的情况进行说明。

教师图形通常优选为比计数对象物小的图形。这是因为,通过这样,在计数对象物的一部分重叠的情况下,也只要不是整个计数对象物重叠,则如将在后面进行说明的那样,能够将计数对象物转换为计数对象图形。另外,教师图形优选配置在与计数对象物的中心相应的位置,但是也可以不是如此。不过,在将教师图形配置在与计数对象物的中心相应的位置以外的位置的情况下,也优选在与计数对象物的预先确定的位置相应的位置配置教师图形。

教师图形的形状不限,但例如,教师图形可以是无方向性的图形。无方向性的图形是在图像上即便旋转也不变形的图形,例如,可以是圆环形状、圆盘形状等。通常优选使用无方向性的教师图形。另一方面,教师图形例如也可以是具有方向性的图形。具有方向性的教师图形例如可以是三角形状、四边形状、多边形状、线形状等。在教师图形为具有方向性的图形的情况下,包含在训练用输出图像中的各教师图形可以根据训练用输入图像中的各计数对象物的方向设定方向。在计数对象物例如为如牙签和铅笔等那样,在拍摄图像中为线状的情况下,例如,可以使用具有方向性的线形状的教师图形。在这种情况下,例如,教师图形可以配置成,使线状的计数对象物的长度方向成为教师图形的长度方向。另外,在计数对象物为具有方向性的形状,并且,在固定的方向上对齐的情况下,例如,也可以使用具有方向性的教师图形。在这种情况下,例如,优选为根据计数对象物的形状,确定教师图形的方向(角度)。例如,在计数对象物为正方形状的情况下,可以以正方形状的教师图形的各边的方向与计数对象物的各边对齐的方式在与计数对象物的中心相应的位置配置教师图形。此外,如上述那样,由于计数对象物在固定的方向上对齐,因此在可以认为每个计数对象物的角度的差异充分小的情况下,也可以分别配置沿着该对齐的方向的相同角度的教师图形。

在对多个种类的计数对象物进行计数的情况下,训练图像受理部21也可以针对计数对象物的每个种类受理包含不同的属性的教师图形的训练用输出图像。计数对象物的种类例如既可以是与形状相关的种类,也可以是与大小相关的种类,也可以是与颜色相关的种类,也可以是其他的种类,或者,还可以是它们中任意两个以上的组合。作为形状以及大小不同的计数对象物,例如有大豆与米等。另外,作为大小不同的计数对象物,例如有大小不同的螺母等。另外,作为颜色不同的计数对象物,例如有通常的大豆与青豆等。教师图形的属性例如既可以是颜色(例如,色相、彩度、明度中的至少一个以上等),也可以是形状,还可以是其他的属性。例如,作为计数对象物,在有大豆与米的情况下,也可以在大豆中使用红色的教师图形,在米中使用蓝色的教师图形。

在对多个种类的计数对象物进行计数的情况下,训练图像受理部21也可以受理计数对象物的每个种类的训练用输入图像与训练用输出图像的组。即,也可以在一个组的训练图像中包含仅包含一个种类的计数对象物的训练用输入图像、以及仅包含与该计数对象物相对应的属性的教师图形的训练用输出图像。例如,在作为计数对象物有大豆与米的情况下,训练图像受理部21也可以受理与大豆相关的训练用输入图像与训练用输出图像的多个组、以及与米相关的训练用输入图像与训练用输出信息的多个组。这样,使用计数对象物的每个种类的训练用输入图像与训练用输出图像的组进行学习,与使用混杂多个种类的计数对象物的训练用输入图像与训练用输出信息的组进行学习相比,能够通过更少的训练图像来生成适当的学习器。

另外,为了计算将在后面进行说明的置信度,教师图形优选为具有预先确定的形状、和颜色等的属性。例如,教师图形的形状与大小也可以是确定的。另外,例如,也可以预先确定教师图形的颜色属性(例如,明度、色相、和彩度)。在这种情况下,例如,构成教师图形的各像素的颜色属性可以全部相同。

图5~图8是示出训练图像的一例的图。图5A是作为大豆的计数对象物的训练用输入图像,图5B是包含分别配置在图5A的训练用输入图像的大豆的位置的、无方向性的教师图形(即,圆板形状的教师图形)的训练用输出图像。图5C是合成图5A的训练用输入图像、与图5B的训练用输出图像的参考图。如在图5C中示出那样,各教师图形配置在计数对象物的中心位置。

图6A是拍摄剖面为正方形状的作为堆积的多个干面条的计数对象物的端部的训练用输入图像,图6B是包括分别配置在图6A的训练用输入图像的干面条的位置的、具有方向性的教师图形的训练用输出图像。此外,在图6B中,由于使用了具有方向性的教师图形(即,正方形状的教师图形),因此各教师图形在作为计数对象物的棍状的干面条的端部,在各边与计数对象物的正方形状对齐的方向上配置。图6C是合成图6A的训练用输入图像、与图6B的训练用输出图像的参考图。如在图6C中示出那样,各教师图形以方向与计数对象物对齐的方式配置在计数对象物的中心位置。

图7A是作为牙签的计数对象物的训练用输入图像,图7B是包含分别配置在图7A的训练用输入图像的牙签的位置的、具有方向性的教师图形(即,线状的教师图形)的训练用输出图像。图7C是合成图7A的训练用输入图像、与图7B的训练用输出图像的参考图。如在图7C中示出那样,各教师图形以与计数对象物成为相同方向的方式配置在计数对象物的中心位置。

图8A、图8B是作为螺母的计数对象物的训练用输入图像。此外,假设图8A的训练用输入图像的螺母的尺寸比图8B的训练用输入图像的螺母的尺寸大。在此,将图8A的螺母称为“大螺母”,将图8B的螺母称为“小螺母”。图8C是包含分别配置在图8A的训练用输入图像的大螺母的位置的、无方向性的教师图形的训练用输出图像,图8D是包含分别配置在图8B的训练用输入图像的小螺母的位置的、无方向性的教师图形的训练用输出图像。包含在图8C的训练用输出图像中的教师图形是白色的图形,包含在图8D的训练用输出图像中的教师图形是黑色的图形。这样,针对尺寸不同的每个计数对象,使用不同属性(即,不同的明度)的教师图形。图8E是合成图8A的训练用输入图像与图8C的训练用输出图像的参考图,图8F是合成图8B的训练用输入图像、与图8D的训练用输出图像的参考图。如在图8E、图8F中示出那样,教师图形配置在作为计数对象物的螺母的孔的位置。这样,教师图形配置在计数对象物的位置可以是指,如在图5C等中示出那样,教师图形配置在与计数对象物重叠的位置,也可以是指,如在图8E等中示出那样,教师图形配置在不与计数对象物重叠的位置。

此外,在图5~图8中,分别示出了一组的训练用输入图像以及训练用输出图像,但是通常,多个组的训练用输入图像以及训练用输出图像用于学习。例如,也可以是,在计数对象物为大豆的情况下,使用在图5中示出的训练图像等,在计数对象物为干面条的情况下,使用在图6中示出的训练图像等,在计数对象物为牙签的情况下,使用在图7中示出的训练图像等,在计数对象物为螺母的情况下,使用在图8中示出的训练图像等。此外,在训练图像中,优选为计数对象物不重叠。优选用于学习的训练用输入图像以及训练用输出图像的组的数较多,但是为了准备更多的组的训练用输入图像以及训练用输出图像,花费更多的成本。因此,优选为使用能够进行适当的计数的程度的训练用输入图像以及训练用输出图像的组进行学习。例如,在图5的大豆的情况下,可以使用300~500粒左右的大豆,准备50组左右的训练用输入图像以及训练用输出图像的组进行学习。

训练图像受理部21例如既可以接收通过有线或者无线的通信线路发送来的信息,也可以受理从规定的存储介质(例如,光盘和磁盘、半导体存储器等)读取的信息。此外,训练图像受理部21既可以包括用于进行受理的设备(例如,调制解调器和网卡等),或者也可以不包括。另外,训练图像受理部21既可以通过硬件来实现,或者也可以通过驱动规定的设备的驱动器等的软件来实现。

学习器制造部22通过学习训练用输入图像与训练用输出图像的多个组来制造学习器。该学习器是作为拍摄计数对象物的图像的训练用输入图像、与包含配置在包含在该训练用输入图像中的计数对象物各自的位置的多个教师图形的训练用输出图像的多个组的机器学习的结果。因此,例如,在多个计数对象物的拍摄图像应用于该学习器时,能够获得包含在该拍摄图像中的各计数对象物被转换为计数对象图形的输出图形。此外,计数对象图形是与教师图形相对应的图形,理想地,具有与教师图形相同的属性(例如,形状和大小、颜色等)。此外,在学习时,也可以分割训练用输入图像与训练用输出图像使用。例如,可以是,作为输入,使用分割训练用输入图像得到的规定的部位的分割图像,另外,作为与该输入相对应的输出,使用分割训练用输出图像得到的、与输入的规定的部位相对应的部位的分割图像。此外,在分割图像时,既可以在分割图像中有重复(重叠),或者也可以没有。对该学习的细节将在后面进行说明。

学习器输出部23输出通过学习器制造部22制造的学习器。在图1中示出的计数装置1的存储部11中存储通过学习器输出部23输出的学习器。在此,该输出例如既可以是经由通信线路向规定的设备的发送,也可以是向存储介质的积存,还可以是向其他的构成要素的转交。此外,学习器输出部23既可以包括进行输出的设备(例如,通信设备等),或者也可以不包括。另外,学习器输出部23既可以通过硬件来实现,或者,也可以通过驱动这些设备的驱动器等的软件来实现。

接下来,对基于学习器制造部22的机器学习进行说明。该机器学习是有教师的学习,既可以是神经网络的学习,也可以是支持向量机或支持向量回归的学习,或者,还可以是其他的机器学习。在此,主要对机器学习为神经网络的学习的情况进行说明。

作为学习器的神经网络是进行图像处理的神经网络,对输入图像的各像素值进行规定的运算,输出输出图像的各像素值。如图14A所示,神经网络例如也可以在输入层的后级具有多个卷积层(conv1~conv4)。图14A示出从输入层到输出层(放大层4)的各层的结构。通过机器学习,计算多个卷积层的各滤波器的参数值。此外,该神经网络既可以具有一个以上的池化层,或者,也可以不具有。另外,神经网络所具有的连续的卷积层的层数不限。例如,神经网络既可以具有连续的三层以上的卷积层,也可以具有连续的五层以上的卷积层。

另外,也可以在神经网络的各层中,适当地进行填充(padding)。该填充例如既可以是零填充,也可以是外插图像的最外周的像素值的填充,还可以是作为在图像的各边换行(wrap)的像素值的填充。在图14A中,示出了进行填充的例子,但是也可以不进行填充。

另外,各层中的步幅(stride)不限,例如,卷积层中的步幅优选为1或者2等的小值,在神经网络具有池化层的情况下,该池化层的步幅优选为2以上。

此外,在2以上的步幅的卷积层中,图像缩小。因此,在使用这种卷积层的情况下,在神经网络的后级侧存在放大图像的放大层。在放大层中,例如是,W×W×(C·r

作为一般性记载,在通过放大层,W×W×r

如在图14A中示出那样,在神经网络中,既可以在放大层的后级存在卷积层,或者,也可以不是。另外,在神经网络中,优选为通过一个以上的放大层,使输出层的图像与输入层的图像为相同大小。此外,在图14A中,示出了输入层的图像为3通道的彩色图像,输出层的图像为1通道的灰度图像的情况,但是也可以不是。输入层的图像也可以是1通道的灰度图像,另外,输出层的图像也可以是3通道的彩色图像。

此外,放大层也可以是上述以外的层。作为输出比输入图像大的图像的神经网络的层,例如,也可以使用非池化层(unpooling layer)和反卷积层(deconvolution layer)等。另外,在图14A中,示出了在前级具有多个卷积层,在后级具有一个以上的放大层的情况,但是神经网络也可以是除此之外的结构。

另外,在各层中,既可以使用偏置,或者,也可以不使用。也可以针对每个层单独地确定是否使用偏置。该偏置例如既可以是针对每个层的偏置,或者,也可以是针对每个滤波器的偏置。前者的情况下,在各层使用一个偏置,后者的情况下,在各层使用一个以上(与滤波器相同数量)的偏置。在卷积层使用偏置的情况下,各像素值乘以滤波器的参数并相加的结果加上偏置的值被输入到激活函数。

作为本实施方式中的学习器的神经网络的学习结果例如也可以使用在分割(segmentation)中使用的神经网络的学习结果。即,也可以是,作为神经网络的构造,使用分割的构造,作为训练图像,使用在本实施方式中说明的图像进行学习。

神经网络中的各设定也可以如下所示。激活函数例如既可以是ReLU(归一化线性函数),也可以是S形函数,还可以是其他的激活函数。另外,在学习中,例如,既可以使用误差逆传播法,也可以使用Mini-Batch法。另外,损失函数(误差函数)也可以是均方误差。另外,不特别限定epoch数(参数的更新次数),但优选为选择不构成过拟合的epoch数。此外,作为机器学习中的学习方法,能够使用公知的方法,省略其详细的说明。

返回图1,拍摄图像取得部12取得相同形状的多个计数对象物的拍摄图像。该拍摄图像通常是计数对象物的集合体的图像。此外,在包含在训练用输入图像中的多个计数对象物的大小相同的情况下,优选为在拍摄图像中,多个计数对象物的大小与包含在训练用输入图像中的多个计数对象物的大小相同。另外,在包含在训练用输入图像中的多个计数对象物的大小不相同的情况下,优选为在拍摄图像中,多个计数对象物的大小在包含在训练用输入图像中的多个计数对象物的大小的范围内。为了使拍摄图像中的多个计数对象物的大小与训练用输入图像中的多个计数对象物的大小相同,优选以使光学系统的设定(例如,焦距等)和像素数、到计数对象物的距离等与拍摄训练用输入图像时相同的方式进行拍摄图像的拍摄。例如,在训练用输入图像为彩色图像的情况下,拍摄图像也优选为彩色图像,在训练用输入图像为灰度图像的情况下,拍摄图像也优选为灰度图像。拍摄图像通常是静态图像,但是也可以认为包含在动态图像中的帧为拍摄图像。此外,严格而言,包含在拍摄图像和训练用输入图像中的是计数对象物的图像,但是为了简便,记载为计数对象物包含在拍摄图像和训练用输入图像中。

拍摄图像取得部12例如既可以通过摄像机等的光学设备来取得拍摄图像,也可以受理通过摄像机等的光学设备来取得的拍摄图像。在拍摄图像取得部12受理拍摄图像的情况下,该受理既可以是通过通信线路发送来的拍摄图像的接收,也可以是从规定的存储介质(例如,光盘和磁盘、半导体存储器等)读取拍摄图像。拍摄图像取得部12也可以将取得的拍摄图像积存在未图示的存储介质中。

输出图像取得部13通过将由拍摄图像取得部12取得的拍摄图像应用于存储在存储部11中的学习器,取得包含在该拍摄图像中的各计数对象物被转换为计数对象图形的输出图像。具体而言,输出图像取得部13能够通过将由拍摄图像取得部12取得的拍摄图像的各像素值输入到学习器,来取得作为该学习器的输出的输出图像。在存储部11中存储有作为学习器的函数和模型等的情况下,输出图像取得部13也可以对于拍摄图像,通过进行使用该函数和模型等的运算来取得输出图像。计数对象图形是与计数对象物相对应的图形,理想地是与教师图形相同形状和颜色,但是实际上,有时也会是偏离教师图形的形状和颜色。

在拍摄图像中包含多个种类的计数对象物,在进行针对其每个种类的计数的情况下,应用拍摄图像的学习器优选为,针对计数对象物的每个种类使用不同的属性的教师图形进行了学习。例如,在该计数对象物的种类为计数对象物的大小的情况下,优选为拍摄图像应用于针对计数对象物的每个大小使用不同的属性的教师图形进行了学习的学习器。

此外,输出图像取得部13也可以在将拍摄图像输入到学习器时,对拍摄图像进行分割,输入经分割的各分割图像。在使用训练用输入图像和训练用输出图像的分割图像进行了学习的情况下,也可以在从拍摄图像获得输出图像时,使用拍摄图像的分割图像。在输入分割图像的情况下,来自学习器的输出也成为分割图像,因此输出图像取得部13也可以通过结合输出的分割图像,来取得一个输出图像。在图像的分割和结合中,既可以在分割图像中存在重复(重叠),也可以不存在。此外,分割图像并应用于学习器的方法是公知的,因此省略其详细的说明。

图10~图13是示出合成拍摄图像、输出图像、以及两个图像的参考用合成图像的一例的图。图10A是作为大豆的计数对象物的拍摄图像,图10B是将图10A的拍摄图像应用于利用与大豆相关的训练图像进行了学习的学习器而获得的输出图像。图10C是合成图10A的拍摄图像、与图10B的输出图像的参考图。如在图10C中示出那样,可以知道,计数对象图形位于包含在拍摄图像中的各计数对象物的中心。另外,即使计数对象物的一部分重叠,也能够获得包含适当的计数对象图形的输出。

图11A是作为堆积的多个棍状的干面条的计数对象物的端部的拍摄图像,图11B是将图11A的拍摄图像应用于利用与干面条相关的训练图像进行了学习的学习器而获得的输出图像。图11C是合成图11A的拍摄图像、与图11B的输出图像的参考图。如在图11C中示出那样,可以知道,计数对象图形位于包含在拍摄图像中的各计数对象物的中心。另外,在这种情况下,进行基于具有方向性的教师图形的学习,因此包含在输出图像中的各计数对象图形也以方向与计数对象物对齐的方式配置。

图12A是作为牙签的计数对象物的拍摄图像,图12B是将图12A的拍摄图像应用于利用与牙签相关的训练图像进行了学习的学习器而获得的输出图像。图12C是合成图12A的拍摄图像、与图12B的输出图像的参考图。如在图12C中示出那样,可以知道,计数对象图形位于包含在拍摄图像中的各计数对象物的中心。另外,在这种情况下,进行基于具有方向性的教师图形的学习,因此包含在输出图像中的各计数对象图形也位于与作为计数对象物的牙签相同的方向上。

图13A是作为大螺母的计数对象物31、作为小螺母的计数对象物32、以及作为大螺母与小螺母之间的尺寸的螺母(以下,作为“中螺母”。)的计数对象物33的拍摄图像,图13B是将图13A的拍摄图像应用于利用与螺母相关的训练图像进行了学习的学习器而获得的输出图像。在图13B的输出图像中包括:与大螺母相对应的计数对象图形41、与小螺母相对应的计数对象图形42、以及与中螺母相对应的计数对象图形43。在此,计数对象图形41的属性与大螺母相对应,计数对象图形42的属性与小螺母相对应,但是计数对象图形43的属性视为在计数对象图形41的属性、与计数对象图形42的属性的中间附近。图13C是合成图13A的拍摄图像、与图13B的输出图像的参考图。如在图13C中示出那样,计数对象图形41位于包含在拍摄图像中的各计数对象物31的中心,计数对象图形42位于各计数对象物32的中心,计数对象图形43位于各计数对象物33的中心。

置信度取得部14针对包含在输出图像中的每个计数对象图形,取得该计数对象图形的属性越接近教师图形的属性则越为高值、该计数对象图形的属性越远离教师图形的属性则越为低值的置信度。如上述那样,该属性既可以是颜色或形状,也可以是其他的属性(例如,大小、角度等)。该置信度是表示与从计数对象物到计数对象图形的转换相关的置信程度的值。在进行理想的转换的情况下,计数对象图形与教师图形相同。例如,在图10~图13中,示出了进行理想的转换的情况。然而,实际上,计数对象物有时也会被转换为与教师图形不同的计数对象图形,因此根据计数对象图形与教师图形的差异,取得计数对象图形的置信度。因此,也可以认为置信度越高,越是进行从计数对象物到计数对象图形的理想的转换。

此外,为了取得置信度,需要确定包含在输出图像中的计数对象图形。该计数对象图形的确定例如既可以是使用通过计数部15来进行的结果,或者,也可以由置信度取得部14与基于计数部15的确定独立地进行。

另外,作为结果,只要能够取得置信度,取得的值例如也可以是非置信度(例如,置信度的倒数等)。这是因为,在这种情况下,使用非置信度,作为结果,也能够得知置信度。

在此,利用几个例子,对置信度的取得方法进行说明。例如既可以(1)使用形状取得置信度,也可以(2)使用大小取得置信度,也可以(3)使用颜色属性取得置信度,还可以(4)使用角度取得置信度。

(1)使用形状取得置信度

在这种情况下,假设预先确定了教师图形的形状。然后,取得计数对象图形的形状越是不同于教师图形的形状则越为低值、越是接近教师图形的形状则越为高值的置信度。例如,如在图9中示出那样,假设教师图形为圆盘形状,计数对象图形1~4为与圆盘形状稍微不同的形状。此外,假设计数对象图形1的形状接近教师图形,从计数对象图形2越往计数对象图形4,形状越不同于教师图形。那么,例如,可以对于计数对象图形1取得置信度95%,对于计数对象图形2~4分别取得置信度85%、75%、65%。在这种情况下,也可以取得计数对象图形的形状偏离教师图形的形状的程度,该偏离的程度被转换为置信度。偏离的程度例如可以是计数对象图形的轮廓形状偏离教师图形的轮廓形状的程度。更加具体而言可以是,置信度取得部14在使作为置信度的取得对象的计数对象图形与教师图形以最拟合的方式重叠之后,分别取得从构成计数对象图形的轮廓的各轮廓点到教师图形的轮廓的距离,并通过相加取得的每个轮廓点的距离来取得偏离的程度。该距离也可以是从计数对象图形的轮廓点到教师图形的轮廓的最近的距离。可以通过将表示这样取得的偏离的程度的值代入到减少函数来取得置信度。

(2)使用大小取得置信度

在这种情况下,假设预先确定了教师图形的大小。而且,取得计数对象图形的大小越是不同于教师图形的大小则越为低值、越接近教师图形的大小则越为高值的置信度。

大小例如也可以是面积。在这种情况下,置信度取得部14可以取得作为置信度的取得对象的计数对象图形的面积,并且取得所取得的面积与预先保持的教师图形的面积之差的绝对值。取得的绝对值为表示作为置信度的取得对象的计数对象图形与教师图形的偏离的程度的值,因此与上述(1)同样地,通过将表示该偏离的程度的值代入到减少函数来取得置信度。

另外,在教师图形为圆形状或圆盘形状的情况下,大小例如也可以是半径或直径。这种情况下,置信度取得部14也可以通过取得作为置信度的取得对象的计数对象图形的半径或直径,并且取得所取得的半径或直径与预先保持的教师图形的半径或直径之差的绝对值,来取得表示作为置信度的取得对象的计数对象图形与教师图形的偏离的程度的值。之后,也可以与上述同样地取得置信度。

(3)使用颜色属性取得置信度

在这种情况下,假设在教师图形中预先确定了颜色属性。在该教师图形中的颜色属性例如也可以是固定的。具体而言,教师图形的明度和色相等可以被设定为固定的。

在这种情况下,置信度取得部14例如可以取得构成作为置信度的取得对象的计数对象图形的各像素的颜色属性,并且取得所取得的颜色属性与教师图形的颜色属性之差的绝对值,对所取得的每个像素的颜色属性之差的绝对值进行相加。该相加结果为表示作为置信度的取得对象的计数对象图形与教师图形的颜色属性的偏离的程度的值,因此与上述(1)同样地,也可以通过将表示该偏离的程度的值代入到减少函数来取得置信度。作为该颜色属性,例如,也可以使用明度、色相、彩度中的任意一个以上。

另外,置信度取得部14例如也可以取得构成作为置信度的取得对象的计数对象图形的各像素的颜色属性,并且取得所取得的颜色属性的平均与教师图形的颜色属性之差的绝对值。在这种情况下,该取得的值也可以是表示作为置信度的取得对象的计数对象图形与教师图形的颜色属性的偏离的程度的值。

另外,置信度取得部14例如也可以取得构成作为置信度的取得对象的计数对象图形的各像素的颜色属性,计算取得的颜色属性的方差。理想地(即,在教师图形中),方差为0,因此方差越大,计数对象图形的颜色属性越偏离教师图形的颜色属性。因此,该方差的值为表示作为置信度的取得对象的计数对象图形与教师图形的颜色属性的偏离的程度的值,因此与上述(1)同样地,也可以通过将表示该偏离的程度的值代入到减少函数来取得置信度。

(4)使用角度取得置信度

在这种情况下,计数对象物为具有方向性的形状,并且,在固定的方向上对齐,而且,假设具有方向性的教师图形沿着计数对象物的方向配置。例如,在图11中,是这样构成的。在这种情况下,置信度取得部14例如可以取得作为置信度的取得对象的计数对象图形的角度,并且取得所取得的角度与教师图形的角度之差的绝对值。该绝对值是表示作为置信度的取得对象的计数对象图形与教师图形的角度的偏离的程度的值,因此也可以与上述(1)同样地,通过将表示该偏离的程度的值代入到减少函数,来取得置信度。例如在教师图形或计数对象图形为正方形或矩形的情况下,教师图形或计数对象图形的角度可以是指边的角度。

此外,对于在根据作为置信度的取得对象的计数对象图形与教师图形的偏离的程度取得置信度时使用减少函数的情况进行了说明,但是也可以不是。例如,也可以使用将作为置信度的取得对象的计数对象图形与教师图形的偏离的程度、与置信度相对应起来的表格等的信息取得置信度。另外,也可以适当地进行归一化,以使置信度取如0~100%的范围、或者0~1的范围等、预先确定的范围的值。

计数部15使用包含在输出图像中的多个计数对象图形与置信度对计数对象物的个数进行计数。具体而言,计数部15可以对置信度超过阈值的计数对象图形的个数进行计数。该阈值通常是预先确定的。此外,例如也可以是,能够通过由操作者比较拍摄图像与计数结果,来适当地调整该阈值。计数部15也可以通过使用预先保存的教师图形的形状,在输出图像中进行图案匹配等来确定计数对象图形,对于该确定的计数对象图形,进行使用置信度的计数。可以认为置信度低的计数对象图形是非计数对象物被转换的结果。因此,对于置信度低的计数对象图形,如上述那样,通过不进行计数,能够不进行错误的计数,结果是,能够提高计数的精度。

另外,在对多个种类的计数对象物进行计数的情况下,计数部15也可以在输出图像中,针对具有指定的属性的每个计数对象图形,进行计数。例如,在训练图像中,大豆使用红色的教师图形,且米使用蓝色的教师图形的情况下,计数部15可以在输出图像中,分别进行与红色的计数对象图形相关的计数、和与蓝色的计数对象图形相关的计数。更加具体而言,计数部15可以在输出图像中,确定具有与计数对象物的某个种类相对应的属性的计数对象图形,使用该确定的计数对象图形与该计数对象图形的置信度,进行与该种类的计数对象物相关的计数。能够通过针对计数对象物的每个种类反复进行这种处理,对所有种类的计数对象物进行计数。在这种情况下,置信度取得部14例如也可以对于具有与计数对象物的某个种类相对应的属性的计数对象图形,取得与该种类相关的置信度,对于具有与其他种类相对应的属性的计数对象图形,取得与该种类相关的置信度。

另外,在对多个种类的计数对象物进行计数的情况下,置信度取得部14也可以针对计数对象物的每个种类,对于包含在输出图像中的全部的计数对象图形取得置信度。例如,在输出图像中包含与大豆相对应的计数对象图形、和与米相对应的计数对象图形的情况下,置信度取得部14可以对于包含在输出图像中的全部的计数对象图形,进行与大豆相关的置信度的取得、和与米相关的置信度的取得。在该置信度的取得中,优选为大豆的教师图形的属性与米的教师图形的属性的差异被反映到置信度。例如,在大豆的教师图形为红色,米的教师图形为蓝色的情况下,优选使用计数对象图形的色相来取得置信度。而且,计数部15也可以使用包含在输出图像中的每个计数对象图形的大豆的置信度进行大豆的计数,使用包含在输出图像中的每个计数对象图形的米的置信度进行米的计数。这样,还能够进行针对计数对象物的每个种类的计数。

另外,计数部15也可以通过使用包含在输出图像中的计数对象图形的属性以及置信度,对未学习的大小的计数对象物,也计数个数。在这种情况下,对于未学习的大小的计数对象物也优选为大小对齐。例如,如在图13A中示出那样,在通过将包含进行了学习的大螺母和小螺母以及未进行学习的中螺母的拍摄图像应用于学习器来取得的输出图像中,如在图13B中示出那样,还包含与中螺母相对应的计数对象图形43。在这种情况下,通常,就计数对象图形43而言,无论是与大螺母相关的置信度,还是与小螺母相关的置信度,都变低,既不计数为大螺母,也不计数为小螺母。另一方面,在已知在拍摄图像包含中螺母的情况下,也可以将大螺母的教师图形的属性与小螺母的教师图形的属性的中间的属性设定为中螺母的虚拟的教师图形的属性。然后,置信度取得部14可以使用该中螺母的虚拟的教师图形的属性,对于包含在输出图像中的各计数对象图形计算与中螺母相关的置信度。之后,可以与大螺母和小螺母同样地,计数部15也对中螺母,进行使用中螺母的置信度的计数。例如,在图13B中示出的输出图像中,假设3个计数对象图形43的与中螺母相关的置信度超过了阈值,则计数部15取得“3个”,作为中螺母的个数。另外,计数部15也可以通过使用置信度,将既未被判断为大螺母也未被判断为小螺母的计数对象图形的个数计数为中螺母的个数。另外,计数部15也可以将大螺母的置信度在规定的范围内、小螺母的置信度在规定的范围内的计数对象图形的个数计数为中螺母的个数。

输出部16输出通过计数部15计数得到的计数对象物的个数。此外,在针对计数对象物的每个种类进行计数的情况下,优选为针对该每个种类输出个数。在此,该输出例如既可以是向显示设备(例如,液晶显示器和有机EL显示器等)的显示,也可以是经由通信线路向规定的设备的发送,也可以是基于打印机的印刷,也可以是基于扬声器的声音输出,也可以是向存储介质的积存,还可以是向其他的构成要素的转交。此外,输出部16既可以包括进行输出的设备(例如,显示设备和打印机等),或者也可以不包括。另外,输出部16既可以通过硬件来实现,或者,也可以通过驱动这些设备的驱动器等的软件来实现。

接下来,使用图3的流程图对计数装置1的动作进行说明。

(步骤S101)拍摄图像取得部12判断是否取得拍摄图像。然后,在取得拍摄图像的情况下,进入步骤S102,在不是的情况下,反复步骤S101的处理,直至判断为取得拍摄图像。此外,例如,拍摄图像取得部12也可以根据来自操作者的指示判断为取得拍摄图像。

(步骤S102)拍摄图像取得部12取得计数对象物的拍摄图像。取得的拍摄图像也可以存储在未图示的存储介质中。

(步骤S103)输出图像取得部13通过将在步骤S102中取得的拍摄图像应用于在存储部11中存储的学习器,来取得与拍摄图像相对应的输出图像。取得的输出图像也可以存储在未图示的存储介质中。

(步骤S104)计数部15在输出图像中,确定计数对象图形。该计数对象图形的确定例如也可以是输出图像中的、包含计数对象图形的位置或区域的确定。

(步骤S105)置信度取得部14对于在步骤S104中确定的各计数对象图形,取得置信度。此外,在对多个种类的计数对象物进行计数的情况下,置信度取得部14例如也可以对于所确定的全部的计数对象图形,针对与计数对象物的种类相应的每个教师图形,取得置信度。即,在存在2种计数对象物的情况下,也可以对于一个计数对象图形,取得2个置信度。

(步骤S106)计数部15使用在输出图像中确定的计数对象图形、与通过置信度取得部14取得的置信度,取得计数对象图形的个数、即计数对象物的个数。此外,在多个种类的计数对象物包含于拍摄图像中的情况下,计数部15也可以针对每个种类取得计数对象物的个数。

(步骤S107)输出部16输出通过计数部15取得的计数对象物的个数。然后,返回步骤S101。

此外,在图3的流程图中,对置信度取得部14针对由计数部15确定的每个计数对象图形取得置信度的情况进行了说明,但是也可以不是。置信度取得部14也可以进行输出图像中的计数对象图形的确定。另外,图3的流程图中的处理的顺序是一例,只要能够获得同样的结果,也可以变更各步骤的顺序。此外,在图3的流程图中,处理通过电源断开或处理结束的中断而结束。

接下来,使用图4的流程图对学习器制造装置2的动作进行说明。

(步骤S201)训练图像受理部21判断是否受理了训练用输入图像与训练用输出图像的多个组。之后,在受理了训练用输入图像与训练用输出图像的多个组的情况下,进入步骤S202,在不是的情况下,反复步骤S201的处理,直至受理它们。

(步骤S202)学习器制造部22使用在步骤S201中受理的训练图像,通过机器学习来制造学习器。

(步骤S203)学习器输出部23输出在步骤S202中制造的学习器。这样,制造学习器的一系列的处理结束。

此外,图4的流程图中的处理的顺序是一例,只要能够获得同样的结果,也可以变更各步骤的顺序。

接下来,使用具体例,对基于本实施方式的系统的动作进行说明。在该具体例中,对计数对象物为大豆的情况进行说明。

首先,用户准备在图5A中示出的、拍摄了作为计数对象物的大豆的训练用输入图像。另外,用户通过使用图像处理软件等,如在图5C中示出那样,通过手工作业在包含在该训练用输入图像中的大豆的中心附近配置作为教师图形的黑色的圆盘形状。然后,生成在图5B中示出的、具有配置在计数对象物的位置的多个教师图形的训练用输出图像。通过反复进行这种作业,用户准备多个组的训练图像。然后,将该准备的多个组的训练图像输入到学习器制造装置2,开始学习。那么,通过训练图像受理部21,受理多个组的训练图像(步骤S201),通过学习器制造部22,进行使用该多个组的训练图像的学习器的制造(步骤S202)。这样制造的学习器通过学习器输出部23积存在未图示的存储介质中(步骤S203)。

之后,假设积存在存储介质中的学习器积存在计数装置1的存储部11。然后,计数装置1的操作者操作计数装置1,以通过与拍摄训练用输入图像的情况同样的光学系统来取得多个大豆的拍摄图像。那么,根据该操作,拍摄图像取得部12进行拍摄,取得在图10A中示出的拍摄图像(步骤S101、S102)。输出图像取得部13从拍摄图像取得部12接收拍摄图像,将该拍摄图像的各像素作为存储在存储部11中的学习器的输入层,通过进行各层的计算,取得输出层的信息、即输出图像(步骤S103)。假设该输出图像为图10B中示出的图像。那么,计数部15在该输出图像中,将作为预先保持的教师图形的黑圈作为图案使用,确定与此类似的计数对象图形(步骤S104)。此外,也可以通过确定与图案的类似度大于等于阈值的图形来进行该确定。

接下来,置信度取得部14对于通过计数部15确定的各计数对象图形,取得置信度(步骤S105)。其结果是,针对每个计数对象图形,取得置信度。计数部15对取得的置信度大于预先确定的阈值的计数对象图形的个数进行计数。例如,在通过置信度取得部14取得N个置信度的情况下,能够通过对该N个置信度中、超过阈值的置信度的个数(M个)进行计数,来取得置信度超过阈值的计数对象图形的个数(M个)。此外,N、M是大于等于0的整数,N≧M。假设在图10B的情况下,存在80个超过阈值的置信度的计数对象图形,由计数部15取得该80个(步骤S106)。那么,输出部16输出计数对象物的个数“80个”(步骤S107)。这样,容易地、并且准确地对包含在拍摄图像中的计数对象物的个数进行计数。

图15A~图15F是示出基于本实施方式的、在基于学习器制造装置2的学习中使用的训练图像、以及在基于计数装置1的计数中使用的拍摄图像和输出图像的实际图像。图15A是拍摄作为计数对象物的小豆(红色的豆)的训练用输入图像。图15B是包含作为配置在图15A的计数对象物的位置的白色的圆盘形状的教师图形的训练用输出图像。图15C是合成图15A的训练用输入图像、与图15B的训练用输出图像的参考图。准备这种训练用输入图像与训练用输出图像的多个组,使学习器制造装置2进行机器学习,从而制造用于对小豆进行计数的学习器。

接下来,将该学习器积存在计数装置1的存储部11。另外,当取得在图15D中示出的小豆的拍摄图像,并输入到计数装置1时,获得在图15E中示出的输出图像。图15F是合成图15D的拍摄图像、与图15E的输出图像的参考图。理想的是,包含在输出图像中的计数对象图形与图15B的教师图形同样地,应为白色的正圆,但是实际上,如在图15E中示出那样,一部分的计数对象图形不是正圆的形状。使用该形状等取得置信度,使用该置信度,对计数对象图形的个数、即计数对象物的个数进行计数。这样,能够对计数对象物的个数进行计数。

如以上那样,根据基于本实施方式的计数装置1,通过使用学习器,将包含在拍摄图像中的计数对象物转换为计数对象图形,并对该转换后的计数对象图形的个数进行计数,能够高精度地对计数对象物的个数进行计数。这是因为通过使用适当的学习结果,如在图15E等中示出那样,能够高精度地将计数对象物转换为计数对象图形。另外,通过使用针对每个计数对象图形取得的置信度,进行计数对象图形的计数,能够更加提高精度。另外,在针对计数对象物的每个种类使用不同的教师图形进行了学习的情况下,通过使用计数对象图形的属性,也能够针对每个种类,对计数对象物的个数进行计数。另外,在该种类为与大小相关的种类的情况下,也能够对未进行学习的计数对象物进行计数。

另外,根据基于本实施方式的学习器制造装置2,通过使用多个训练图像,能够生成用于计数对象物的计数的学习器。另外,在针对计数对象物的每个种类使用具有不同的属性的教师图形的情况下,在训练用输入图像与训练用输出图像的组中包含仅一种计数对象物、和与其相对应的仅一种教师图形,由此能够通过更少的训练图像的学习来制造学习器。

此外,在本实施方式中,对在计数对象图形的计数中还使用置信度的情况进行了说明,但是也可以不是。在这种情况下,计数部15也可以不使用置信度而对包含在输出图像中的计数对象图形的全部个数、即计数对象物的个数进行计数。在这种情况下,计数装置1可以不具备置信度取得部14。

另外,在上述实施方式中,主要对学习器是神经网络的学习结果的情况进行了说明,但是如上述那样,学习器例如也可以是SVM、SVR等的学习结果。这样,对学习器为神经网络以外的学习结果的情况进行简单说明。在此,对学习器为SVM的学习结果的情况进行说明。在这种情况下,例如,在使用训练用输入图像和训练用输出图像的学习中,如在图16A、图16B中示出那样,也可以进行使用规定的区域81、82的学习。在该学习中,也可以将输入作为在图16A中示出的区域81中包含的各像素的值,将在图16B中示出的区域82的代表点(×标记)的像素值作为输出。例如,学习器制造部22也可以在代表点的像素为黑色的情况下将输出作为“1”,在白色的情况下将输出作为“0”(或者,“-1”)进行学习。此外,假设训练用输入图像中的区域81的位置相当于训练用输出图像中的区域82的位置。

区域82的代表点例如既可以是中心点,也可以是代表其他的区域82的点。在图16B中,代表点设为中心点。此外,在进行SVM的学习的情况下,通常,输出为2值,因此,图16B的训练用输出图像也可以是2值的图像。

另外,学习器制造部22一边1像素1像素地错开区域81、82的位置,一边进行学习。因此,能够使用1组的训练用输入图像与训练用输出图像,进行多个学习。另外,假设使用训练用输入图像与训练用输出图像的多个组进行该学习。此外,区域81、82例如也可以设定为一个计数对象物包含在区域81、82中的程度的大小。

在将拍摄图像应用于学习器时,针对与区域81同样的每个区域进行应用。例如,在拍摄图像的某个位置配置规定的区域,将该规定的区域的各像素输入到学习器时,输出1或者0(或者-1)。输出图像取得部13根据该输出,将输出图像中的、与该规定的区域相应的区域中的代表点的像素设定为黑色或者白色。能够通过一边1像素1像素地错开拍摄图像中的规定的区域的位置一边进行这种处理,来得到包含计数对象图形的输出图像。之后的处理与使用作为神经网络的学习结果的学习器的情况同样。

这样,在进行SVM的学习的情况下,例如,也可以进行将训练用输入图像中的、某个像素(代表点的像素)的周围的N1×N2的区域的像素值作为输入,将相当于该代表点的像素的、训练用输出图像的像素值作为输出的学习。而且,也可以通过一边1像素1像素地错开N1×N2的区域一边向学习器输入拍摄图像中的N1×N2的区域的像素值,取得表示白色或者黑色的输出,并根据输出将与输出图像中的、N1×N2的区域的代表点相应的像素值设定为白色或者黑色,来取得输出图像。N1、N2通常为3以上的整数。

通常的SVM仅处理2值的教师图形,因此处理多值的教师图形的情况下,可以进行使用SVR、和多值分类的SVM的学习。

另外,在上述实施方式中,在训练用输入图像以及拍摄图像中,主要对以使相同种类的计数对象物为相同大小的方式进行拍摄的情况进行了说明,但是也可以不是这样。通过使用以使相同种类的计数对象物为各种大小的方式拍摄的训练用输入图像进行学习,即使不使训练用输入图像与拍摄图像的拍摄条件相同,也能够对计数对象物进行计数。不过,在进行了这种学习的情况下,无法按照计数对象物的大小单位进行计数。

另外,在上述实施方式中,对各种计数对象物进行了说明,但是计数对象物不局限于这些,理所当然地,也可以是其他的计数对象物。计数对象物的一例如下所述。计数对象物例如既可以是制造对象物,也可以是生产对象物,也可以是捕获对象物,也可以是搬送对象物,或者,还可以是其他的计数对象物。

作为制造对象物,例如能够列举制品、或者食品等。制品没有特别限定,但是例如可以是螺钉、螺栓、棍、家电产品、文具(例如,夹子、橡皮筋等)、牙签、或者汽车部件等。食品没有特别限定,但是例如可以是点心、香肠、面包、面条、罐头、瓶、或者被包装的食品等。

作为生产对象物,例如,能够列举农产品、或者畜产品等。农产品没有特别限定,但是例如可以是豆、米、蔬菜、水果、或者种子等。畜产品没有特别限定,但是可以是羊、山羊、牛、鸡、鸡蛋、或者奶酪等。

作为捕获对象物,例如,能够列举水产品、或者野生的鸟兽等。水产品没有特别限定,但是例如可以是鱼、虾、蟹、或者贝等。野生的鸟兽没有特别限定,但是例如可以是狩猎对象的鸟、或者狩猎对象的哺乳类等。

搬送对象物没有特别限定,但是例如可以是纸板箱等的箱、或者容器。

其他的计数对象物没有特别限定,但是例如可以是人、汽车、细胞、细菌、病毒、微生物、微泡、纳米气泡、粉体、硬币、鸟、或者昆虫等。在计数对象物例如为细胞、细菌、病毒、微生物、微泡、纳米气泡、或者粉体等的情况下,拍摄图像例如也可以是使用显微镜拍摄的显微镜图像。显微镜没有特别限定,但是例如可以是光学显微镜、电子显微镜、或者X射线显微镜等。

另外,计数装置1、学习器制造装置2既可以是单独的装置,也可以是服务器/客户端系统中的服务器装置。后者的情况下,输出部和取得部、受理部也可以通过通信线路输出信息,或者取得信息,或者受理信息。

另外,在上述实施方式中,各处理或者各功能既可以通过由单个装置或者单个系统进行集中处理来实现,或者,也可以通过由多个装置或者多个系统进行分散处理来实现。

另外,在上述实施方式中,在各构成要素之间进行的信息的交换,例如,在进行该信息的交换的2个构成要素在物理上不同的情况下,可以通过基于一者的构成要素的信息的输出、与基于另一者的构成要素的信息的受理来进行,或者,在进行该信息的交换的2个构成要素在物理上相同的情况下,可以通过从与一者的构成要素相对应的处理的阶段转移到与另一者的构成要素相对应的处理的阶段来进行。

另外,在上述实施方式中,与由各构成要素执行的处理相关的信息,例如由各构成要素受理、或者取得、或者选择、或者生成、或者发送、或者接收的信息、和各构成要素在处理中使用的阈值和数学式、地址等的信息等,即使不在上述说明中明记,也可以临时、或者长期保存在未图示的存储介质中。另外,也可以由各构成要素、或者未图示的积存部进行向该未图示的存储介质的信息的积存。另外,也可以由各构成要素、或者未图示的读取部进行从该未图示的存储介质的信息的读取。

另外,在上述实施方式中,在可以由用户来变更在各构成要素等中使用的信息,例如各构成要素在处理中使用的阈值和地址、各种的设定值等的信息的情况下,即使不在上述说明中明记,用户也能够适当地变更这些信息,或者,也可以不是。在用户能够变更这些信息的情况下,该变更例如可以通过受理来自用户的变更指示的未图示的受理部、以及根据该变更指示变更信息的未图示的变更部来实现。基于该未图示的受理部的变更指示的受理例如既可以从输入设备受理,也可以是经由通信线路发送来的信息的接收,还可以是从规定的存储介质读取的信息的受理。

另外,在上述实施方式中,在包含在计数装置1中的两个以上的构成要素具有通信设备和输入设备等的情况下,两个以上的构成要素既可以物理上具有单个设备,或者,也可以具有单独的设备。对于学习器制造装置2也同样。

另外,在上述实施方式中,既可以由专用的硬件构成各构成要素,或者,对于可由软件实现的构成要素,也可以通过执行程序来实现。例如,可以通过由CPU等的程序执行部读取并执行存储在硬盘、半导体存储器等的存储介质中的软件/程序,来实现各构成要素。在其执行时,程序执行部也可以一边访问存储部或存储介质一边执行程序。此外,实现上述实施方式中的计数装置1的软件是如以下那样的程序。也就是说,该程序用于使能够访问存储使用多个作为拍摄了相同形状的多个计数对象物的图像的训练用输入图像、与包含配置在多个计数对象物各自的位置的教师图形的训练用输出图像的组学习的学习器的存储部的计算机执行以下步骤:拍摄图像取得步骤,取得多个计数对象物的拍摄图像;输出图像取得步骤,通过将拍摄图像应用于学习器,来取得包含在拍摄图像中的各计数对象物被转换为计数对象图形的输出图像;计数步骤,使用包含在输出图像中的多个计数对象图形对计数对象物的个数进行计数;以及输出步骤,输出通过计数步骤来计数得到的计数对象物的个数。

另外,实现上述实施方式中的学习器制造装置2的软件是如以下那样的程序。也就是说,该程序是用于使计算机执行以下步骤的程序:训练图像受理步骤,受理多个训练用输入图像与训练用输出图像的组,所述训练用输入图像是拍摄了相同形状的多个计数对象物的图像,所述训练用输出图像包含配置在多个计数对象物各自的位置的教师图形;学习器制造步骤,通过学习训练用输入图像与训练用输出图像的多个组来制造学习器;以及学习器输出步骤,输出学习器。

此外,在上述程序中,在上述程序所实现的功能中,不包括只能在硬件中实现的功能。例如,只能在取得信息的取得部、受理信息的受理部、输出信息的输出部等中的调制解调器和接口卡等的硬件中实现的功能至少不包含在上述程序实现的功能中。

另外,该程序既可以通过从服务器等下载来执行,也可以通过读取存储在规定的存储介质(例如,CD-ROM等的光盘和磁盘、半导体存储器等)中的程序来执行。另外,该程序也可以作为构成程序产品的程序来使用。

另外,执行该程序的计算机既可以是一个,也可以是多个。即,既可以进行集中处理,或者也可以进行分散处理。

图17是示出执行上述程序,实现基于上述实施方式的计数装置1、学习器制造装置2的计算机的外观的一例的示意图。上述实施方式可以通过在计算机硬件以及在其上执行的计算机程序来实现。

在图17中,计算机系统900具备包含CD-ROM驱动器905的计算机901、键盘902、鼠标903以及监视器904。

图18是示出计算机系统900的内部结构的图。在图18中,计算机901除了CD-ROM驱动器905,还具备MPU(Micro Processing Unit;微处理单元)911、用于存储启动程序等的程序的ROM912、连接到MPU911,临时存储应用程序的命令,并且提供临时存储空间的RAM913、存储应用程序、系统程序、以及数据的硬盘914、以及将MPU911、ROM912等彼此连接的总线915。此外,计算机901也可以包括提供向LAN和WAN等的连接的未图示的网卡。

使计算机系统900执行基于上述实施方式的计数装置1、学习器制造装置2的功能的程序也可以存储在CD-ROM921,且插入到CD-ROM驱动器905,并转送到硬盘914。取而代之地,该程序也可以通过未图示的网络发送至计算机901,并存储到硬盘914。程序在执行时被加载到RAM913。另外,也可以取代CD-ROM921而通过其他的存储介质(例如,DVD等),读入程序到计算机系统900。

程序也可以不一定包括使计算机901执行基于上述实施方式的计数装置1、学习器制造装置2的功能的操作系统(OS)、或者第三方程序等。程序也可以仅包括以受控制的方式调用适当的功能和模块,得到期望的结果的命令的部分。对于计算机系统900如何动作是公知的,省略详细的说明。

另外,本发明不局限于以上的实施方式,可以进行各种变更,理所当然地,这些也包含在本发明的范围内。

如上所述,根据基于本发明的计数装置等,获得能够高精度地对计数对象物进行计数的效果,作为对计数对象物进行计数的装置等有用。

相关技术
  • 计数装置、学习器制造装置、计数方法和学习器制造方法
  • 机械学习器及机械学习方法、层叠芯制造装置及系统
技术分类

06120112182474