掌桥专利:专业的专利平台
掌桥专利
首页

基于动态视觉传感器的高速运动目标检测跟踪方法

文献发布时间:2023-06-19 09:27:35


基于动态视觉传感器的高速运动目标检测跟踪方法

技术领域

本发明属于计算机视觉技术领域,具体涉及一种基于动态视觉传感器的高速运动目标检测跟踪方法、系统、装置。

背景技术

运动的视觉分析是近年来计算机视觉领域中的一个热点问题,它从图像序列中检测、识别、跟踪运行目标并对其行为进行理解和描述,在智能医疗、工业质量检测、机器人跟踪导航、体育赛事、力学测试分析、智能交通及军事视觉制导等方面有着极其广泛的应用。而高能效的摄像机、低能耗处理器的实时视觉处理算法以及稳定的性能都是目标检测、识别、跟踪在实际中应用的关键。

动态视觉传感器(Dynamic vision sensor,DVS)是一种事件驱动型的光电传感器,不同于传统图像传感器(摄像机)输出是以完整感光面形成图像帧,具有高冗余、高延迟、高噪声、低动态范围和高数据量等缺陷,DVS输出是独立事件构成的数据流,然后根据时间划分形成的图像帧,具有仿生视觉特征。同时,由于DVS只对亮度对比发生变化的区域产生事件输出,从而具有过滤相对静态背景、只对动态目标形成输出信号的特点,在实际应用中可以极大减少冗余数据量,节省计算资源和通信带宽。此外,DVS可用于亮度变化的高动态场景,且具有高时间分辨率采集能力,在视觉智能型移动设备及针对高速运动目标的检测中将带来广泛的应用前景,因此在机器学习、神经科学、计算机视觉等领域引起了强烈关注。

脉冲神经网络是第三代神经网络,由脉冲神经元模型为基本单元构成。通过使用特定时间的单个脉冲,将空间信息、时间信息、频率信息、相位信息等融入通信和计算中,具有更高的生物真实性。而动态视觉传感器的输出为事件流,具有仿生视觉特征。这在一定程度上反映了动态视觉传感器和脉冲神经网络之间可能存在的关联性。基于此,本发明结合动态视觉传感器和脉冲神经网络提出了一种基于动态视觉传感器的高速运动目标检测跟踪方法。

发明内容

为了解决现有技术中的上述问题,即为了解决现有基于传统图像传感器的高速运动目标检测跟踪方法存在高冗余、高延迟、高噪声以及检测跟踪精度差的问题,本发明第一方面,提出了一种基于动态视觉传感器的高速运动目标检测跟踪方法,该方法包括:

步骤S10,通过动态视觉传感器获取目标场景中各高速运动目标当前帧的地址事件数据流,作为输入数据;

步骤S20,通过预构建的脉冲神经网络对所述输入数据进行去噪、最大池化处理,得到子区域;将设定染色核滑动扫描所有子区域,获取染色表信息,作为第一信息;所述染色表信息包括高速运动目标的目标信息;所述目标信息包括目标区域中心坐标、颜色编号、设定的时间标签值及目标区域长、宽、面积;

步骤S30,根据上一帧获取的第一信息,通过基于横向滤波器构建的预测器得到当前帧预测的染色表信息,作为第二信息;通过预设的更新方法对所述第一信息、所述第二信息进行更新;

步骤S40,依次计算更新后的第一信息与上一帧获取的第三信息中目标区域面积的重叠比,将重叠比最大的两两高速运动目标进行合并,并将无重叠的高速运动目标插入上一帧获取的第三信息中,作为所述目标场景中当前帧获取的第三信息;所述第三信息为最终获取的待追踪的高速运动目标的染色表信息。

在一些优选的实施方式中,步骤S20与步骤S30之间还包括合并步骤:

若所述第一信息中各高速运动目标之间的目标区域中心坐标的偏差以及目标区域长、宽的偏差小于设定的偏差阈值,则进行合并。

在一些优选的实施方式中,步骤S40中“通过预设的更新方法对所述第一信息、所述第二信息进行更新”,其方法为:

依次计算所述第一信息、所述第二信息中对应位置的目标区域面积的重叠比;

对各重叠比,若其小于设定的重叠比阈值,则将所述第二信息中对应的高速运动目标的时间标签值减1;

判断所述第二信息中对应的高速运动目标的时间标签值是否小于设定的时间标签阈值,若是,则将所述第二信息中该高速运动目标对应的目标信息删除;

否则将该高速运动目标在所述第一信息中的目标信息更新为所述第二信息中的目标信息。

在一些优选的实施方式中,所述预测器其训练方法为:

计算当前帧获取的第一信息与上一帧预测器输出的第二信息之间的损失值;

根据所述损失值,采用最小二乘法更新所述预测器的参数。

在一些优选的实施方式中,所述预测器获取下一帧预测的染色表信息,其方法为:

基于当前帧输出的第一信息,通过参数更新后的预测器得到下一帧预测的染色表信息;

结合当前帧更新后的第二信息中的时间标签值以及当前帧最终获取的第三信息中的颜色编号,对所述下一帧的预测的染色表信息进行更新。

本发明的第二方面,提出了一种基于动态视觉传感器的高速运动目标检测跟踪系统,该系统包括数据流获取模块、第一信息获取模块、更新模块、输出模块;

所述数据流获取模块,配置为通过动态视觉传感器获取目标场景中各高速运动目标当前帧的地址事件数据流,作为输入数据;

所述第一信息获取模块,配置为通过预构建的脉冲神经网络对所述输入数据进行去噪、最大池化处理,得到子区域;将设定染色核滑动扫描所有子区域,获取染色表信息,作为第一信息;所述染色表信息包括高速运动目标的目标信息;所述目标信息包括目标区域中心坐标、颜色编号、设定的时间标签值及目标区域长、宽、面积;

所述更新模块,配置为根据上一帧获取的第一信息,通过基于横向滤波器构建的预测器得到当前帧预测的染色表信息,作为第二信息;通过预设的更新方法对所述第一信息、所述第二信息进行更新;

所述输出模块,配置为依次计算更新后的第一信息与上一帧获取的第三信息中目标区域面积的重叠比,将重叠比最大的两两高速运动目标进行合并,并将无重叠的高速运动目标插入上一帧获取的第三信息中,作为所述目标场景中当前帧获取的第三信息;所述第三信息为最终获取的待追踪的高速运动目标的染色表信息。

在一些优选的实施方式中,该系统还包括合并模块;

所述合并模块,配置为若所述第一信息中各高速运动目标之间的目标区域中心坐标的偏差以及目标区域长、宽的偏差小于设定的偏差阈值,则进行合并。

本发明的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适用于由处理器加载并执行以实现上述的基于动态视觉传感器的高速运动目标检测跟踪方法。

本发明的第四方面,提出了一种处理装置,包括处理器、存储装置;处理器,适用于执行各条程序;存储装置,适用于存储多条程序;所述程序适用于由处理器加载并执行以实现上述的基于动态视觉传感器的高速运动目标检测跟踪方法。

本发明的有益效果:

本发明降低了数据的冗余量、传输延迟、存在噪声的问题,并提高了高速运动目标检测跟踪的精度。

(1)本发明通过动态视觉传感器对高速运动目标进行图像帧的捕获,极大减少冗余数据量,节省计算资源和通信带宽,降低了数据传输的延迟。

(2)本发明通过脉冲神经网络的低通滤波器对地址事件数据流进行去噪,降低了数据流存在的噪声问题,提高了目标检测的精度。

(3)采用了高速运动目标的运动预测及目标缓存,保证了在目标短时丢失情况下的预测跟踪,大大提高了高速运动目标的检测跟踪精度。

附图说明

通过阅读参照以下附图所做的对非限制性实施例所做的详细描述,本申请的其他特征、目的和优点将会变得更明显。

图1是本发明一种实施例的基于动态视觉传感器的高速运动目标检测跟踪方法的流程示意图;

图2是本发明一种实施例的基于动态视觉传感器的高速运动目标检测跟踪系统的框架示意图;

图3是本发明一种实施例的基于动态视觉传感器的高速运动目标检测跟踪方法的简略流程示意图;

图4是本发明一种实施例的第一信息获取的框架示意图;

图5是本发明一种实施例的预测染色表与目标染色表匹配的流程示意图;

图6是本发明一种实施例的预测器获取预测染色表的流程示意图;

图7是本发明一种实施例的适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

本发明的基于动态视觉传感器的高速运动目标检测跟踪方法,如图1所示,包括以下步骤:

步骤S10,通过动态视觉传感器获取目标场景中各高速运动目标当前帧的地址事件数据流,作为输入数据;

步骤S20,通过预构建的脉冲神经网络对所述输入数据进行去噪、最大池化处理,得到子区域;将设定染色核滑动扫描所有子区域,获取染色表信息,作为第一信息;所述染色表信息包括高速运动目标的目标信息;所述目标信息包括目标区域中心坐标、颜色编号、设定的时间标签值及目标区域长、宽、面积;

步骤S30,根据上一帧获取的第一信息,通过基于横向滤波器构建的预测器得到当前帧预测的染色表信息,作为第二信息;通过预设的更新方法对所述第一信息、所述第二信息进行更新;

步骤S40,依次计算更新后的第一信息与上一帧获取的第三信息中目标区域面积的重叠比,将重叠比最大的两两高速运动目标进行合并,并将无重叠的高速运动目标插入上一帧获取的第三信息中,作为所述目标场景中当前帧获取的第三信息;所述第三信息为最终获取的待追踪的高速运动目标的染色表信息。

为了更清晰地对本发明基于动态视觉传感器的高速运动目标检测跟踪方法进行说明,下面结合附图对本发明方法一种实施例中各步骤进行展开详述。

步骤S10,通过动态视觉传感器获取目标场景中各高速运动目标当前帧的地址事件数据流,作为输入数据;

在本实施例中,通过动态视觉传感器(Dynamic vision sensor,DVS)获取目标场景中各高速运动目标当前帧的地址事件数据流。如图3所示,图3中的其余部分在下文中描述。

步骤S20,通过预构建的脉冲神经网络对所述输入数据进行去噪、最大池化处理,得到子区域;将设定染色核滑动扫描所有子区域,获取染色表信息,作为第一信息;所述染色表信息包括高速运动目标的目标信息;所述目标信息包括目标区域中心坐标、颜色编号、设定的时间标签值及目标区域长、宽、面积;

在本实施例中,将各高速运动目标当前帧的地址事件数据流输入脉冲神经网络,通过脉冲神经网络的低通滤波器对背景噪声进行滤波去噪处理,输出脉冲发放阵列,将脉冲发放阵列进行最大池化处理,得到子区域,即子区域空间。

采用关联区域染色的方法对子区域进行处理,得到各高速运动目标的目标信息,即将设定染色核滑动扫描所有子区域,获取染色表信息,即目标染色表,作为第一信息;染色表信息包括高速运动目标的目标信息;目标信息包括目标区域中心坐标、颜色编号、设定的时间标签值及目标区域长、宽、面积。

若第一信息中各高速运动目标之间的目标区域中心坐标的偏差以及目标区域长、宽的偏差小于设定的偏差阈值,则进行合并,将合并后的第一信息作为最终得到的第一信息;如图4所示,染色,即通过设定的染色核滑动扫描进行染色。

步骤S30,根据上一帧获取的第一信息,通过基于横向滤波器构建的预测器得到当前帧预测的染色表信息,作为第二信息;通过预设的更新方法对所述第一信息、所述第二信息进行更新;

在本实施例中,根据上一帧获取的染色表信息,即上一帧最终获取的待追踪的高速运动目标的染色表信息,通过预测器得到当前帧预测的染色表信息,即预测染色表,作为第二信息。预测器基于横向滤波器构建,其训练方法为:

计算当前帧获取的第一信息与上一帧预测器输出的第二信息之间的损失值;

根据损失值,采用最小二乘法更新预测器的参数,实现预测器的在线更新学习,以便于提高目标检测跟踪的精度。如图6所示。

预测器的输入为此帧输出的目标染色表以及训练出来的预测器参数,输出为预测染色表。根据匹配模块的输出结果,更新预测染色表时间标签以及颜色编号,最终形成并缓存新的预测染色表。即基于当前帧输出的第一信息,通过参数更新后的预测器得到预测染色表信息,并根据更新的第二信息中时间标签,以及当前帧最终获取的待追踪的高速运动目标的染色表信息中的颜色编号,更新得到目标下一帧的预测染色表信息。

将当前帧输出的目标染色表与上一帧预测染色表内所有高速运动目标的目标信息进行重叠计算,根据输出的重叠比,一一判断预测出现的目标是否消失,即依次计算当前帧输出的第一信息、第二信息中对应位置的目标区域面积的重叠比(重叠检测),若重叠比小于设定的重叠比阈值,则认为目标消失(出现了丢帧的情况),并将第二信息中对应的高速运动目标的时间标签值减1,并判断时间标签值是否小于设定的时间标签阈值,若小于设定的时间标签阈值,则将第二信息中该高速运动目标对应的目标信息删除,否则不删除当前帧第二信息中该高速运动目标对应的目标信息(维持染色表)。

若目标未消失(重叠比大于设定的重叠比阈值),将当前帧第一信息中重叠比对应的高速运动目标的目标信息更新为第二信息中的目标信息,即跟住目标,更新染色表,从而实现了目标记忆功能。

步骤S40,依次计算更新后的第一信息与上一帧获取的第三信息中目标区域面积的重叠比,将重叠比最大的两两高速运动目标进行合并,并将无重叠的高速运动目标插入上一帧获取的第三信息中,作为所述目标场景中当前帧获取的第三信息;所述第三信息为最终获取的待追踪的高速运动目标的染色表信息。

在本实施例中,用于将更新后的目标染色表即更新后的第一信息与上一帧最终获取的待追踪的高速运动目标的染色表信息(简称为历史表、历史目标染色表)一一进行重叠比对,即计算各高速运动目标的目标区域面积(左上角坐标和右下角坐标确定的面积)的重叠比(重叠检测),将重叠比最大的两两高速运动目标合并(即找到目标),并将当前帧无重叠的目标(即出现新目标)插入到上一帧获取的待追踪的高速运动目标的染色表信息内,作为目标场景中当前帧最终获取的待追踪的高速运动目标的染色表信息。如图5所示,其中,图5染色表信息中存在10个高速运动目标(0-9),通过嵌套循环(For-in循环)进行重叠比对,Max_area(i,j)表示高速运动目标i与高速运动目标j计算出的目标区域面积的重叠比,Max_area>0表示表示两个高速运动目标有重叠,Max_area=0表示两个高速运动目标无重叠。

本发明第二实施例的一种基于动态视觉传感器的高速运动目标检测跟踪系统,如图2所示,包括:数据流获取模块100、第一信息获取模块200、更新模块300、输出模块400;

所述数据流获取模块100,配置为通过动态视觉传感器获取目标场景中各高速运动目标当前帧的地址事件数据流,作为输入数据;

所述第一信息获取模块200,配置为通过预构建的脉冲神经网络对所述输入数据进行去噪、最大池化处理,得到子区域;将设定染色核滑动扫描所有子区域,获取染色表信息,作为第一信息;所述染色表信息包括高速运动目标的目标信息;所述目标信息包括目标区域中心坐标、颜色编号、设定的时间标签值及目标区域长、宽、面积;

所述更新模块300,配置为根据上一帧获取的第一信息,通过基于横向滤波器构建的预测器得到当前帧预测的染色表信息,作为第二信息;通过预设的更新方法对所述第一信息、所述第二信息进行更新;

所述输出模块400,配置为依次计算更新后的第一信息与上一帧获取的第三信息中目标区域面积的重叠比,将重叠比最大的两两高速运动目标进行合并,并将无重叠的高速运动目标插入上一帧获取的第三信息中,作为所述目标场景中当前帧获取的第三信息;所述第三信息为最终获取的待追踪的高速运动目标的染色表信息。

基于动态视觉传感器的高速运动目标检测跟踪系统还包括合并模块500;

所述合并模块500,配置为若所述第一信息中各高速运动目标之间的目标区域中心坐标的偏差以及目标区域长、宽的偏差小于设定的偏差阈值,则进行合并。

所述技术领域的技术人员可以清楚的了解到,为描述的方便和简洁,上述描述的系统的具体的工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。

需要说明的是,上述实施例提供的基于动态视觉传感器的高速运动目标检测跟踪系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。

本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适用于由处理器加载并实现上述的基于动态视觉传感器的高速运动目标检测跟踪方法。

本发明第四实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适用于由处理器加载并执行以实现上述的基于动态视觉传感器的高速运动目标检测跟踪方法。

所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。

下面参考图7,其示出了适于用来实现本申请方法、系统、装置实施例的服务器的计算机系统的结构示意图。图7示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示,计算机系统包括中央处理单元(CPU,Central Processing Unit)701,其可以根据存储在只读存储器(ROM,Read Only Memory)702中的程序或者从存储部分708加载到随机访问存储器(RAM,Random Access Memory)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统操作所需的各种程序和数据。CPU701、ROM702以及RAM703通过总线704彼此相连。输入/输出(I/O,Input/Output)接口705也连接至总线704。

以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid Crystal Display)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN(局域网,Local AreaNetwork)卡、调制解调器等的网络接口卡的通讯部分709。通讯部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通讯部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU701执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

相关技术
  • 基于动态视觉传感器的高速运动目标检测跟踪方法
  • 基于动态视觉传感器的高速运动目标检测跟踪方法
技术分类

06120112173920