掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本文公开的实施例大体涉及用于更新自动驾驶系统(ADS)感知功能的系统和方法。具体而言,本文公开的实施例涉及用于通过利用自监督机器学习算法提供监督信号来更新自动驾驶系统(ADS)的感知功能的系统和方法。

背景技术

在过去几年中,与自动驾驶车辆相关的研究和开发活动数量激增,并且正在探索多种不同的方法。越来越多的现代车辆具有高级驾驶者辅助系统(ADAS),以提高车辆安全性以及更普遍的道路安全性。ADAS例如可以表示为自适应巡航控制(ACC)碰撞避免系统、前方碰撞警告系统等-是可以在驾驶时帮助车辆驾驶者的电子系统。如今,在与ADAS和自动驾驶(AD)领域相关的多种技术领域都有持续的研究和开发。ADAS和AD在本文中将被称为通用术语自动驾驶系统(ADS),对应于所有不同的自动化级别,例如由SAE J3016驾驶自动化级别(0-5),特别是级别4和5定义的级别。

在不久的将来,ADS解决方案预期将应用于市场上投放的大多数新车。ADS可以被解释为各种部件的复杂组合,可以被定义为由电子装置和机器而非人类驾驶者执行车辆感知、决策和操作的系统,以及将自动化引入道路交通。这包括在交通中操纵车辆,以及形成对周围环境的感知。虽然ADS可以控制车辆,但它允许操作人员将全部或者至少部分责任交给系统。ADS通常结合各种传感器来感知车辆的周围环境,诸如雷达、激光雷达、声纳、相机、导航系统(例如GPS、里程表和/或惯性测量单元(IMU)),在此基础上,高级控制系统可以解释传感信息以识别适当的导航路径、障碍物、自由空间区域、相关标志等。

机器学习(ML),诸如深度学习(DL),是感知领域的有前途的技术,例如,用于检测和分类图像、视频流和/或激光雷达点云中的对象。然而,多种深度神经网络的问题是,它们很快达到某种性能水平(成熟度),并且需要极其大量的数据来获取进一步改进的性能。注释数百万个图像是昂贵的,因此在自动驾驶领域采取了多种措施,通过半自动注释和从注释数据中有效学习来降低成本。然而,即使具备这些进步,这仍然是一个非常昂贵的过程。

因此,本领域需要新的解决方案,以实现ADS功能的开发,尤其是ADS的感知功能,从而能够持续提供更安全、性能更好的系统。一直以来,这些改进应当优选地在不对车载系统或者平台的尺寸、功耗和成本造成显著负面影响的情况下进行。

发明内容

本发明寻求减轻、缓解或者消除现有技术中的一个或者多个上述缺陷和缺点,以解决与ADS功能开发相关的各种问题,尤其是ADS感知功能的开发。

下文和随附的独立权利要求和从属权利要求中定义了本发明的各个方面和优选实施例。

根据本发明的第一方面,提供了计算机实施的方法,用于更新具有自动驾驶系统(ADS)的车辆的感知功能。ADS具有自监督机器学习算法,其被配置成基于一个或者多个摄取的图像生成输出(例如注意力或者特征,attentions orfeatures),以及用于车内感知模块的机器学习算法,该车内感知模块被训练成基于一个或者多个摄取的图像提供一个或者多个车内感知功能。该方法包括获取车辆周围环境中的场景的一个或者多个图像,并且基于所获取的一个或者多个图像,根据自监督机器学习过程更新自监督机器学习算法的一个或者多个模型参数。该方法进一步包括通过借助自监督机器学习算法处理所获取的一个或者多个图像来生成第一输出,并且基于第一输出生成用于监督学习过程的监督信号。此外,该方法包括根据监督学习过程,基于所获取的一个或者多个图像和生成的监督信号,更新用于车内感知模块的机器学习算法的一个或者多个模型参数。

根据本发明的第二方面,提供了包含指令的计算机程序产品,当该指令由计算装置执行时,使计算机执行根据本文公开的任一实施例的方法。对于本发明的这一方面,存在与本发明的其他方面类似的优点和优选特征。

根据本发明的第三方面,提供了(非暂时性)计算机可读存储介质,包括指令,当该指令由计算装置执行时,可以使计算机执行根据本文公开的任一实施例的方法。对于本发明的这一方面,存在与本发明的其他方面类似的优点和优选特征。

如本文所用的术语“非暂时性”旨在描述不包括传播电磁信号的计算机可读存储介质(或者“存储器”),但并不旨在以其他方式限制术语“计算机可读介质或者存储器”所涵盖的物理计算机可读存储装置的类型。例如,术语“非暂时性计算机可读介质”或者“有形存储器”旨在涵盖不一定永久存储信息的存储装置类型,包括例如随机存取存储器(RAM)。以非暂时形式存储在有形计算机可访问存储介质上的程序指令和数据可以进一步通过传输介质或者信号(例如电气、电磁或者数字信号)来传输,这些信号可以经由通信介质(例如网络和/或无线链路)来传送。因此,本文所使用的术语“非暂时性”是对介质本身的限制(即,有形的,而不是信号),而不是对数据存储持久性的限制(例如RAM还是ROM)。

根据本发明的第四方面,提供了用于更新具有自动驾驶系统(ADS)的车辆的感知功能的系统。ADS具有自监督机器学习算法,其被配置成基于一个或者多个摄取的图像生成输出(例如注意力或者特征),以及用于被训练成基于一个或者多个摄取的图像提供一个或者多个感知功能的车内感知模块的机器学习算法。该系统包括控制电路,控制电路被配置成获取车辆周围环境中的场景的一个或者多个图像,并基于所获取的一个或者多个图像,根据自监督机器学习过程更新自监督机器学习算法的一个或者多个模型参数。控制电路进一步被配置成通过借助自监督机器学习算法处理所获取的一个或者多个图像来生成第一输出,并且基于第一输出生成用于监督学习过程的监督信号。此外,控制电路被配置成根据监督学习过程,基于所获取的一个或者多个图像和所生成的监督信号,更新用于感知模块的机器学习算法的一个或者多个模型参数。对于本发明的这一方面,存在与本发明的其他方面类似的优点和优选特征。

根据本发明的第五方面,提供了车辆,包括用于采集车辆周围环境中的场景图像的一个或者多个传感器,以及根据本文公开的任一实施例的用于更新车辆的感知功能的系统。对于本发明的这一方面,存在与本发明的其他方面类似的优点和优选特征。

一些实施例的优点在于,可以将新数据高效和有效地纳入用于配备有ADS的车内的检测和跟踪任务的训练后的机器学习算法,从而提高性能和可靠性。

一些实施例的优点在于,实现了捕获车辆在用于感知功能的机器学习算法的训练中经历的罕见情况(拐角情况)。

一些实施例的优点在于,可以对用于配备有ADS的车内的感知功能的机器学习算法进行自动训练,也可用于新数据,这在例如操作设计域(ODD)扩展期间特别相关和有用。

本发明的其他实施例在从属权利要求中定义。应当强调,术语“包括/包含”在本说明书中使用时是用来指定所陈述的特征、整体、步骤或者部件的存在。它不排除一个或者多个其他特征、整体、步骤、部件或者其组合的存在或者添加。

本发明的以上和其他特征和优点将在下文中参考下文所述的实施例进一步阐明。

附图说明

本发明实施例的其他目的、特征和优点将在以下详细描述中体现,参考附图,其中:

图1是表示根据一些实施例的用于更新配备有ADS的车辆的感知功能的方法的示意流程图。

图2是表示根据一些实施例的用于更新配备有ADS的车辆的感知功能的方法的示意流程图。

图3是根据一些实施例的用于更新配备有ADS的车辆的感知功能的系统的示意框图。

图4是根据一些实施例的用于更新配备有ADS的车辆的感知功能的系统的示意框图。

图5是根据一些实施例的包括用于更新配备有ADS的车辆的感知功能的系统的车辆的示意图。

具体实施方式

在以下详细描述中,将描述本发明的实施例。然而,应当理解,不同实施例的特征在实施例之间是可互换的,并且可以以不同的方式组合,除非另外特别指出。尽管在下文的描述中,提出了多种具体细节以提供对本发明的更彻底的理解,但是对于本领域技术人员来说,显然没有这些具体细节也可以实施本发明。在其他情况下,没有详细描述众所周知的结构或者功能,以免模糊本发明。

本领域技术人员将理解,本文所说明的步骤、服务和功能可以使用单独的硬件电路、使用与编程微处理器或者通用计算机结合运行的软件、使用一个或者多个专用集成电路(ASIC)、现场可编程门阵列(FPGA)和/或使用一个或者多个数字信号处理器(DSP)实施。还应当理解,当根据方法描述本公开时,它也可以在一个或者多个处理器和耦接到一个或者多个处理器的一个或者多个存储器中实现,其中一个或者多个存储器存储一个或者多个程序,当一个或者多个程序由一个或者多个处理器执行时,执行本文公开的步骤、服务和功能。

还应当理解,本文使用的术语仅用于描述特定实施例,并非旨在进行限制。应当注意,如说明书和所附权利要求中所使用的,冠词“一”、“该”和“所述”旨在表示存在一个或者多个元件,除非上下文另有明确指示。因此,例如,在一些上下文中,提及“一个单元”或者“该单元”可以指一个以上的单元,等等。此外,词语“包括”、“包含”不排除其他元件或者步骤。应当强调,术语“包括/包含”在本说明书中使用时是用来指定所陈述的特征、整体、步骤或者部件的存在。它不排除一个或者多个其他特征、整体、步骤、部件或者其组合的存在或者添加。术语“和/或”应当被解释为表示“两者”以及每一个都是可选的。术语“获取”在本文被广义地解释,并且包括接收、检索、收集、获得等。

还应当理解,尽管术语第一、第二等可以在本文用来描述各种元件或者特征,但是这些元件不应当被这些术语所限制。这些术语仅用于区分一个元件和另一个元件。例如,在不脱离实施例的范围的情况下,第一信号可以被称为第二信号,并且类似地,第二信号可以被称为第一信号。第一信号和第二信号都是信号,但它们不是同一信号。

通常,为了开发机器学习算法以达到工业目的的足够性能水平,需要大量的训练数据。对于“视觉任务”(即感知功能),诸如通常使用深度神经网络的对象检测和对象分类,情况尤其如此。

在自动驾驶领域,对大量训练数据的需求甚至进一步扩大,因为在可以在该领域(即,在交通中)部署ADS之前,达到必要的完整性和性能水平的要求是巨大的。然而,与用于ADS开发目的(诸如生成带注释的数据集)的大量训练数据的获取相关联的一个普遍挑战是,已知它们是昂贵的和/或劳动密集型的。需要解决的其他挑战例如与带宽要求、数据存储容量和数据隐私相关,这是由于在实体之间传输大型且潜在敏感的数据集的必然需求。

联邦学习(FL)是这样的方案:其中“全局”或者“中心”模型由在边缘训练的“局部”模型合并而成。这在例如智能电话的“语音助手”和“打字模型”中很普遍。在本文的上下文中,车辆构成边缘装置或者节点,而一个或者多个远程服务器可以构成负责聚集或者合并来自每个边缘装置的模型更新的中心服务器。这将被称为集中式联邦学习方案。然而,在一些实施例中,可以省略对中心实体的需要,并且边缘装置(例如车队)可以被配置成协调它们自身以获取全局模型,如所谓的去中心联邦学习方案。在下文中,主要参考集中式联邦学习方案给出描述。然而,假设本领域技术人员将容易理解如何将本文的教导实现为分散联邦学习方案,并且本文公开的本发明传达的范围包含这样的实现。应当注意,在本上下文中,术语“全局”不一定表示“世界范围”,而是应当被解释为在多个“局部”实体之间“共享”的内容。

与联邦学习的使用相关联的挑战在于,仅当可以构建损失函数(也可以称为成本函数)时,才能训练局部模型。对于自动驾驶领域的监督训练,这一挑战甚至更加突出,因为它需要带注释的数据集,如上所述,很难获取足够大的数量。这些要求导致了一种几乎不可能的情况,因为可能无法共享数据(由于带宽要求和数据隐私/安全原因),并且因为通常无法得出车内收集的所有数据的准确注释。

最近,使用“自监督学习”的新范例已被提出,以至少部分地减轻机器学习算法的训练过程中对注释数据的需要。通过这个过程,感知功能的机器学习算法可以通过使用不需要注释的图像来训练。“自监督”学习的进一步背景和细节例如在Bao,H.等(2021),BEiT:BERT预训练图像变换器;He,K.等(2021),掩码自动编码器是可缩放的视觉学习器;Xie,Z,等(2021),SimMIM:简单的掩吗图像建模框架;Zhou,J等(2021)。iBOT:使用在线标记器进行图像BERT预训练。

然而,出于多种原因,人们可能不想依赖自监督机器学习算法或者基于变换器的网络(如上述示例),作为决策和ADS的各种操作的基础。例如,这可能是因为与用于ADS感知功能的传统机器学习算法(例如卷积神经网络,CNN)相比,这些自监督机器学习算法的准确性和计算效率可能受到质疑。此外,与批准的硬件(HW)架构的兼容性也可能是一个问题。

然而,本发明人发现,这些自监督机器学习网络仍可用于自动驾驶系统领域,以高效可靠的方式提供改进车载感知功能(即“生产系统”)的技术优势。更详细地,本文提出利用这种“自监督”的范例来构建对“生产系统”的监督信号(例如基于CNN的感知功能)。简而言之,一些实施例包括机器学习算法,其通过使用感觉输出(例如相机图像、激光雷达图像等)的自监督学习来训练以生成输出,该输出随后用于形成监督信号(即地面实况的形式)。然后,这种形成的监督信号被用于监督学习过程,以训练车内感知模块(也可以称为“生产系统”)的机器学习算法。换句话说,自监督机器学习算法的输出被直接或者间接地用作监督信号,以执行生产系统的感知功能的局部更新。然后,在一些实施例中,更新的网络(或者其部分)可以被传输到中心系统,在该中心系统中,多个局部更新可以被合并,并在全局软件更新过程中被推送到车辆。

因此,借助本文公开的技术,人们可有效地将车队车辆在正常运行期间暴露的各种场景和情景纳入生产网络的训练中,而无需传输庞大的数据集或者注释各车辆收集的数据。因此,用于提高配备有ADS的车辆的感知功能的性能的有效和自动化的过程是容易实现的。此外,以更快的速度将生产网络的操作能力有效地扩展到新的区域和新的用例(即,操作设计域扩展)是容易实现的。

操作设计域(ODD)应当理解为自动或者半自动驾驶系统(即AD或者ADAS)设计运行的操作域的描述,包括但不限于地理、道路(例如类型、表面、几何形状、边缘和标记)、环境参数、连通性、周围对象和速度限制。也就是说,ADS的生产网络可以与特定的环境场景相关联,并且仅被配置成在满足一组“场景参数”的环境中操作,示例场景是交通堵塞、高速公路/高速公路巡航等。ODD可以进一步定义对驾驶场景及其动态(例如交通灯、十字路口、乱穿马路者、雪、冰、超车、大型动物等)的容许暴露率。“场景参数”例如可以从来自一个或者多个车载传感器的传感器数据获取,或者从远程服务器获取的通信数据获取,或者通过车对车(V2V)通信协议从另一车辆获取。例如,场景参数可以是道路类型、天气数据、速度限制、交通密度、可用车道数量、道路工程的存在等。

因此,一些实施例的优点在于,与已知的现有技术相比,用于在配备有ADS的车内提供感知功能的机器学习算法的训练更成本高效,劳动密集度更低。

一些实施例的优点在于,可以对用于配备有ADS的车辆的感知网络进行自动训练。

一些实施例的优点在于,用于在配备有ADS的车内提供感知功能的机器学习算法的训练通常更有效,因为传输可能包含个人数据的大型数据集的需求可以得到缓解,这在一些国家甚至是不允许的。

一些实施例还提供了增加捕获罕见情况(也可以称为拐角情况)的可能性的优势,该罕见情况可以并入生产网络的训练中,与已知的现有技术相比,甚至以更高的速度进一步提高性能。

在一些实施例中,机器学习算法(也可以称为机器学习模型、神经网络等)使用公开可用的合适软件开发机器学习代码元件实施,诸如在PyTorch、Keras和TensorFlow或者任何其他合适软件开发平台中可用的代码元件,以本领域普通技术人员已知的任何合适方式实施。

图1和图2是表示根据一些实施例的用于更新具有自动驾驶系统(ADS)的车辆的感知功能的方法S100的示意流程图。更详细地,ADS具有被配置成基于一个或者多个摄取的图像生成输出的自监督机器学习算法,以及用于车内感知模块(即“生产网络”)的机器学习算法,该机器学习算法被训练成基于一个或者多个摄取的图像提供一个或者多个车内感知功能。自监督机器学习算法的输出例如可以是注意力(例如注意力图)、特征(例如特征图)、深度值或者本领域普通技术人员容易理解的任何其他合适的输出的形式。

方法S100优选地是计算机实施的方法S100,由配备有ADS的车辆的处理系统执行。该处理系统例如可以包括一个或者多个处理器和耦接到该一个或者多个处理器的一个或者多个存储器,其中该一个或者多个存储器存储一个或者多个程序,该一个或者多个程序在由一个或者多个处理器执行时执行本文公开的方法S100的步骤、服务和功能。

方法S100包括获取S101车辆周围环境中的场景的一个或者多个图像。所获取S101的一个或者多个图像例如可以是由车载相机捕获的图像。然而,在一些实施例中,一个或者多个图像可以是激光雷达图像或者雷达图像的形式。此外,图像可以是图像序列(即视频馈送)或者单个图像。

此外,方法S100包括根据基于所获取的一个或者多个图像的自监督机器学习过程,更新S102自监督机器学习算法的一个或者多个模型参数。“一个或者多个模型参数”例如可以被理解为一个或者多个网络权重和/或偏差,如本领域技术人员容易理解的。

“自监督机器学习算法”在本文中被理解为不需要标记或者注释数据来学习的机器学习算法(例如人工神经网络)。在一些实施例中,自监督机器学习算法是自动编码器(AE),诸如掩码自动编码器(MAE),或者任何合适的基于变换器的网络。在一些实施例中,通过操纵(例如抑制)图像的部分并指示算法重建被操纵的图像作为其学习过程的一部分,来训练自监督机器学习算法。随后将重建的图像与原始图像进行比较,以创建损失函数,该损失函数用于更新模型参数(例如网络权重和/或偏差),如本领域中已知的。图像的操作例如可以通过掩码、向图像添加噪声或者本领域技术人员容易理解的类似方法来执行。然而,在一些实施例中,不需要操纵输入数据来训练机器学习算法,而是可以用“原始输入”来训练,例如在传统的自动编码器中。因此,在一些实施例中,自监督机器学习算法可以包括无监督机器学习算法。

方法S100进一步包括通过借助自监督机器学习算法处理获取的一个或者多个图像生成S103第一输出。如上所述,第一输出例如可以是注意力图、特征图、深度图等的形式。在一些实施例中,注意力图包括标量矩阵,该标量矩阵表示不同2D空间位置的层激活相对于目标任务的相对重要性,即,注意力图是指示什么2D位置对于任务是重要的数字网格。在本上下文中,目标任务(或者仅仅是任务)可以被理解为车载感知模块的ML算法的感知功能。例如,重要位置对应更大的数字,可以在热图中用红色表示。“特征图”(也可以称为“激活图”)可以被理解为应用于神经网络的前一层的一个滤波器的输出,即在图像中找到某种特征的位置的映射。

此外,方法S100包括基于第一输出生成S104用于监督学习过程的监督信号。本文,所生成S103的第一输出可以直接用于形成监督信号,或者通过利用次级ML算法摄取第一输出并生成第二输出(例如对象分类、边界框、深度/距离图等)来间接使用,该第二输出将形成监督信号(分别参见图3和图4所示的体系结构)。

方法S100进一步包括根据监督学习过程,基于所获取的一个或者多个图像和生成的监督信号,更新S107用于车内感知模块的机器学习算法的一个或者多个模型参数。因此,所获取S101的一个或者多个图像形成输入数据或者输入对象,并且监督信号形成期望的输出,用于车内感知模块的机器学习算法被训练成将输入数据映射到该期望的输出上。

作为具体示例,本文公开的方法S100和架构可用于以实例分割网络的形式来训练用于车内感知模块的机器学习算法,即检测图像中的对象并为这些对象提供像素式掩码的网络。为了创建实例分割网络的损失函数(成本函数),将实例分割网络检测到的对象与例如对象掩码中所有像素的注意力图(由自监督ML算法输出)进行比较。可以相应地更新实例分割网络,以最大化两者之间的重叠(即,由实例分割网络检测到的对象和注意力图之间的重叠)。

回到监督信号的生成S104,在一些实施例中,生成S104的监督信号包括所生成S103的第一输出,所获取S101的一个或者多个图像和所生成S104的监督信号,形成用于车内感知模块的机器学习算法的训练数据。

在一些实施例中,生成S104监督信号的步骤包括借助次级机器学习算法处理第一输出,该次级机器学习算法被训练成生成第二输出。然后,监督信号包括第二输出,并且所获取S101的一个或者多个图像和监督信号形成用于车内感知模块的机器学习算法的训练数据。

在一些实施例中,第二输出包括对象分类(例如以分类注意力图的形式)、边界框、深度估计、分割掩码、预测对象轨迹等中的至少一个。

更详细地,次级机器学习算法被配置成摄取自监督ML算法的输出(以及可选地,获取S101的一个或者多个图像),以生成/形成第二输出。自监督ML算法的输出,可以是注意力、特征、深度等形式,可以相应地用于形成例如分类、边界框、分割掩码等形式的第二输出。因此,来自次级机器学习算法36的输出可以是第一输出的后处理版本(例如分类注意力图)。

然而,在一些实施例中,次级机器学习算法被配置成摄取生成S103的第一输出和获取S101的一个或者多个图像,以生成第二输出。因此,第二输出可以是通过使用所生成S103的第一输出以及所获取S101的一个或者多个图像生成的所获取S101的一个或者多个图像的后处理版本的形式。例如,辅助机器学习算法可以被训练成借助从自监督机器学习算法生成S103的第一输出,直接在获取的一个或者多个图像上生成/形成边界框。

此外,在一些情况下,可以向自监督机器学习算法呈现来自新场景的图像,该新场景在域外或者远离自监督机器学习算法先前“看到”的数据。因此,可能存在对用于车内感知模块的机器学习算法(以及自监督机器学习算法)进行有害更新的风险。为了减轻这种风险,本文提出利用异常检测功能。在新ODD上发布ADS之后的初始阶段,这一潜在问题预计会更加突出,并且由于自监督机器学习算法的固有能力,预计随着时间,自监督机器学习算法将暴露于越来越少的“新场景”。

因此,在一些实施例中,方法S100进一步包括通过使用机器学习分类系统检测S108异常图像数据,该机器学习分类系统被训练成在所获取的一个或者多个图像中从对于自监督机器学习算法已知的经验区分新的经验,并且输出异常值,以及基于异常值计算/增加S109监督信号的权重。在一些实施例中,机器学习分类系统包括针对与自监督机器学习算法相同的数据集训练的自动编码器(诸如变型自动编码器),并且其中异常值是重构误差。

因此,在一些实施例中,机器学习分类系统,例如自动编码器,被训练成评估车辆遇到的经验(在获取的一个或者多个图像中描绘),并将经验分类为新的(指新的或者罕见的)经验或者已知的(指先前用于配置或者开发自监督机器学习算法的)经验。有利地,通过使用自动编码器,自动编码器的重构误差属性可以用于夸大由车辆的车载传感器捕获的异常场景,这允许以比其他机器学习数据分类模型在相同计算复杂度水平下能够实现的更高的灵敏度来检测代表新的或者罕见的经验的异常。换句话说,通过使用自动编码器机器学习模型,当遇到新的或者罕见的经验时,车辆可以更准确地进行确定。

更详细地,通过使用自动编码器算法,可以更容易地检测S108异常行为,因为重构误差会夸大未包括在自监督机器学习算法的训练数据中的输入数据。可以使用任何合适的自动编码器模型算法,只要它具有足够的输入维度来处理至少所获取S101的一个或者多个图像,该一个或者多个图像表示场景和/或数据缓冲器,例如30秒的图像数据缓冲器。通过使用用于配置和/或开发自监督机器学习算法的训练数据来训练自动编码器,没有包括在自动编码器的训练数据中的任何新数据应当通过具有更大的重构误差而与自动编码器的解码输出中的训练数据相区别。

在一些实施例中,为重构误差设置阈值,以区分自动编码器解码层的输出,该输出未包括在自动编码器(因此也未包括在自监督机器学习算法)的训练数据中,并且可以被分类为训练数据中包括的输出的异常。可以使用任何合适的自动编码器模型。

此外,重构误差可用于计算/确定S109“异常值”,从而计算/确定添加至监督信号的权重。例如,大的重构误差将导致添加到监督信号的低权重。在一些实施例中,大的重构误差(超过阈值)导致监督信号的禁用,即,如果所获取的一个或者多个图像导致足够大的重构误差,则对于该周期,可以跳过用于车内感知模块的机器学习算法的一个或者多个模型参数的更新S107。在一些实施例中,“权重”是0和1之间的值,其中与较小的重构误差相比,较大的重构误差导致更接近0的权重,这导致更接近1的权重被添加到监督信号。如本领域技术人员容易理解的,术语“添加”在“向监督信号添加权重”的上下文中可以理解为相乘,或者简单地理解为监督信号利用计算的S109权重值“加权”。

此外,机器学习分类系统优选地与自监督机器学习算法联合更新,以便两个网络保持消耗的训练数据的一致性。

此外,在一些实施例中,可利用联邦学习(FL)方案,其中方法S100包括向远程实体传输S110自监督机器学习算法的所更新的一个或者多个模型参数和用于车内感知模块的机器学习算法的所更新的一个或者多个模型参数。方法S100可以相应地进一步包括从远程实体接收S111自监督机器学习算法的一组全局更新的一个或者多个模型参数。自监督机器学习算法的该组全局更新的一个或者多个模型参数基于从包括相应自监督机器学习算法的多个车辆获取的信息。类似地,从远程实体接收S112用于车内感知模块的机器学习算法的一组全局更新的一个或者多个模型参数。用于车内感知模块的机器学习算法的该组全局更新的一个或者多个模型参数基于从包括用于车内感知模块的相应机器学习算法的多个车辆获取的信息。

方法S100可以进一步包括基于自监督机器学习算法的所接收的一组全局更新的一个或者多个模型参数,更新S113自监督机器学习算法,以及基于所接收的一组全局更新的一个或者多个用于车内感知模块的机器学习算法的模型参数,更新S114用于车内感知模块的机器学习算法。

一般而言,本文所使用的关于获取或者接收步骤的术语“一个或者多个模型参数”用于涵盖相关联的ML算法的版本已在接收实体可用的实施例,因此仅更新的模型参数(例如网络权重和/或偏差)需要是可用的,以便于更新整个ML算法。从而可以提高带宽利用率。然而,如本领域技术人员容易理解的,在一些实施例中,相关联的ML算法的所有模型参数被传输/接收或者以其他方式传递。

用于执行这些功能的可执行指令可选地包括在非暂时性计算机可读存储介质或者其他计算机程序产品中,配置成由一个或者多个处理器执行。

图3和图4是根据一些实施例更新车辆1的感知功能的系统10的示意框图。更详细地,图3和图4通过示意性地示出信息流和各种过程步骤,用于进一步阐明与“生产网络”35的更新过程相关的上述实施例。处理系统10包括被配置成执行本文公开的方法S100的功能的控制电路(例如一个或者多个处理器),其中这些功能可以被包括在非暂时性计算机可读存储介质或者被配置成由控制电路执行的其他计算机程序产品中。然而,为了更好地阐明本发明,在图3和图4中,控制电路被表示为各种“模块”或者块31、33,它们中的每一个都链接到控制电路的一个或者多个特定功能。特别地,图3描绘了一些实施例,其中来自自监督机器学习算法的输出被用来(或多或少直接地)形成用于车载感知模块(即,“生产网络”或者“感知网络”)35的机器学习算法的后续更新过程的监督信号。而图4描绘了一些实施例,其中来自自监督机器学习算法的输出通过次级ML算法36进行后处理,其输出然后用于形成监督信号。

系统10能够向/从远程实体传输和接收数据,本文为“后台”或者车队管理系统20的形式。蜂窝通信技术可用于车辆1和远程实体20之间的远程通信。蜂窝无线电技术的示例有GSM、GPRS、EDGE、LTE、5G、5G NR等,也包括未来的蜂窝解决方案。然而,如本领域读者容易理解的,诸如Wifi/以太网的其他通信技术也是可行的。

与网络类型及其架构、网络更新/训练过程等相关的细节已经在前文详细讨论,为了简洁和简明起见,将不再参考图3和图4重复。假设本领域技术人员容易理解,先前讨论的相应示例和特征类似地适用于图3和图4。

系统10适用于更新具有自动驾驶系统(ADS)的车辆的感知功能。ADS具有自监督机器学习算法32和机器学习算法35,自监督机器学习算法32被配置成基于一个或者多个摄取的图像生成输出,机器学习算法35用于被训练成基于一个或者多个摄取的图像提供一个或者多个感知功能的车内感知模块。如前所述,车辆1的ADS采用“生产网络”(例如参见附图标记35)用于ADS的各种操作任务,并且特别地,“生产网络”用于提供一个或者多个感知功能(例如对象检测、语义分割、对象分类、自由空间估计、车道边界检测、跟踪功能、预测功能、端到端功能,例如联合检测+跟踪+预测等),用于ADS的决策和控制功能。因此,自监督网络32的目的主要是支持生产网络35的训练/更新过程。

系统10包括控制电路(参见例如图5中的附图标记11),控制电路被配置成获取车辆周围环境中的场景的一个或者多个图像30。控制电路进一步被配置成基于所获取的一个或者多个图像,根据自监督机器学习过程来更新自监督机器学习算法32的一个或者多个模型参数。如上所述,自监督机器学习算法可以通过操纵(例如抑制)图像的部分并指示算法重建被操纵的图像作为其学习过程的一部分来训练。

此外,控制电路11配置成通过自监督机器学习算法处理获取的一个或者多个图像生成第一输出,并基于第一输出生成监督学习过程的监督信号。

如图4所示,在一些实施例中,控制电路11被配置成借助次级机器学习算法36处理第一输出,该次级机器学习算法36被训练成生成第一输出,第一输出包括所生成的第一输出的后处理版本。因此,监督信号可以包括第二输出。换句话说,次级机器学习算法36被配置成摄取第一输出(即来自自监督ML算法32的输出),其可以是特征、注意力、深度等的形式。并且生成形成监督信号的第二输出,该第二输出可以是分类、边界框、分割掩码、对象轨迹等形式。可选地,除了第一输出之外,次级机器学习算法36可以摄取所获取的一个或者多个图像30,以生成第二输出。因此,来自次级机器学习算法36的输出可以是第一输出的后处理版本(例如分类注意力图)。可选地,来自次级机器学习算法的输出可以包括所获取的一个或者多个图像30的后处理版本,该后处理版本是通过使用第一输出以及所获取的一个或者多个图像30来生成的。例如,次级机器学习算法36可以在来自自监督机器学习算法32的输出的帮助下,直接在所获取的一个或者多个图像30上生成边界框。

控制电路11进一步配置成根据所获取的一个或者多个图像和根据监督学习过程生成的监督信号,更新感知模块的机器学习算法35的一个或者多个模型参数。更详细地,获取的一个或者多个图像30和来自自监督网络32的相应输出(或者其后处理版本)用作感知模块的机器学习算法35的训练对。因此,由机器学习算法35生成的用于感知模块的输出与监督信号进行比较,以便形成损失函数或者成本函数(例如通过评估和损失构建模块32),由此可以采用优化算法来最小化损失函数,并相应地更新模型参数。

此外,在一些实施例中,控制电路11可以被配置成采用机器学习分类系统来检测异常图像数据(未示出)。具体而言,机器学习分类系统被训练成在所获取的一个或者多个图像30中从对于自监督机器学习算法32已知的经验区分新的经验,并且输出异常值。然后,该异常值(例如如果机器学习分类系统是自动编码器,则为重构误差)可用于向监督信号增加权重。因此,如果有理由相信来自自监督网络的输出是低质量的,则错误学习的潜在负面影响可以减少。

系统10也可以采用联邦学习方案。更详细地,在一些实施例中,控制电路11被配置成将自监督机器学习算法32和用于感知模块的机器学习算法35的(局部)更新的模型参数传输到远程实体(例如中心处理系统)20。远程实体可以从多个车辆1和控制电路21接收几个局部更新的模型参数,并且控制电路21被配置成合并这些局部更新并形成ML算法的全局更新版本。全局更新的模型参数可以随后被推出到车辆1的车队。

图5是根据一些实施例的配备有ADS的车辆1的示意性侧视图,车辆1包括用于更新ADS感知功能的系统10。系统10包括一个或者多个处理器11、存储器12、传感器接口13和通信接口14。处理器11也可以被称为控制电路11或者控制线路11。控制电路11被配置成执行存储在存储器12中的指令,以执行根据本文公开的实施例中的任一个的用于更新具有自动驾驶系统(ADS)的车辆的感知功能的方法。换句话说,控制装置10的存储器12可以包括一个或者多个(非暂时性的)计算机可读存储介质,用于存储计算机可执行指令,例如,当该指令由一个或者多个计算机处理器11执行时,可以使计算机处理器11执行本文描述的技术。存储器12可选地包括高速随机存取存储器,诸如DRAM、SRAM、DDR RAM或者其他随机存取固态存储器装置;并且可选地包括非易失性存储器,诸如一个或者多个磁盘存储装置、光盘存储装置、闪存装置或者其他非易失性固态存储装置。系统10还可以包括现有技术中已知的合适的传感器接口13和通信接口14。

在一些实施例中,车辆1包括感知系统6或者感知块6,以及定位系统5。感知系统6在本上下文中被理解为负责从车载传感器6a、6b、6c(诸如相机、激光雷达和雷达、超声波传感器)获取原始传感器数据并将该原始数据转换成场景理解的系统。感知模块的机器学习算法可以包含在感知系统6中,并且这样的感知系统6可以是ADS平台的一部分。定位系统5被配置成监控车辆的地理位置和航向,并且可以是全局导航卫星系统(GNSS)的形式,诸如GPS。然而,定位系统也可以实现为实时运动学(RTK)GPS,以提高精度。

此外,车辆1可经由例如无线链路连接至外部网络20(例如用于检索地图数据)。相同的或者一些其他的无线链路可以用于与车辆附近的其他车辆2或者与本地基础设施元件通信。蜂窝通信技术可以用于远程通信,诸如到外部网络的通信,并且如果所使用的蜂窝通信技术具有低延迟,则它也可以用于车辆之间、车辆到车辆(V2V)和/或车辆到基础设施V2X的通信。蜂窝无线电技术的示例有GSM、GPRS、EDGE、LTE、5G、5G NR等,也包括未来的蜂窝解决方案。然而,在一些解决方案中,使用了中短程通信技术,例如无线局域网(LAN),例如基于IEEE 802.11的解决方案。ETSI正在制定车辆通信的蜂窝标准,例如,5G由于低延迟和高效处理高带宽和通信信道而被视为合适的解决方案。

总之,根据本文公开的技术,自监督网络部署在配备有ADS的车内。该网络然后可以连续地(或者至少在被停放时,如果计算资源在操作期间不可用)摄取ADS所经历的场景(图像)用于自监督学习。然而,对于实时操作,ADS采用单独的“生产”网络进行局部更新,该网络使用来自自监督网络的输出作为根据监督学习方案的监督信号。此外,该过程还可以在联邦学习方案中采用,其中来自这种车辆的车队的局部更新被集中合并,并作为两个网络的全局更新而推出。

上文已参考特定实施例介绍了本发明。然而,除了上述之外的其他实施例也是可能的,并且在本发明的范围内。在本发明的范围内,可以提供与上述不同的方法步骤,通过硬件或者软件执行该方法。因此,根据示例性实施例,提供了存储被配置成由车辆控制系统的一个或者多个处理器执行的一个或者多个程序的非暂时性计算机可读存储介质,该一个或者多个程序包括用于执行根据上述实施例中任一个的方法的指令。可选地,根据另一示例性实施例,云计算系统可以被配置成执行本文给出的任何方法。云计算系统可以包括分布式云计算资源,这些资源在一个或者多个计算机程序产品的控制下共同执行本文提出的方法。

一般而言,计算机可访问介质可包括任何有形或者非暂时性存储介质或者存储介质,诸如电子、磁性或者光学介质,例如通过总线与计算机系统连接的磁盘或者CD/DVD-ROM。本文所使用的术语“有形的”和“非暂时性的”,旨在描述不包括传播电磁信号的计算机可读存储介质(或者“存储器”),但不旨在限制由术语计算机可读介质或者存储器包含的物理计算机可读存储装置的类型。例如,术语“非暂时性计算机可读介质”或者“有形存储器”旨在涵盖不一定永久存储信息的存储装置类型,包括例如随机存取存储器(RAM)。以非暂时形式存储在有形计算机可访问存储介质上的程序指令和数据可以进一步通过传输介质或者信号(例如电气、电磁或者数字信号)来传输,这些信号可以经由通信介质(例如网络和/或无线链路)来传送。

(与系统10相关的)处理器11可以是或者包括任意数量的硬件部件,用于进行数据或者信号处理,或者用于执行存储在存储器12中的计算机代码。装置10具有相关联的存储器12,并且存储器12可以是用于存储数据和/或计算机代码的一个或者多个装置,该数据和/或计算机代码用于完成或者实现本说明书中描述的各种方法。存储器可以包括易失性存储器或者非易失性存储器。存储器12可以包括数据库部件、目标代码部件、脚本部件或者用于支持本说明书的各种活动的任何其他类型的信息结构。根据示例性实施例,任何分布式或者本地存储装置都可以与本说明书的系统和方法一起使用。根据示例性实施例,存储器12可通信地连接到处理器11(例如经由电路或者任何其他有线、无线或者网络连接),并且包括用于执行本文描述的一个或者多个过程的计算机代码。

应当理解,传感器接口13也可以提供直接或者经由车内的专用传感器控制电路6获取传感器数据的可能性。该装置可以进一步具有通信/天线接口13,其可以进一步提供借助天线8向远程位置(例如远程操作员或者控制中心)发送输出的可能性。此外,车内的一些传感器可以使用本地网络设置(例如CAN总线、I2C、以太网、光纤等)与系统10通信。通信接口14可以被布置成与车辆的其他控制功能通信,并且因此也可以被视为控制接口;然而,可以提供单独的控制接口(未示出)。车辆内的本地通信也可以是具有诸如WiFi、LoRa、Zigbee、蓝牙或者类似中/短程技术的协议的无线类型。

应当注意,词语“包括”不排除所列之外的其他元件或者步骤的存在,并且元件前的词语“一”不排除多个此类元件的存在。还应当注意,任何附图标记都不限制权利要求的范围,本发明可以至少部分地通过硬件和软件来实现,并且几个“装置”或者“单元”可以由同一项硬件来表示。

虽然附图中显示了方法步骤的特定顺序,但步骤的顺序可能与图示不同。此外,可以同时或者部分同时执行两个或者更多步骤。这种变化将取决于所选择的软件和硬件系统以及设计者的选择。所有这些变化都在本发明的范围内。同样,软件实施方式可以使用标准编程技术来完成,该技术具有基于规则的逻辑和其他逻辑来完成各种连接步骤、处理步骤、比较步骤和决策步骤。上文提到和描述的实施例仅作为示例给出,不应当限制本发明。对于本领域技术人员来说,在下述专利实施例所要求的本发明范围内的其他解决方案、用途、目标和功能应当是显而易见的。

相关技术
  • 一种具有抗晶间腐蚀性能的双相钢锻件
  • 一种具有大刚度高密封性能的盾构钢板刷
  • 一种具有大刚度高密封性能的盾构钢板刷
技术分类

06120116566196