掌桥专利:专业的专利平台
掌桥专利
首页

用于训练基于深度学习的机器学习算法的方法

文献发布时间:2024-04-18 19:58:53


用于训练基于深度学习的机器学习算法的方法

技术领域

本发明涉及一种用于训练基于深度学习的机器学习算法以及尤其是一种可用来以简单的方式并且以比较少的资源消耗来训练关于特定应用经优化的基于深度学习的机器学习算法的方法。

背景技术

机器学习算法基于:使用统计方法,以便对数据处理系统进行训练,使得该数据处理系统可以在该数据处理系统最初未曾明确为了特定任务而被编程的情况下执行该特定任务。在此,机器学习的目的在于构建可以从数据中学习并做出预测的算法。这些算法创建数学模型,利用这些数学模型例如可以对数据进行分类。

此类机器学习算法例如在驾驶员辅助系统中应用或者在控制自主驾驶机动车辆时应用。在此,例如在控制自主驾驶机动车辆时,重要的是:尽可能精确地预测在自主驾驶机动车辆周围的其它车辆可能很快进行哪些驾驶机动,以便能够对此尽可能适当地做出反应。

在此,对在自主驾驶机动车辆周围的其它车辆的未来驾驶机动的此类预测通常基于隐马尔可夫模型。隐马尔可夫模型是一种随机模型,在该随机模型中,通过具有未观察状态的马尔可夫链来对系统进行建模。然而,在这种情况下,被证明为不利的是:与对由隐马尔可夫模型做出的预测进行进一步处理的组件或应用相关的性能指标或要求实际上通常只以非连续或不可微函数的形式存在。此外,隐马尔可夫模型是相对简单的模型,这些模型通常不会涵盖所有与实践相关的情况或依赖关系。

从出版文献WO 2007/011529A2中已知一种用于训练机器学习算法的方法,其中机器学习算法具有一组估计的梯度,这些梯度至少部分地基于通过机器学习算法所生成的有序或分类的输出。在此,可以选择这些估计的梯度,而不是反映成本函数的要求的不可微成本函数,而且这些估计的梯度可以被用于在训练机器学习算法期间确定或修改机器学习算法的参数。

发明内容

因此,本发明所基于的任务在于:说明一种经改进的用于预测未来状态的方法。

该任务通过一种按照专利权利要求1的特征的用于训练与特定应用适配的基于深度学习的机器学习算法的方法来解决。

该任务还通过一种按照专利权利要求7的特征的用于训练与特定应用适配的基于深度学习的机器学习算法的控制设备来解决。

按照本发明的一个实施方式,该任务通过一种用于训练基于深度学习的机器学习算法的方法来解决,其中该方法具有:

提供用于训练基于深度学习的机器学习算法的训练数据,其中这些训练数据具有传感器数据;

基于训练数据,通过机器学习方法,训练基于深度学习的机器学习算法;而且

然后,基于不可微成本函数、尤其是关于特定应用的不可微成本函数,对经过训练的基于深度学习的机器学习算法的至少一个参数进行优化。

在此,Deep Learning或多层学习、深度学习或深入学习被理解成一种机器学习方法,该机器学习方法使用人工神经网络并且由此形成综合的内部结构,这些人工神经网络在输入层与输出层之间具有大量中间层。

在此,神经网络的参数或者超参数还可以理解成如下参数,这些参数在应用该神经网络之前被移交给该神经网络并且表示该神经网络的特性。在此,为了使神经网络与所希望的应用或说明应如何对通过经过训练的基于深度学习的机器学习算法所做出的预测进行进一步处理的特定应用情况最佳适配,通常执行超参数优化。

不可微函数还被理解成非连续函数,这些非连续函数并不是在其定义集的每一点处都是可微的。

成本函数或损失还被理解成在基于深度学习的机器学习算法的所确定的输出值与相对应的实际状况或实际测量的数据之间的损失或误差。关于特定应用的成本函数还被理解成一种成本函数,该成本函数与相应的特定应用情况或相应的应用相协调或者与它们适配。

在此,使用基于深度学习的机器学习算法、即具有多个中间层的神经网络所具有的优点在于:这些机器学习算法可以比例如隐马尔可夫模型涵盖复杂得多的情况或场景。

还基于与相对应的应用有关的不可微成本函数来优化基于深度学习的机器学习算法的至少一个参数还具有如下优点:基于深度学习的机器学习算法还可以与对由基于深度学习的机器学习算法所做出的预测进行进一步处理的组件或应用相关的、实际上通常只以不可微函数的形式存在的性能指标或要求适配。

因此,总的来说,说明了一种经改进的用于预测未来状态的方法,其中对未来状态的相对应的经改进的预测尤其是在安全关键的系统的情况下、例如在控制自主驾驶机动车辆时被证明为有利。

在此,这些训练数据还具有传感器数据。

传感器,也称为检测器、(测量参量或测量)记录仪或者(测量)探测器,是一种技术构件,该技术构件可以定性地或者可以作为测量参量来定量地检测该技术构件的周围环境的特定物理或化学特性和/或材料性质。

因此,以简单的方式就可以检测在执行该方法的实际的数据处理系统之外的状况,并且在训练基于深度学习的机器学习算法时考虑这些状况。

在此,通过机器学习方法来训练基于深度学习的机器学习算法的步骤可以具有:基于可微成本函数来训练深度学习分类器。

可微函数又被理解成连续函数,这些连续函数在其定义集的每一点处都是可微的。

因此,对基于深度学习的机器学习算法的训练可以以简单的方式基于相应的训练数据通过常规或已知的方法来实现,而不需要对训练过程的复杂调整。

在一个实施方式中,基于不可微成本函数来优化经过训练的基于深度学习的机器学习算法的至少一个参数的步骤还具有:基于温度缩放,优化经过训练的深度学习分类器。

在此,温度被理解成神经网络中的超参数,该超参数用于通过在应用Softmax输出层之前对几率(Logits)进行缩放来控制通过该神经网络所做出的预测或神经网络的输出中的随机性或任意性。

在此,“基于不可微成本函数优化经过训练的基于深度学习的机器学习算法的至少一个参数的步骤具有基于温度缩放来优化经过训练的基于深度学习的机器学习算法”具有如下优点:仅使用一个参数来优化基于深度学习的分类器,使得对于优化基于深度学习的机器学习算法或者对于训练基于深度学习的分类器总体上所需的资源、尤其是存储器容量和/或处理器能力可以显著减小。

利用本发明的另一实施方式,还说明了一种用于控制可控系统的方法,其中该方法具有:提供用于控制可控系统的基于深度学习的机器学习算法,其中基于深度学习的机器学习算法是通过上文描述的用于训练基于深度学习的机器学习算法的方法来训练的;而且以基于深度学习的机器学习算法为基础来控制该可控系统。

在此,该可控系统例如可以是机器人系统,其中该机器人系统例如又可以是用于对自主驾驶机动车辆进行控制或导航的系统。

因此,说明了一种用于控制可控系统的方法,该可控系统基于经改进的用于预测未来状态的方法,其中对未来状态的相对应的经改进的预测尤其是在安全关键的系统的情况下、例如在控制自主驾驶机动车辆时被证明为有利。在此,使用基于深度学习的机器学习算法、即具有多个中间层的神经网络所具有的优点在于:这些机器学习算法可以比例如隐马尔可夫模型涵盖复杂得多的情况或场景。还基于与相对应的应用有关的不可微成本函数来优化基于深度学习的机器学习算法的至少一个参数还具有如下优点:基于深度学习的机器学习算法还可以与对由基于深度学习的机器学习算法所做出的预测进行进一步处理的组件或应用、即该可控系统相关的、实际上通常只以不可微函数的形式存在的性能指标或要求适配。

在此,该可控系统尤其可以是自主驾驶机动车辆的自动距离调节装置。这样,尤其是在控制自主驾驶机动车辆时,重要的是:尽可能精确地预测在自主驾驶机动车辆周围的其它车辆可能很快进行哪些驾驶机动,以便能够对此尽可能适当地做出反应。

利用本发明的另一实施方式,还说明了一种用于训练基于深度学习的机器学习算法的控制设备,其中该控制设备具有:提供单元,该提供单元被设计为提供用于训练基于深度学习的机器学习算法的训练数据,其中这些训练数据具有传感器数据;训练单元,该训练单元被设计为基于这些训练数据通过机器学习方法来训练基于深度学习的机器学习算法;和优化单元,该优化单元被设计为:然后,基于不可微成本函数、尤其是关于特定应用的不可微成本函数,对经过训练的基于深度学习的机器学习算法的至少一个参数进行优化。

因此,说明了一种经改进的用于预测未来状态的控制设备,其中对未来状态的相对应的经改进的预测尤其是在安全关键的系统的情况下、例如在控制自主驾驶机动车辆时被证明为有利。在此,使用基于深度学习的机器学习算法、即具有多个中间层的神经网络所具有的优点在于:这些机器学习算法可以比例如隐马尔可夫模型涵盖复杂得多的情况或场景。此外,“该控制设备还被设计为基于与特定应用有关的不可微成本函数来优化基于深度学习的机器学习算法的至少一个参数”具有如下优点:基于深度学习的机器学习算法还可以与对由基于深度学习的机器学习算法所做出的预测进行进一步处理的组件或应用相关的、实际上通常只以不可微函数的形式存在的性能指标或要求适配。

在此,这些训练数据又还具有传感器数据。因此,以简单的方式就可以检测执行基于深度学习的机器学习算法的训练的实际的数据处理系统之外的状况,并且在训练基于深度学习的机器学习算法时考虑这些状况。

在此,该训练单元可以被设计为:基于可微成本函数来训练基于深度学习的机器学习算法。因此,对基于深度学习的机器学习算法的训练可以以简单的方式基于相应的训练数据通过常规或已知的方法来实现,而不需要对训练过程的复杂调整。

在一个实施方式中,该优化单元还被设计为:基于温度缩放来优化经过训练的基于深度学习的机器学习算法。在此,“该优化单元被设计为:基于温度缩放来优化经过训练的基于深度学习的机器学习算法”具有如下优点:仅使用一个参数来优化基于深度学习的机器学习算法,使得对于优化基于深度学习的分类器或者对于训练基于深度学习的机器学习算法总体上所需的资源、尤其是存储器容量和/或处理器能力可以显著减小。

此外,利用本发明的另一实施方式,还说明了一种用于控制可控系统的控制设备,其中该控制设备具有:提供单元,该提供单元被设计为提供用于控制可控系统的基于深度学习的机器学习算法,其中基于深度学习的机器学习算法是通过上文描述的用于训练基于深度学习的机器学习算法的控制设备来训练的;和控制单元,该控制单元被设计为以基于深度学习的机器学习算法为基础来控制该可控系统。

因此,说明了一种用于控制可控系统的控制设备,该控制设备基于经改进的用于预测未来状态的控制设备,其中对未来状态的相对应的经改进的预测尤其是在安全关键的系统的情况下、例如在控制自主驾驶机动车辆时被证明为有利。在此,使用基于深度学习的机器学习算法、即具有多个中间层的神经网络所具有的优点在于:这些机器学习算法可以比例如隐马尔可夫模型涵盖复杂得多的情况或场景。还基于与相对应的应用有关的不可微成本函数来优化基于深度学习的机器学习算法的至少一个参数还具有如下优点:基于深度学习的机器学习算法还可以与对由基于深度学习的机器学习算法所做出的预测进行进一步处理的组件或应用、即该可控系统相关的、实际上通常只以不可微函数的形式存在的性能指标或要求适配。

在此,该可控系统尤其又可以是自主驾驶机动车辆的自动距离调节装置。这样,尤其是在控制自主驾驶机动车辆时,重要的是:尽可能精确地预测在自主驾驶机动车辆周围的其它车辆可能很快进行哪些驾驶机动,以便能够对此尽可能适当地做出反应。

总而言之,应着重指出:利用本发明说明了一种用于训练基于深度学习的机器学习算法的方法以及尤其是一种可用来以简单的方式并且以比较少的资源消耗来训练关于特定应用经优化的基于深度学习的机器学习算法的方法。

所描述的设计方案和扩展方案可以彼此任意组合。

本发明的其它可能的设计方案、扩展方案、实现方案也包括本发明的之前或者在下文关于实施例所描述的特征的没有明确提到的组合。

附图说明

附图旨在提供对本发明的实施方式的进一步理解。这些附图阐明了实施方式并且与说明书相结合地用于阐述本发明的原理和设计。

其它实施方式和所提到的优点中的多个优点参考这些附图得出。这些附图的所呈现的要素不一定彼此严格按比例地被示出。

其中:

图1示出了按照本发明的实施方式的用于训练基于深度学习的机器学习算法的方法的流程图;以及

图2示出了按照本发明的实施方式的用于训练基于深度学习的机器学习算法的控制设备的示意性框图。

在这些附图的图中,只要不另作说明,相同的附图标记就表示相同或功能相同的要素、构件或组件。

具体实施方式

图1示出了按照本发明的实施方式的用于训练基于深度学习的机器学习算法的方法1的流程图。

机器学习算法基于:使用统计方法,以便对数据处理系统进行训练,使得该数据处理系统可以在该数据处理系统最初未曾明确为了特定任务而被编程的情况下执行该特定任务。在此,机器学习的目的在于构建可以从数据中学习并做出预测的算法。这些算法创建数学模型,利用这些数学模型例如可以对数据进行分类。

此类机器学习算法例如在驾驶员辅助系统领域中应用或者在控制自主驾驶机动车辆时应用。在此,例如在控制自主驾驶机动车辆时,重要的是:尽可能精确地预测在自主驾驶机动车辆周围的其它车辆可能很快进行哪些驾驶机动,以便能够对此尽可能适当地做出反应。

在此,对在自主驾驶机动车辆周围的其它车辆的未来驾驶机动的此类预测通常基于隐马尔可夫模型。隐马尔可夫模型是一种随机模型,在该随机模型中,通过具有未观察状态的马尔可夫链来对系统进行建模。然而,在这种情况下,被证明为不利的是:与对由隐马尔可夫模型做出的预测进行进一步处理的组件或应用相关的性能指标或要求实际上通常只以非连续或不可微函数的形式存在。此外,隐马尔可夫模型是相对简单的模型,这些模型通常不会涵盖所有与实践相关的情况或依赖关系。

在此,图1示出了用于训练与特定应用情况适配的基于深度学习的机器学习算法的方法1,其中该方法1具有:步骤2:提供用于训练基于深度学习的机器学习算法的训练数据,其中这些训练数据具有传感器数据;步骤3:基于训练数据通过机器学习方法来训练基于深度学习的机器学习算法;和步骤4:然后,基于不可微成本函数、尤其是关于特定应用的不可微成本函数,对经过训练的基于深度学习的机器学习算法的至少一个参数进行优化。

在此,使用基于深度学习的机器学习算法、即具有多个中间层的神经网络所具有的优点在于:这些机器学习算法可以比例如隐马尔可夫模型涵盖复杂得多的情况或场景。

还基于与相对应的应用有关的不可微成本函数来优化基于深度学习的机器学习算法的至少一个参数还具有如下优点:基于深度学习的机器学习算法还可以与对由基于深度学习的机器学习算法所做出的预测进行进一步处理的组件或应用相关的、实际上通常只以不可微函数的形式存在的性能指标或要求适配。

因此,总的来说,说明了一种经改进的用于预测未来状态的方法1,其中对未来状态的相对应的经改进的预测尤其是在安全关键的系统的情况下、例如在控制自主驾驶机动车辆时被证明为有利。

因此,图1在此尤其示出了用于训练基于深度学习的机器学习算法的混合方法1。

在此,按照图1的实施方式,基于深度学习的机器学习算法尤其是基于深度学习的分类器。

按照图1的实施方式,通过机器学习方法来训练基于深度学习的机器学习算法的步骤2还具有:基于可微成本函数、例如基于梯度下降法,训练基于深度学习的机器学习算法。

按照图1的实施方式,基于不可微成本函数来优化经过训练的基于深度学习的机器学习算法的至少一个参数的步骤3还具有:基于温度缩放,优化经过训练的基于深度学习的机器学习算法。

在此,基于温度缩放的优化尤其可以基于贝叶斯优化方法来进行。在此,如果相对应的参数空间小,则贝叶斯优化方法工作效果最佳,其中这里只考虑一个参数、即温度。另一方面,对于大量参数或者例如在具有多个层的神经网络的情况下出现的大参数空间,贝叶斯优化通常只能困难实现。但是,此外例如也可以使用网格搜索方法来优化基于深度学习的机器学习算法。

在此,这些训练数据还具有传感器数据,其中相对应的传感器尤其可以是光学传感器,例如雷达传感器、摄像机或激光雷达传感器。

在此,基于深度学习的机器学习算法然后尤其可以被用于控制可控系统、例如自主驾驶机动车辆的自动距离调节装置。

在此,基于深度学习的机器学习算法例如可以是用于预测在自主驾驶机动车辆周围的机动车辆的未来驾驶机动的系统的部分,该系统被训练为:例如基于关于机动车辆的当前速度、机动车辆的当前位置、机动车辆与自主驾驶机动车辆之间的相对距离以及必要时还有机动车辆的信号灯的当前状态的所检测到的值,预测该机动车辆的未来驾驶机动,例如它是否可能很快就会变换车道。在此,基于深度学习的机器学习算法例如可以是基于历史数据或者在先前的行驶期间收集的数据或者关于机动车辆的速度和/或该机动车辆的位置和/或该机动车辆距自主驾驶机动车辆的相对距离与该机动车辆的随后的驾驶机动之间的关系的信息来训练的。

然后,通过基于深度学习的机器学习算法所做出的预测例如可以被用于规定应该基于自主驾驶机动车辆周围的哪个车辆来调节自主驾驶机动车辆的自动距离调节装置或自适应巡航控制器。

图2示出了按照本发明的实施方式的用于训练基于深度学习的机器学习算法的控制设备10的示意性框图。

在此,如图2所示,该控制设备10具有:提供单元11,该提供单元被设计为提供用于训练基于深度学习的机器学习算法的训练数据,其中这些训练数据具有传感器数据;训练单元12,该训练单元被设计为基于这些训练数据通过机器学习方法来训练基于深度学习的机器学习算法;和优化单元13,该优化单元被设计为:然后,基于不可微成本函数、尤其是关于特定应用的不可微成本函数,对经过训练的基于深度学习的机器学习算法的至少一个参数进行优化。

在此,该提供单元尤其可以是接收器,该接收器被设计为接收相对应的数据、尤其是传感器数据。在此,该训练单元和该优化单元例如可以分别基于寄存在存储器中并且可通过处理器来执行的代码来实现。

在此,按照图2的实施方式,该训练单元12被设计为:基于可微成本函数来训练基于深度学习的机器学习算法。

按照图2的实施方式,该优化单元13还被设计为:基于温度缩放来优化经过训练的基于深度学习的机器学习算法。

技术分类

06120116506703