掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及包括作为人工学习系统的工作层次和评价层次的整体系统,尤其是涉及在其中实现的用于处理机器的控制系统中的输入值的方法。

背景技术

人工智能现今在无数应用领域中扮演越来越多的角色。这最初被理解为是指智能行为和机器学习的任何自动化。然而,这种系统通常是针对特殊任务而设计和训练的。这种形式的人工智能(AI)通常被称为“弱AI”,并且基本上基于应用计算和算法来模拟固定区域中的智能行为。示例包括能够识别某些模式的系统,例如车辆中的安全系统,或者能够学习和实现某些规则的系统,例如象棋中的系统。同时,这些系统在其它领域中基本上是无用的,并且必须针对其它应用进行完全的再训练,或者甚至使用完全不同的方法进行训练。

神经网络尤其被用于这种人工/人为学习单元的实际实现方式。原则上,这些网络在抽象层次上复制生物神经元的功能。存在若干人工神经元或节点,它们彼此连接并且可以接收、处理和向其它节点发送信号。然后,对于每个节点,定义函数、权重和阈值,例如,其确定信号是否以什么强度被传递到节点。

通常,分层考虑节点,使得每个神经网络具有至少一个输出层。在此之前,其它层可以作为所谓的隐藏层存在,从而形成多层网络。输入值或特征也可以被认为是层。不同层的节点之间的连接被称为边缘,并且这些通常被分配固定的处理方向。取决于网络拓扑,可以指定一层的哪个节点链接到下一层的哪个节点。在这种情况下,可以连接所有节点,但是,例如,具有值0的学习加权意味着不能经由特定节点进一步处理信号。

神经网络中的信号处理可以通过各种函数来描述。在下文中,针对神经网络的单个神经元或节点来描述该原理。从达到一个节点的几个不同的输入值中,网络输入由传播函数(也即输入函数)形成。通常,该传播函数包括简单的加权和,由此为每个输入值指定相关联的加权。然而,原则上,其它传播函数也是可能的。权重可被指定为网络的权重矩阵。

可以取决于阈值的激活函数被应用于以这种方式形成的节点的网络输入。该函数表示在网络输入与神经元活动层次之间的关系。各种激活函数是已知的,例如简单的二进制阈值函数,其输出因此是低于阈值的零和高于阈值的本体(英语:identity);S形函数;或具有给定斜率的分段线性函数。在设计神经网络时指定这些函数。激活功能的结果形成激活状态。可选地,可以指定附加输出函数,其应用于激活函数的输出并确定节点的最终输出值。然而,通常,激活函数的结果简单地直接作为输出值传递,即本体被用作输出函数。取决于所使用的命名,激活函数和输出函数也可组合为传递函数。

然后将每个节点的输出值作为该层的相应节点的输入值传递到神经网络的下一层,其中重复相应步骤以便用节点的各个函数和权重进行处理。取决于网络的拓扑结构,还可能存在到先前层的向后边缘或返回到输出层,从而导致递归网络。

另一方面,每个输入值被加权的权重可以被网络改变,从而调整输出值和整个网络的功能,这被认为是神经网络的“学习”。为此,通常在网络中使用误差反向传播,即,将输出值与期望值进行比较,并使用该比较以使输入值适应于最小化误差的目的。通过误差反馈,然后可以相应地调整网络的各种参数,例如步长(学习速率)或节点处的输入值的权重。同样,也可以重新评价输入值。

然后可以以训练模式训练网络。所使用的学习策略对于神经网络的可能应用也是决定性的。特别地,区分以下变型:

在监督学习中,给出输入模式或训练数据集,并将网络的输出与期望值进行比较。

无监督学习将相关性或规则的发现留给系统,从而仅指定要学习的模式。中间变型是半监督学习,其中也可以使用没有预定分类的数据集。

在强化学习或Q-学习中,创建了一种代理,其可以接收针对动作的奖励和惩罚,并且基于此,试图最大化所接收的奖励并因此调整其行为。

神经网络的一个重要应用是将输入数据或输入分类到某些类别或类中,即识别相关性和分配。这些类可以基于已知数据来训练,并且至少部分地预定义,或者它们可以由网络独立地开发或学习。

这样的神经网络的基本功能和进一步的具体细节在本主题中是已知的,例如来自R.Schwaiger,J.Steinwender,“用Python编写神经网络程序”,莱茵维尔计算,波恩2019。

没有仅针对一个特殊任务进行训练的通用AI系统将产生多维或高维空间,因此需要按指数规律增加训练和测试数据集。因此,实时响应很快变得不可能。因此,通常试图降低这种系统的维数和复杂性。正在寻求解决该问题的不同方法。例如,可以通过链接数据集、降低自由度和/或通过将已知知识馈送到系统中来降低复杂度。另一种方法是例如通过使用诸如主成分分析的方法至少部分地分离相关数据或相互依赖的数据集。通过对特征应用过滤方法,例如通过应用诸如卡方检验或其它的统计检验,可以消除在训练网络时不突出或负面突出的数据。最后,训练数据本身的选择可以作为AI网络中的优化问题来完成。在这种情况下,训练数据以这样的方式组合,即它们可以尽可能快地训练新的网络。

更先进的方法包括所谓的“卷积神经网络”,其在多层全连接网络的至少一层中应用卷积而不是简单的矩阵变换。例如,所谓的“deep-dream”方法是已知的,特别是在图像识别领域中,其中在训练的网络中的权重是最佳的,但是替代地,输入值(例如输入图像)根据输出值被修改为反馈回路。这样,例如,系统相信识别的内容被淡入。该名称是指在该过程中创建梦幻图像的事实。这样,可以跟踪神经网络的内部过程及其方向。

显然,这些方法仍然显示出与人类智力的巨大差异。虽然原则上可以将数据库、文本文件、图像和音频文件与事实、语言、语音逻辑、声音、图像和事件序列在大脑中如何存储和处理进行比较,但是人类智能显著不同,例如,因为它在感觉和无意识“软”分类的情境中链接所有这些数据。

发明内容

根据本发明,提出了一种在机器的控制系统中执行的用于处理作为人工学习系统的具有工作层次和评价层次的整体系统中的输入值的方法以及具有独立权利要求的特征的对应的系统。有利的实施例是从属权利要求和以下描述的主题。

在用于处理包括由作为人工学习系统的具有工作层次和评价层次的整体系统中的一个或多个传感器所检测到的传感器数据(或值或测量值,视情况而定)的输入值的机器的控制系统中执行的方法(或多种方法,视情况而定),包括:

a)将第一输入值输入到工作层次,并根据第一分类由工作层次从第一输入值确定第一输出值;

b)基于第一输出值形成第一情况数据;

c)将第一情况数据输入到评价层次,并由评价层次确定第一评价,第一评价指示第一情况数据是否或何种程度满足预定第一条件;

d)基于第一评价影响工作层次中的第一输出值的确定;

由此重复进行步骤a)-d);

e)根据第二分类,将第二输入值输入到工作层次,并由工作层次从第二输入值确定第二输出值,其中第二输出值的确定受第一输出值的影响;

f)基于第二输出值形成第二情况数据;

g)将第二情况数据输入到评价层次,并由评价层次确定第二评价,第二评价指示第二情况数据是否或何种程度满足预定的第二条件,第二评价的确定受第一评价的影响;

h)基于第二评价影响工作层次中的第二输出值的确定;

由此重复进行步骤e)-h);

其中第一和/或第二输出值被用作整体系统的整体输出值,其中整体输出值被用作机器的控制参数和/或状态参数。

尤其是,在本申请的意义内的“人工学习系统”可以包括彼此耦合的两个(或更多个)人工学习单元,参见图1至图6的描述。“人工学习单元”可以被认为是实现基于机器学习的算法的单元,例如人工神经网络。可以使用训练数据来训练基于机器学习的算法,以构建基于输入值进行预测或决策的模型,输入值以输出值的形式输出。可以分别训练工作层次和评价层次的人工学习单元,以从第一/第二输入值获得第一/第二输出值,并从第一/第二情况数据获得第一/第二评价。人工学习系统内的人工学习单元的耦合具体以这样的方式实现:第一单元或其输出值影响第二单元或其输入值的处理,但是第二单元不影响第一单元。

人工学习系统或单元可被实现为在计算单元(例如处理器、计算机、服务器系统或加速卡)中执行的计算机程序。人工学习系统或单元也可被至少部分地实现为硬件,例如FPGA(现场可编程门阵列)。尤其是,还可以通过也可以在不同计算单元中执行的互连人工学习单元来实现人工学习系统。

该机器可以是例如工业机器、工业工厂(交互机器的系统)、移动工作机器和/或交通工具,特别是自主或半自主交通工具。控制系统可以包括一个或多个控制单元或计算单元(例如,在机器的一个或多个控制单元中)。尤其是,可以设想在彼此分离的不同计算单元(例如不同的控制单元)中实现工作层次和评价层次。每个控制单元或计算单元可包括一个或多个处理器、易失性存储器、非易失性存储器、通信接口(用于与传感器、与机器部件、与其他控制单元或与外部设备的数据通信)和/或类似的。可以在控制单元中提供硬件加速器元件(AI加速器,用于人工学习系统或人工学习单元的评价计算步骤)。尤其是,在非易失性存储器中,可以存储实现该方法的程序和/或在实现该方法期间产生的数据。

一方面,可以提供确定或测量机器或机器部件的特性或变量的传感器(优选地安装在机器上),例如压力传感器(例如以确定液压流体的压力)、电流和/或电压传感器(例如在电操作的致动器或电动机/发电机上)、温度传感器、速度传感器、旋转速度传感器、光传感器、位置传感器、确定致动器位置的传感器等。另一方面,附加地或可选地,可以提供确定或测量影响机器环境的特性或量的传感器(优选地在机器上),例如照相机、雷达、激光雷达或红外传感器、麦克风等。除了传感器数据之外,输入值还可以包括其它数据或值,例如用户输入、从其它设备发送的数据、请求或规范、控制参数或状态参数的先前值,或类似物。

术语“控制参数”是指用于控制机器的参数或量,例如机器部件被控制所基于的参数/量。术语“状态参数”是指指示机器的状态的参数,例如存在多种可能的操作评价中的哪一种,是否存在危险状态,或机器是否正确运行或是否存在故障状态。

第一或第二评价对第一或第二输出值的确定的影响(步骤d)或h))是指从第一或第二输入值确定第一或第二输出值的相应的下一次重复,即步骤a)-d)或e)-h)的下一次重复。尤其是,在第一重复中,第一或第二输出值的确定还没有受到影响。这可以例如通过用中性第一或第二评价初始化来实现。

输入值可以在步骤a)-d)或e)-h)的重复期间保持恒定,或者可以是可变的,由此同时使用这两者也是可能的。例如,以相对高的速率确定的传感器数据(测量值)可以在例如电流强度、电压、温度或速度传感器的重复期间至少稍微改变。在大变化的情况下,例如大于预定阈值,可以假定存在新的情况(如果存在新的情况,则第一输出值可以首先用作总输出值,然后,例如在一定时间之后,或者如果满足另一条件,则第二输出值可以用作总输出值)。其他传感器数据可以再次保持恒定,例如照相机的恒定,以相对低的速率(例如30、60或<100Hz)评价捕获的图像。在这种情况下,最大用于重复的(第一/第二)时间跨度可根据该低速率来选择。例如,如果以30Hz的频率捕获图像,这对应于大约33ms的两个连续图像之间的时间间隔,则可以将时间跨度选择为小于33ms,例如30ms,从而在每个时间跨度中评价新捕获的图像。如果以更高频率同时获取的数据被用作输入值,则这些可能在该时间跨度(例如30ms)期间改变。这里,假设这种变化相对较小,因此根本不会出现新的情况。

尤其是,输入值也可以是时间相关的,例如,输入值可以是采样信号的时间序列。因此,由于这种时间依赖性,输入到第二工作单元的输入值(在其当前)可能不同于输入到第一工作单元的输入值(先前),或者在该方法的进一步过程中,当输入值被一个工作单元重复使用时,该一个工作单元处理不同的当前输入值。然而,为了简单起见,总是参考“输入值”而没有明确提及任何时间相关性。

第一或第二条件可以是纯粹的技术性质。例如,如果在机器控制系统中使用该方法并且总输出值表示例如用于电动机的控制参数,则一个条件可以是控制参数必须位于技术上指定的范围内,例如低于受控电动机的最大速度。

尤其是,条件还可以至少部分地具有非技术性质。这可能涉及道德伦理方面或经济方面。

例如,对于其中使用人工学习系统作为控制系统的自主交通工具,道德伦理方面是相关的。例如,如果该控制系统例如基于由自主交通工具捕获并由控制系统评价的相机图像或激光雷达图像确定即使在完全制动而没有转向校正的情况下也不再能够避免与另一交通工具的碰撞,则该控制系统将确定能够避免碰撞的各种可能的转向校正。例如,一种可能的转向校正可能导致危及行人,而另一种可能的转向校正可能导致与墙壁的碰撞。第一条件之一可以是不应该直接危及人的生命,由于该条件,导致行人危险的转向运动可以相对于其他解决方案被排除或抑制。这种基本评价可以导致第一输出值与第一评价的交互。道德伦理方面也可以在该示例中的两个剩余选项中起作用(没有转向校正和与其他交通工具的碰撞;转向校正和与壁的碰撞),因为例如应当避免危及其他交通工具及其乘员。在该示例中,例如对于第二输出值所基于的更详细分析,这将是可能的第二条件。在该示例中,第一条件表示绝对考虑,而第二条件表示相对考虑。

这种道德伦理或经济考虑可以以适当的方式编码为条件;例如,作为以自动运行程序的形式进行某些折衷的合同。从这个意义上说,条件构成道德契约。

条件是“规范的准则”,即在每种情况下争取但不可实现的规则。因此,这些条件不是在每种情况下必须满足的绝对条件。因此,总输出由工作层次确定,由此通过各个输入值的评价层次影响工作层次,以尽可能最好地观察条件的方式确定总输出。

因此,本发明使得有可能考虑在由根据本发明的用于处理输入值的方法控制或监视的技术系统中不具有直接技术特性的方面。

经济考虑的一个示例是在生产工厂的机器控制中使用该系统,一方面,应该尽可能快地生产尽可能多的产品(即,应该产生高收入),但是另一方面,这导致较高的磨损。因此,原则上这是经济和技术考虑的混合。

优选地,重复地执行步骤a)-d),直到预定的第一时间段已经过去和/或第一输出值在预定的第一公差内的连续重复之间不再改变和/或第一评价指示已经至少在某种程度上满足第一条件;优选地,当完成该重复执行时,第一输出值被用作总输出值。

优选地,重复执行步骤e)-h),直到预定的第二时间段已经过去和/或第二输出值在预定的第二公差内的连续重复之间不再改变和/或第二评价指示已经至少在某种程度上满足第二条件;优选地,当完成该重复执行时,第二输出值被用作总输出值。

优选地,该方法包括在总体或总序列存储器中存储总记录的总序列,每个总记录包括相互对应的输入值和/或第一输出值和/或第一情况数据和/或第一评价和/或第二输出值和/或第二情况数据和/或第二评价;其中,优选地,为总记录和/或包括在总记录中的值或数据提供相应的时间信息和/或编号。

优选地,该方法包括补充第一和/或第二条件,使得分别对于第一和第二情况数据,在补充之前分别不满足第一和第二条件,分别满足或至少在一定程度上满足补充的第一和第二条件;其中优选地仅改变第二条件而第一条件保持不变。

优选地,当步骤e)-h)的重复由于第二时间段已经过去而中止时,或者进一步优选地,由于第二输出值不再在第二公差内改变时,补充第二条件,使得在中止时存在的情况数据满足补充的第二条件。

优选地,第一和/或第二条件的完成或补充基于第一或第二条件不能满足(或不能达到一定程度)的存储的总序列。

优选地,整体系统包括投影层次,其中第一和/或第二情况数据的形成由投影层次执行。

优选地,第二分类将第一分类的至少一个类别分类成多个子类和/或对于第一条件中的至少一个,由多个第二条件暗示一个第一条件。

优选地,第一条件以规则的形式给出,第二条件以规则分类的形式给出;其中每个规则被分配一个规则分类,该规则分类表示相应规则的一个子部分,特别是划分成多个层次;其中优选地提供了其中存储了规则和规则分类的存储器;其中进一步优选地,规则分类被细分为通过区块链链接的层次,其中规则和/或规则分类在每种情况下以智能合约的形式实现,和/或其中,如果必要,当补充第二条件时,添加进一步层次的细分。

该工作层次优选地被设计成使得在步骤a)中确定第一输出值需要更短的时间段并且在步骤e)中确定第二输出值需要更长的时间段;和/或其中该评价层次被设计成使得在步骤c)中确定第一评价需要更短的时间段并且在步骤g)中确定第二评价需要更长的时间段;其中在两种情况下,在每种情况下,较长的时间段优选比较短的时间段长至少2倍,特别是至少5倍。

优选地,第一和第二输入值作为连续时间输入信号或作为离散时间时间序列给出,并且进一步优选地,第一和第二输入值全部或部分相同。

工作层次优选包括第一和第二人工学习工作单元;其中第一人工学习工作单元被设置为接收第一输入值并确定第一输出值;其中第二人工学习工作单元被设置为接收第二输入值并确定第二输出值;并且其中,在工作层次中,基于第一输出值和/或从第一输出值导出的值来形成一个或多个第一调节函数,所形成的一个或多个第一调节函数被应用于第二人工学习工作单元的一个或多个参数,一个或多个参数影响第二人工学习工作单元中的输入值的处理和输出值的获取。

在最简单的情况下,情况数据可以是例如相应输出值本身。取决于由第一和第二工作单元所形成的在工作层次内的支配来形成第一和第二情况数据。即,如果第一工作单元占支配地位,则至少基于第一工作单元的第一输出值来形成第一情况数据(例如,第一工作单元的输出值和/或从其导出的值被用作情况数据);另一方面,如果第二工作单元占支配地位,则至少基于第二工作单元形成第二情况数据(例如,第二工作单元的输出值和/或从其导出的值被用作情况数据)。

优选地,第一评价和/或从其导出的值被用作第一人工学习工作单元的评价输入值;和/或基于第一评价和/或从其导出的值来形成一个或多个第二调节函数,所形成的一个或多个第二调节函数被应用于第一人工学习工作单元的一个或多个参数,一个或多个参数影响第一人工学习工作单元中的输入值的处理和输出值的获得;和/或第二评价和/或从其导出的值被用作第二人工学习工作单元的评价输入值。

评价输入值是输入值的一部分,并且是待分析的输入值的附加输入值,从而可以相应地改变第一输出值。在步骤a)的第一次执行之前,并且如果输入值显著改变,表示存在新的情况,则可以初始化第一评价以指示满足所有第一条件。

评价层优选地包括第一和第二人工学习评价单元;其中第一人工学习评价单元被设置为接收第一情况数据并确定第一评价;其中第二人工学习评价单元被设置为接收第二情况数据并确定第二评价;以及其中,在评价层中,基于第一评价和/或从其导出的值来形成一个或多个第三调节函数,所形成的一个或多个第二调节函数被应用于第二人工学习评价单元的一个或多个参数,一个或多个参数影响第二人工学习评价单元中的输入值的处理和输出值的获取。

该方法优选地包括在第一序列存储器中存储第一评价集的第一评价序列,该第一评价集包括该第一评价单元的输入值以及相关联的第一评价,这些第一评价集尤其被提供有相应的时间信息和/或编号;和/或在第二序列存储器中存储第二评价记录的第二评价序列,第二评价记录包括第二评价单元的输入值和相关联的第二评价,第二评价记录尤其是被提供有相应的时间信息和/或编号;第一和/或第二评价进一步优选地考虑所存储的第一或第二评价序列来确定。

保存第一/第二评价序列使得有可能跟踪评价单元的“决策”,并且如果必要的话,例如如果它们不按需要工作,则使用评价序列来执行进一步的训练。

优选地,存储以密码保护的形式进行;其中优选地在每种情况下使用一个区块链,由此相应区块链的区块包含第一评价记录、第二评价记录或总记录中的至少一个。

优选地,该方法包括:从另一系统接收输出值;从接收的输出值形成第一和/或第二情况数据;分别基于从所接收的输出值形成的第一和第二情况数据,由评价层次确定第一和/或第二评价;当所确定的第一和/或第二评价指示分别满足第一和第二条件时,确定另一系统是兼容的。

如果系统在它们的评价中彼此不矛盾,即其中一个系统根据其条件分类的评价单元的输入值(情况数据)在适当时考虑公差,特别是在逐步评价的情况下,不被另一个系统根据其(其它)条件分类为不允许的,则其评价单元通常测试不同条件的系统在这里被称为“兼容的”。

根据本发明的系统包括工作层次和评价层次,并且适于执行根据本发明的方法;其中工作层次适于接收输入值,并且其中优选地评价层次不能接收输入值。

该工作层次和该评价层次优选地分别在至少一个计算单元(作为硬件和/或计算机程序)中实现,其中在实现该工作层次的至少一个计算单元进一步优选地与在其中实现该评价层次的该至少一个计算单元不同,特别是分开。如果其中实现了工作层次或评价层次的相应至少一个计算单元包括多个计算单元,则它也可以被称为相应的计算系统。相应的至少一个计算单元(或计算系统)经由用于数据交换的相应(有线和/或无线)接口彼此连接。工作层次和评价层次可以例如在不同的控制设备(计算单元或计算系统)中实现。不同的移动无线电设备也是可以想象的。还可以通过永久安装在机器中的控制设备(计算单元/计算系统)来实现工作层次,并且在移动计算单元(例如移动无线电设备)中实现评价层次。

该系统优选地包括投影层次和/或总序列存储器。

优选地,在系统中,工作面包括第一和第二人工学习工作单元,评价层次包括第一和第二人工学习评价单元;其中人工学习工作单元和/或评价单元优选地分别包括具有多个节点的神经网络,其中进一步优选地该一个或多个参数分别是以下各项中的至少一项:神经网络的节点的加权、节点的激活函数、节点的输出函数、节点的传播函数。

优选地,分类存储器被分配给第一工作单元、第二工作单元、第一评价单元和第二评价单元中的每一个,其中第一工作单元、第二工作单元、第一评价单元和第二评价单元被设置为在生成输出值或评价时执行输入值或评价的分类。第一工作单元、第二评价单元和第二评价单元被设置为在生成输出值或评价时将输入值或情况数据分类为一个或多个类别,类别被存储在相应的分类存储器中,类别中的每一个被构造为一个或多个依赖层次;并且该第一工作单元和/或该第一评价单元的分类存储器中的类别和/或层次的数目优选地小于该第二工作单元的分类存储器中的类别和/或层次的数目,该第二评价单元的分类存储器中的类别和/或层次的数目进一步优选地大于该第一评价单元的分类存储器中的类别和/或层次的数目。

优选地,在系统中,第一和第二人工学习处理单元分别作为硬件和/或计算机程序在第一和第二计算单元中实现和/或执行,第一和第二计算单元通过第一接口互连;可选地,第一接口被设置为形成一个或多个第一调节函数。独立地,优选地在系统中,第一和第二人工学习评价单元分别在第三和第四计算单元中作为硬件和/或计算机程序实现和/或执行,第三和第四计算单元通过第三接口互连;可选地,第三接口被设置为形成一个或多个第三调节函数。优选地,第三计算单元和第一计算单元通过第二接口互连;可选地,第二接口被设置为形成一个或多个第二调节函数。第一、第二、第三和/或第四计算单元可以彼此完全或部分不同(分离)。尤其是,其中实现了工作层次的上述至少一个计算单元包括第一和第二计算单元,即第一和第二计算单元可以被认为是其中实现了工作层次的计算系统。同样,在其中实现评价层次的上述至少一个计算单元特别包括第三和第四计算单元,即,第三和第四计算单元可以被视为其中实现评价层次的计算系统。在此还可以想到的是,第一计算单元是与第二计算单元不同的(单独的)计算单元和/或第三计算单元是与第四计算单元不同的(单独的)计算单元。

优选地,至少一个,优选所有的计算单元与存储器相关联,存储器连接到或被包括在相应的计算单元中;其中进一步优选地,与第一计算单元相关联的存储器被布置为存储第一分类,和/或与第二计算单元相关联的存储器被布置为存储第二分类,和/或与第三计算单元相关联的存储器被布置为存储第一条件,和/或与第四计算单元相关联的存储器被布置为存储第四条件。

该系统可以优选地进一步包括:至少一个输出模块,用于向用户输出第一和/或第二输出值,其中输出模块包括以下各项中的至少一项:屏幕、触摸屏、扬声器、投影模块。

根据说明书和附图,本发明的其它优点和实施例是显而易见的。

应当理解,上述特征和下面要解释的特征不仅可以在每种情况下所指示的组合中使用,而且可以在其它组合中使用或单独使用,而不脱离本发明的范围。

通过附图中的实施例示例示意性地示出了本发明,并且在下面参考附图对本发明进行描述。

附图说明

图1示出了彼此耦合的两个人工学习单元的组合;

图2示意性地示出了各种示例性调节函数;

图3示出了在两个耦合的神经网络中的丢弃过程的应用;

图4示出了具有附加定时器的如图1所示的系统;

图5示意性地示出了如图1所示的具有相关联的分类存储器的系统;

图6示出了具有三个耦合的人工学习单元的替代系统,

图7示出了根据本发明的具有工作层次、评价层次和投影层次的示例性整体系统;以及

图8示出了根据本发明的具有两个人工学习工作单元、两个人工学习评价单元和投影层次的示例性整体系统。

具体实施方式

图1至图6以及它们下面的描述涉及人工学习工作单元和人工学习评价单元。在图1至图6的描述中,因此使用术语“人工学习单元”或“人工地学习单元”,其可以代表“人工学习工作单元”和“人工学习评价单元”。如结合图1至图6所描述的那样耦合的人工学习单元被称为“人工学习系统”。

图1示出了具有两个链接的人工学习单元110、120的示例性实施例,这将在下面更详细地描述。人工学习单元110、120一起形成人工学习系统。在下面的解释中,人工学习单元被示例性地设计为神经网络,其尤其例如通过使用如箭头112、122所示的输出值作为相应网络的输入来反馈。

在这种情况下,提供了第一人工学习单元(这里是第一神经网络110的形式),该第一人工学习单元实质上可用于对输入信号X

在可能的实施例中,第一神经网络110可以用作分类网络,其用于粗略地和快速地对输入值进行分类,然后,基于分类结果,通过调节第二网络的参数来相应地影响第二网络。为此目的,第一神经网络可以是具有相对少层次的网络,其具有带有几个类别K

因此,第一神经网络应该在短时间内传递可用的输出,利用该输出可以有意义地影响第二神经网络。可以从第一神经网络110的输出值输出1来生成权重和函数,其可以叠加在第二神经网络120的自生成权重和函数上。这意味着第二神经网络最初独立地工作并且不完全采用第一网络的输出值或从其获得的参数。第二神经网络120最初也可以通常的方式独立地训练,从而具有自生成的权重。

第二神经网络可以比第一神经网络复杂得多,特别是具有更多的层次和/或存储器类别。与第一网络相比第二神经网络的复杂度增加的程度可取决于应用而不同地确定。第二神经网络的输入值或输入数据优选地与第一神经网络的输入值相同,从而现在可以用相同的数据执行更复杂的分析。然而,可替换地,第一神经网络的输出值也可以至少部分地用作第二网络的输入值。特别是在第二网络的复杂度显著不同的情况下,例如,可以提供第二网络,也用作第一网络的输入值的原始输入值作为输入值被馈送到该第二网络,并且另外第一网络的输出值被用作第二网络的输入值。

图2示出了各种调节函数f

尤其是,调节函数f

作为示例,图2中示出了八个不同的时间相关调节函数,其中通过将原始参数乘以如图2所示的值来给出调节函数。示例a)示出了简单的二进制阶梯函数,其中值零被指定直到指定时间,然后大于零的值被指定。这里,第二值原则上可以是1,但是也可以具有不同的值,从而原始参数被另外分配因子。这样,例如,加权与时间相关地接通和断开,或者与时间相关地放大。示例b)示出了其中指定了具有小于零的第二值的阶梯函数的类似情况。同样,作为实例a)和b)的变型的替代方案,可以想到阶梯函数包括不等于0的两个或更多不同的值,使得该层次根据时间相应地升高或降低。

示例c)示出了也可以应用于第二网络的任何参数的周期性调节函数,并且这样将取决于时间周期性地放大或衰减某些元素。例如,也可以为不同节点和/或不同层的这种功能选择不同的幅度和/或周期。此时可以使用任何周期函数,例如正弦函数或甚至非稳定函数。取决于函数与第二网络的自生成函数的连接类型,可以只选择正或负函数值。

示例d)示出了层次的缓慢连续的临时增加和减少。另一方面,示例e)描述了具有低函数值的简短的近似矩形的高层次,该函数值也可以可选地为零。类似地,实例f)示出了不规则分布且非常短的峰或尖峰,这些峰或尖峰因此导致在非常短的时间段内层次增加或改变。这里,峰具有不同的幅度,并且可以采用正值和负值(相对于基本值)。对于实施例e)和f)的变型,可以存在峰或扩增的规则的、周期性的和时间上完全不规则的(例如随机确定的)分布。例如,较短的层次增加可以位于第二神经网络的决策周期的时间内,而较长的层次变化可以在几个决策周期上延伸。

图2中的示例g)还示出了阻尼振荡,其也可以被任意设计为具有不同的阻尼和振幅。最后,示例h)示出了围绕基值的不同振荡的时间序列,由此尤其是,振荡的周期长度不同,而振幅保持相同。不同振荡的这种组合也可以被设计为相加叠加,即拍频。

通常,任何调节函数都是可以想到的,并且图2所示的函数仅被理解为示例。尤其是,所示的示例功能的任何组合都是可能的。还应当理解,取决于调节函数的期望效果,在所有示例中示出的基线可以以0或以另一基本值运行。在调节函数与相应调节函数的纯级联的情况下,基本值0和函数值的相应增加可以确保各个节点仅以时间相关的方式对处理做出贡献,并且在其它时间被切断。另一方面,在基本值为1的情况下,例如,利用图2a)的示例,应用于权重的调节函数首先将调节网络的自生成权重再现为基本值,然后,从阶梯的较高值开始,相应地增加权重。因此,这样的函数作用于诸如激活函数的函数的调节。

如所描述的,可以基于第一人工学习单元的输出值形成调节函数,即在本示例中基于第一神经网络。输出值和由此形成的调节函数之间的关系可被任意设计。例如,该关系可以至少部分地在耦合网络的联合训练阶段中生成。在其它实施例中,可以预定义调节函数与第一网络的输出值之间的相关性,例如,可以将调节函数作为图中所示的函数之一给出,其中层次偏移的幅度由输出值确定。可选地,还可以决定在某些输出值处,首先不发生第二网络的调节。

可替换地或者除了将调节函数应用于第二神经网络的权重和函数之外,还可以应用耦合的丢弃方法,如图3所示。这通常是用于神经网络的训练过程,其中在每个训练周期中仅使用隐藏层和输入层中存在的一些神经元,而不使用其余神经元(“丢弃”)。为此,现有技术通常基于网络的反馈误差来设置丢弃率,该丢弃率确定总网络的一部分由被关闭的神经元组成多大。类似地,代替神经元,可以关闭神经元之间的一些边缘或连接。

神经元和/或边缘的这种部分断开现在也可用在示例性实施例中的第二神经网络中,由此现在不基于网络本身的误差反馈来使用丢弃参数,而是如在依赖于第一神经网络的输出值的时间相关调节的情况下那样。由此,例如,可以基于第一神经网络310的输出值输出1来确定第二神经网络的丢弃率,然后将其应用于第二网络。该图再次示出了如图1中的两个耦合的网络310、320,由此现在将第二网络320的神经元或节点326、328示意性地表示为圆圈。连接边缘未示出,并且所示出的神经元的布置不旨在与其实际拓扑具有任何强制关系。经由丢弃速率,现有神经元的一部分现在被失活并因此不被使用。第二网络的活动神经元326在图中以阴影线示出,而未填充神经元旨在表示非活动丢弃神经元328。

以一般的方式,通过使用0或1作为权重的调节函数或例如每个单独节点的输出函数,这里描述的耦合丢弃也可以被理解为调节函数f

通常,丢弃可以确保神经网络的工作速度增加。它还防止相邻神经元在它们的行为上变得太相似。可以在两个网络耦合的联合训练阶段和已经训练的网络中使用如上的耦合的丢弃。

为了确保耦合的神经网络以有意义的方式彼此互补,可以确定在任何给定时间哪个神经网络支配整体系统。其输出值确定整体系统的输出的网络可被描述为支配网络或支配。在下文中,假设在两个或多个耦合的网络的组中只有一个网络是支配的,并且支配网络的输出等于整体系统的输出。然而,原则上也可以想到其他实施例,从而例如在多于一个支配网的情况下指定描述将支配网的输出值处理为最终总输出值的规则。

在示例性实施例中,可以为此目的实现定时器或定时元件,该定时器或定时元件为一个或多个耦合神经网络设置时间限制。该时间规范应当优选地被理解为最大值或时间上限,在该最大值或时间上限之后,相应网络的输出值必须是可用的,从而输出也可以更早地可用。最后,在为特定网络指定的时间过去之后,评价该网络的输出值。因此,定时器可以基于固定时间规范来控制和/或改变耦合网之间的支配。

在图4中示出这种类型的示例性实施例。两个神经网络410、420的设计和耦合可以对应于图1中已经描述的示例。定时器440现在确保第一神经网络410的输出最迟在由预定时间参数值定义的预定时间之后被评价。所需时间可以例如从输入值X

在由第一网络410的时间参数指定的时间段(这里是30ms)期间,第一神经网络将以通常的方式处理输入值X

一旦已经将调节函数f

在这种情况下,第二神经网络420还可以可选地在由所获得的调节函数f

可选地,网络410、420中的每一个可以继续连续地处理和评价输入值,即使当由于当前时间跨度而确定另一网络是整体系统中的支配网络时。尤其是,在示出的两个耦合的网的例子中,第一网可以连续地评价输入值,即使当支配是第二网时,并且因此整体系统的输出值对应于在第二时间段已经过去并且第二网络已经找到解决方案之后的第二网络的输出值。以这种方式,诸如这里描述的第一网络410的快速分类网络(其彻底评价可用的输入值)也可以执行短期干预,只要找到的输出值找到它们进入整个输出的路径。下面更详细地描述这些实施例。

作为借助于定时器中的预定时间周期的这种时间控制的结果,整体系统可以在早些时候做出决定,并且例如已经能够在不必完成第二神经网络的最终评价和详细分析的情况下动作。作为示例,考虑自主驾驶系统中的情况,该情况将由具有至少两个耦合的网络的这种系统来评价。通过第一单元或第一神经网络,可以实现早期分类“危险”,该早期分类还不包括危险类型的进一步评价,但是可能已经导致立即反应,诸如交通工具速度的减慢和制动和传感器系统的激活。同时,基于分类,即在由第一网络的输出值进行的调节的影响下,第二神经网络对情况进行更深入的分析,这然后可以引起基于第二网络输出值的整体系统的进一步反应或改变。

还可以想到的是,不为每个耦合的网络指定时间限制,而仅为一个网络指定时间限制(或者,如果耦合了两个以上的网络,也仅为耦合的网络的子集指定时间限制)。例如,在上面的例子中,定时器可被用于第一快速分类神经网络,而第二网络不被给予固定的时间限制,反之亦然。这样的实施例还可以与用于确定当前支配网络的其它方法组合,这将在下面更详细地描述。

在具有插入的定时器的所有实施例中,可以提供的是,当前具有活动定时器的神经网络的输出值被用作整体系统的输出。由于对于给定的输入值,网络需要达到第一解决方案的时间,所以存在一定的延迟时间,在该等待时间内(第一或第二网络的)先前的输出值仍然可用作总输出值。

如果定时器或定时仅被定义用于一些耦合的网,例如定时器仅对第一网有效,则可以定义例如整体系统的输出通常总是对应于第二网的输出,并且如果定时器对第一网有效,即预定时间段有效运行并且还没有期满,则仅由第一网的输出代替。

在具有多于两个网的系统中,通过对准预定时间跨度和改变定时器,特别是如果具有不同任务的多个网将同时达到结果,进而对一个或多个其它网有影响,也可以使网络彼此之间的可感知同步成为可能。类似地,通过调整指定的时间周期和过程,也可以在多个单独的整体系统中实现同步,每个系统包括多个耦合的网络。例如,系统可以通过时间对准来同步,然后根据相应的定时器规范来独立但同步地运行。

除了基于定时器改变整体系统中的相应支配神经网络之外或作为其替代,每个神经网络本身还可以以协作的方式对支配的转移做出决定。这可以意味着,例如,整体系统的第一神经网络处理输入值并到达某个第一解或某个输出值,例如根据在训练阶段期间训练的分类来实现将输入值分类到某个类别中,并且在实现该分类时,将支配转移到整体系统的第二神经网络。

与借助于定时器的重心变化一样,这里可以规定,整个网络的输出值分别对应于当前支配网络的输出值。

为此,例如,可以评价输入值的变化。只要输入值基本上保持不变,耦合的网络之间的支配分布也可以基本上保持不变,和/或仅基于定时器来确定。然而,如果输入值突然改变,则可以设置超越耦合的网的其它支配行为的预定支配。例如,对于突然改变的输入值,可以确定在任何情况下支配首先返回到第一神经网络。这还重新启动用于该第一神经网络的可选可用定时器,并且如前执行该过程。例如,如果传感器值检测到新的环境,或者如果先前评价的过程已经完成且现在将触发新的过程,则可能发生输入值的显著变化。

阈值可以以显著性阈值的形式指定,其可用于确定输入值的变化是否应被认为是显著的并导致支配的变化。也可以为不同的输入值或为每个输入值指定单独的显著性阈值,或者可以提供例如以百分比偏差形式的一般值作为评价输入值变化的基础。同样,代替固定的显著性阈值,可以存在可以随时间或自适应地并且取决于情况而改变的阈值,或者它们可以是函数、矩阵或模式,基于这些函数、矩阵或模式可以评价改变的显著性。

可替换地或附加地,可以取决于为每个网络找到的输出值来改变耦合的网络之间的支配。例如,取决于实施例,第一神经网络可以评价输入值和/或它们的变化。在这种情况下,对于第一神经网络可用于分类的类别,可以在每种情况下预定义重要性阈值,使得在第一神经网络的结果引起为输入数据找到的类别中的显著变化的情况下,立即进行向第一神经网络的支配转移,使得可以进行情况的快速重新评价,并且如果需要,可以进行反应。以这种方式,还可以防止尽管由第一快速分类网络识别的输入情况显著改变,第二神经网络继续在深度上分析不必要的长时间而不考虑该改变。

在所有上述示例中,整体系统的输出值可以进一步以任何方式使用,例如作为致动器的直接或间接控制信号,作为存储以供将来使用的数据,或者作为传递到输出单元的信号。在所有情况下,输出值也可以首先由附加功能和评价进一步处理和/或与其它数据和值组合。

图5再次示出了如图1所示的具有两个单向耦合的网络510、520的简单实现方式示例,由此现在针对每个网络示意性地示出了分类存储器512、522。这里使用的分类类型Ki最初是次要的,并且将在下面更详细地描述。尤其是,第一网络512和第二网络522的两个分类存储器的尺寸和结构可以显著不同,从而形成具有不同速度和焦点的两个神经网络。因此,例如,如已经简要描述的,可以实现快速、粗略地分类网络和较慢但更详细的分析网络的交互以形成耦合的整体系统。

在本示例中,第一神经网络510形成有相对较少的分类K1、K2…,Kn,其例如也可以仅遵循平坦的分层结构,使得分类仅在一个维度上进行。优选地,这样的第一网络510还可以在其拓扑上相对简单,即具有不太大数量n的神经元和隐藏层。然而,原则上,网络拓扑也可以基本上与分类无关。

第二神经网络520于是可以具有明显更大和/或更复杂的分类系统。例如,该存储器522或底层分类也可以在多个层次524中分层地构造,如图5所示。第二网络520的类K1、K2…Km的总数m可以非常大,尤其是明显大于第一神经网络510所使用的类的数目n。例如,类的数目m、n可以相差一个或多个数量级。这实现了单个网络在整体系统中的非对称分布。

然后,第一神经网络510的快速分类可用于快速分类输入值。抽象、概要类别可优选地用于此目的。然后,在一个示例中,检测到的状况的分类(例如,基于诸如图像和音频数据的传感器数据)最初可以由第一神经网络510作为“大的、可能危险的动物”来执行,而不对此进行任何进一步的评价。这意味着,例如,在第一网络中没有根据动物种类(狼、狗)或作为危险的捕食者进行进一步的分类,而是仅根据最广泛的可能的一般特征如尺寸、检测到牙齿、攻击姿势和其它特征进行分类。基本上对应于输出“危险”的该数据然后可以可选地已经被传递到用于初步和快速反应的适当外部系统,例如用于用户的警告系统或自动系统的特定致动器。此外,第一神经网络510的输出输出1用于生成如上所描述的第二神经网络520的调节函数。

相同的输入值X

总的来说,对于这种具有非对称分类的耦合的整体系统,可以设想,例如,快速分类的第一网络510的类别Kn主要执行抽象分类,例如新的/已知的情况、危险的/不危险的事件、感兴趣的/不感兴趣的特征、所需的/不需要的决策等,而不进入深度。该第一分类不一定必须对应于由第二单元520最终找到的最终结果。然而,通过至少一个快速和一个深度分析单元的两级分类因此允许人工学习整体系统的感觉类的或本能反应。例如,如果通过可能是蛇的图像识别来识别对象,则“最坏情况”优选地可以是第一分类的结果,而不管该分类是否可能是正确的。在人类智力的情况下作为进化知识和本能反应存在的内容可以由具有预编程知识的快速第一分类代替,使得相应的标准反应(保持距离、启动运动、激活增加的注意力)也可以由整体系统及其致动器执行。然后,基于该第一分类的第二学习单元的附加调节可以被类似地理解为情绪相关叠加,即,例如,对应于自动启动与被理解为无害的情况不同的有意识情况分析的恐惧反应。由调节函数执行的第二神经网络的参数的叠加可由此造成必要的移位到其它分类空间中,否则这些空间是默认或不是立即到达的。

因此,这样的系统可以用于各种应用领域,例如在发生关键决策情况的所有应用中。示例包括驱动系统、用于不同类型危险的救援或警告系统、手术系统以及通常复杂和非线性的任务。

在至此描述的实施例中,只有两个人工学习单元被耦合在一起。然而,该思想原则上也适用于多于两个的单元,使得例如三个或更多个人工学习单元可以以相应的方式耦合,由此可以确定哪些单元可以调节特定的其它单元或若干其它单元的参数。

图6示出了一个示例,其中可以提供三个神经网络610、620、630(和/或其他人工学习单元),由此第一网络610的输出值产生用于第二网络620的权重和/或函数的调节函数,并且由此第二网络的输出值进而产生用于第三网络630的权重和/或函数的调节函数。以这种方式,可以形成任何长度的人工学习单元的链,其通过叠加以耦合的方式相互影响。

类似于具有两个神经网络的较早示例,在一个实施例中,所有耦合的网络可以接收相同的输入值,并且仅可通过各个网络的调节来耦合处理。然而,还可以设想这样的实施例,其中例如在如图1所示的两个神经网络之后提供第三神经网络,其接收第一和/或第二网络的输出值作为输入值。可选地,该第三神经网络的函数和/或权重也可以由调节函数进行调节,调节函数例如由第一网络的输出值形成。这些调节函数可以与为第二网络形成的调节函数相同或不同。或者,例如,可以使用第三网络的输出值来形成附加的调节函数,然后将其递归地应用于第一和/或第二网络。

应当理解,相应地耦合的学习单元的各种进一步的组合是可能的,其中至少两个连接的单元通过形成用于单元的描述性参数的调节函数而具有耦合,尤其是对于用于网络的权重和/或函数的神经网络的情况。随着耦合单元的数量增加,调节和耦合的更复杂变化也是可以想到的。

如最初已经指出的,这里描述的实施例被描述为关于神经网络的示例,但是原则上也可以被转移到其他形式的机器学习。考虑所有的变型,其中有可能通过基于输出值的叠加或调节由第一人工学习单元影响至少一个第二人工学习单元。可以用控制或描述这种学习单元的操作的任何适当参数的相应调节来代替通过借助于来自前述示例的调节函数的叠加对神经网络的权重和函数的修改。在每个示例中,术语“学习单元”可以由神经网络的特殊情况代替,并且相反地,示例性实施例的所描述的神经网络也可以分别以人工学习单元的形式的通用形式来实现,即使在相应的示例中没有明确地陈述。

除了神经网络之外,已知的示例包括进化算法、支持向量机(SVM)、决策树和诸如随机森林或遗传算法的特殊形式。

同样,神经网络和其它人工学习单元可以彼此组合。尤其是,例如,可以用任何其他人工学习单元来替换先前示例中的第一神经网络,其被示出为快速分类单元。还可以选择性地选择尤其适合于快速、粗略的特征分类的方法。这样的第一学习单元的输出值然后也可以被使用,如对于两个神经网络所描述的,以形成用于第二人工学习单元的调节函数,该第二人工学习单元尤其又可以是神经网络。

如上所提及,包括多个耦合的人工学习单元的系统形成“人工学习系统”。

除了所描述的变型之外或可替换地,通过添加对人工学习系统的结果进行评价或验证并影响人工学习系统根据该评价获得结果的实例,可以进一步改进由两个或更多个耦合的人工学习单元组成或包括两个或多个耦合的人工学习单元的人工学习系统。根据本发明,为此目的使用另一个人工学习系统。下面解释包括两个人工学习系统的整体系统的结构和功能。

评价/验证其他人工学习单元的结果或它们的结果的这种人工学习单元被称为评价单元。相反,处理或分析输入值并得到由评价单元检查的相应结果的人工学习单元被称为工作单元。人工学习单元(特别是神经网络)的函数,即输入值到输出值的映射,由参数确定,例如如上所描述的函数和/或权重。

整体系统的基本结构和功能

图7示出了包括工作层次710和评价层次730的整体系统(或处理和评价系统)的基本结构,工作层次710和评价层次730都是人工学习系统,即,它们包括耦合的人工学习单元,并且如上所描述被构造或起作用。此外,整体系统包括投影层次750和整体序列存储器760。

整体系统处理输入数据或输入值X

设置工作层次710以处理或分析输入值X

第一输出值的确定优选地在相对于确定第二输出值所需的时间的短时间段内完成。由此,第一分类相对于第二分类包括很少的类。因此,第一输出值基于输入值的粗略分析,而第二输出值基于输入值的精细分析。

在投影层次750中,基于第一和/或第二输出值形成第一情况数据Y(t3)和第二情况数据Y(t4)。因此,第一情况数据至少部分地基于第一输出值,第二情况数据至少部分地基于第二输出值。例如,在最简单的情况下,情况数据本身可以是相应的输出值。进一步地,还可以至少部分地基于其它值来形成情况数据。然而,优选地,基于第一输出值形成第一情况数据,并且基于第二输出值形成第二情况数据。此外,可选的存储元件可被分配至投影层次作为投影存储器(图7中未示出;参见图8),其中可以存储在投影层次中出现的数据。

投影层次750可以被设计为软件和/或硬件单元或多个这种单元的组合。尤其是,投影层次可以形成多个单元的组合,其还可以包括人工学习单元及其存储元件。由此,投影层次750可以形成中央单元,在该中央单元中至少工作层次的输出被处理和链接,例如多路复用器单元、从数据生成序列的单元、在肯定或否定评价之后在所存储数据或序列上印上标识符或标签的单元,其例如可以在将新数据与所存储数据进行比较时简化决策。这些功能也可以全部或部分地由程序模块执行。投影层还可以包括输入和/或输出单元,例如屏幕或声学单元,其使得可以与用户或支持例如系统的训练阶段的用户通信,并且例如评估当前处理状态。

在投影层次750中形成的第一/第二情况数据形成评价层次730的输入。工作层次730被设置为将第一评价(输出21)和第二评价(输出22)确定为输出,第一评价和第二评价指示第一情况数据是否或以何种程度满足预定的第一条件,或者第二情况数据是否或以何种程度满足预定的第二条件。作为人工学习系统的评价层次因此被训练以确定输出值,称为第一/第二评价,其指示第一/第二情况数据是否或何种程度满足预定的第一/第二条件。评价可独立地为简单的是/否评价(例如,评价可仅采用值0或1)或指示满足条件的程度的逐步评价(例如,评价可采用从0到1的所有值)。因此,在本申请的上下文中,短语“是否满足条件”或类似的短语尽管并不总是明确地提及,但也旨在包括在某种程度上满足条件的情况,因此应以“是否满足或满足何种程度的条件”或类似的意义来理解。该系统现在可以被设置成基于这些评价来拒绝或以其他方式修改这些工作单元的输出值,尤其是以便通过该工作层次来影响这些输入值的处理。

第一评价的确定优选地在相对于确定第二评价所需的时间段的短时间段内进行。因此,给出了相对少的第一条件(特别是小于1000,优选小于100)和相对多的第二条件。因此,第一评价指示是否或在多大程度上满足粗略条件,而第二评价指示相对于第一条件是否或在多大程度上满足精细第二条件。

第一和第二评价(输出21、输出22)现在影响第一和第二输入值X

总的或整体输出在任何情况下基于工作层次710的第一和/或第二输出值。第一或第二输出值被认为是在特定时间的总输出优选地由工作层次确定,但是也可以由定时器控制,该定时器可以被认为是工作层次的部件。这里还可以想到使用第一和第二输出值的组合作为总输出。因此,工作层次710受评价层次730的影响仅对总输出有间接影响;在这个意义上,第一和第二条件不表示绝对限制。

因此,当处理输入值时,第一/第二输出值(输出11、输出12)由工作层次710从第一/第二输入值X

该过程以多次迭代或重复方式重复自身,其中受评价层次的评价影响的工作层次试图确定根据第一/第二条件的总输出或第一和/或第二输出值。通常,可能出现不可能找到满足所有条件的这种总输出(或第一和/或第二输出值)的输入值X

每个重复/迭代产生相应的数据,其可以包括第一和第二输入值、第一和第二输出值、第一和第二情况数据、第一和第二评价以及总输出。尤其是,设想这些元素中的一些或优选地全部将形成称为总集或整体集的数据集。

总之,根据迭代序列产生总记录或整体记录序列或总序列或整体序列。总集或整体集序列可被存储在总序列存储器760中。这由将总序列存储器连接到三个层次的虚线表示。在存储期间,总记录优选地按照它们的顺序或次序加时间戳和/或编号和/或排列。优选地,每次输入值显著改变,即超过预定公差时,开始存储新的总记录序列。所存储的完整组的序列尤其可被用于跟踪整体系统对输入值的处理。

条件的解释及其对整体系统的影响

(第一/第二)条件可以是简单的条件,例如,检查情况数据是否位于某个值范围内。然而,(第一/第二)条件也可以更复杂,例如具有规范规则R1到Rn的形式。

(第一/第二)条件可以是技术条件。例如,可以在机器中检查电机的速度(其例如由工作层次基于振动传感器数据和输出来分析)是否在允许的速度范围内。另一规则是取决于操作状态(其也由工作层次使用传感器数据记录)进行这种速度检查。

此外,规则还可以是非技术性质的,诸如“不得杀害任何人”(R1)或“任何人的自由不得受到限制”(R2)或“不可以说谎话”(R3)。可以经由通常的参数化之一来设计规则实现或规则破坏,例如0=无规则破坏,1=规则破坏或分级细化。这些规则可被实现为第一条件,规则实现或规则中断的参数化则对应于第一评价。第二条件然后可以表示规则R1至Rn到规则分类K1至Kn的更精细细分。这些是规则的例外、添加或改变。这些是这些规则的例外、添加和替代。这些规则分类最初以这样的方式构造,即在规则分类K1中给出R1的例外,在K2中给出R2的例外等等。在规则分类中命名的一些情况下,相应的规则Rx可以被破坏。规则R3的示例性规则分类K1y可以是:“如果人们在告诉真相时受到严重损害,则允许撒谎”。这些规则原则上仍然适用,但仅仅是简单的,只要不必应用规则分类。因此,第二条件(规则分类K1至Kn)表示第一条件(规则R1至Rn)的更精细的细节。

可以提供存储第一和第二条件的存储器。存储器或规则R1至Rn的结构以及规则分类可以尤其是对应于图5中所示的结构,由此相对粗略的规则R1至Rn被存储在存储器512中,并且相对精细的规则分类K1至Kn及其到层次524的更精细细分被存储在存储器522中,由此m优选地等于n。

优选地,规则和/或规则分类,即第一和特别是第二条件,将被存储在区块链中,其中规则以所谓的智能合约的形式实现。智能合约可被视为映射规则或规则分类并检查其合规性的计算机协议。

如果使用规则分类,则根据情况将该条件记录并存储在另一个存储器(特别是整个序列存储器760)中,由此这优选地在区块链中进行,以确保不能修改该记录。因此,存储整体序列或整体评价序列。规则R3的原理有效性不被规则分类所讨论。在工作层次或整体系统的工作模式中,在动作序列的情况下,它将产生工作层次和评价层次之间的调整和评价的迭代链,从而在区块链中存储与情况相关的协调解决方案序列,其中评价层次指出与工作层次的规则冲突并对它们的修改提出建议,但不决定未来的动作。动作决定,即系统的整体输出,仅经由工作层次作出,因为它直接涉及外部情况和解决方案策略,而评价层次优选地仅间接地提供有已经经由投影层次压缩的信息。

该基本原理的示例性扩展是,评价层次还包括在冲突情况下在其搜索中的具有违反规则R1…n风险的整体序列(优选为区块链决策路径),并且检查先前采取的解决方案。就自学习系统而言,为了不会再次提交错误,还必须注意整个序列中的每个文档(优选为区块链文档)所采取的动作的成功或失败。

在该原理的进一步扩展中,例如,在与规则R1冲突的情况下,不仅可以在规则分类K1及其子分类中搜索链接或耦合、修改等,而且可以在所有优选分类中搜索以查看是否存在先前未知的组合来解决该情况,即使其他规则分类实际上不属于规则R1。

在该原理的进一步扩展中,在成功或失败的情况下,通过插入新的、成功的规则分类,并且如果必要,删除不再是当前的或已经证明是不利的现有规则分类,可以对规则分类存储器进行改变。这产生具有刚性规则集的自学习评价系统(整体系统),并且同时产生灵活的分类系统。这些变型尤其能够实现“硬AI系统”。

整体系统的示例性具体设计

图8示出了整体系统的示例性实施例,其中工作层次由与其耦合的第一人工学习工作单元810和第二人工学习工作单元820形成,并且评价层次由与其耦合的第一人工学习评价单元830和第二人工学习评价单元840形成。人工学习工作和评价单元分别可以是神经网络,其函数由参数确定,特别是由函数(例如传递函数f

第一工作单元810被设置成根据第一输入值X

两个工作单元810、820之间或两个评价单元830、840之间的耦合对应于结合图1至图6所解释的连接。因此,基于第一工作单元810的第一输出值(输出11),形成了调节函数f

整体系统优选地再次包括投影层次850,结合图7的内容应用于该投影层次850。此外,可选的存储器元件被分配给投影层次850作为投影存储器852,在投影存储器中,来自投影层次或由投影层次提供的数据(尤其是情况数据)以及第一和第二输出值可以至少临时存储。例如,通常可以确定该数据的存储时间段,但是也可以由单元之一确定,例如由第一评价单元确定。根据实施例,投影层次存储器本质上可以用作短期存储器,其内容可以根据需要被检查、删除、重写和/或传送到其它存储器,例如各个神经网络或单元的存储元件。因此,投影存储器852可以被设计为例如环形存储器,在其中在每种情况下,在一定数量的条目或一定数量的数据之后,存储器是“满的”,并且因此从一开始就重写先前的数据,这对应于环形结构。

同样,所示的实施例再次包括整体序列存储器860,结合图7的内容再次适用于该整体序列存储器。虚线再次指示总序列存储器860可以从两个工作单元、两个评价单元和投影层次接收数据或与它们交换数据,并且这些单元还可以优选地访问存储在总序列存储器中的数据。

工作层次(即第一和第二工作单元)或由它们形成的第一和第二输出值受评价层次(即第一和第二评价单元)或由其中形成的第一和第二评价的影响如下实现。

根据图8所示的实施例,旨在通过第一评价单元830的第一评价(输出21)来影响第一工作单元810。这一方面可以通过使用从它们导出的第一评价或值作为第一工作单元810的附加(除了X

此外或可替代地,第一评价单元830可以优选地根据以上描述的耦合,尤其是结合图1至图6耦合至第一工作单元810。因此,在第一评价单元830的第一评价(输出21)的基础上,可以形成第二调节函数f

此外,第二评价影响第二工作单元820的函数。这可以通过使用从它们导出的第二评价或值作为第二工作单元820的附加(除了X

此外(图中未示出),基于第二评价单元840的第二评价(输出22),可以形成第四调节函数f

工作单元810、820和评价单元830、840可以分别具有存储器,尤其是分类存储器,其中存储了分类或条件。结合图5详细解释相应的存储器结构。在图8中,作为示例,仅针对第二评价单元840绘制存储器842。存储器可以与单元分开设计,或者也可以包括在相应的单元中。

第二评价单元的存储器842(以及第一评价单元的对应存储器)可以包括(除了分类存储器之外)序列存储器,更具体地,第二序列存储器,其用于存储评价序列。在第二评价单元的情况下,这涉及存储一个(或多个)第二评价序列,该第二评价序列包括第二评价集,每个第二评价集包括第二评价单元的输入值集(第二情况数据)以及由第二评价单元从中获得的第二评价。可以为评价集提供相应的时间信息和/或通过编号来编号和/或根据它们的顺序来排列。同样地,在未示出的第一评价单元830的存储器中,可以包括第一序列存储器,其类似地用于存储包括第一评价集的第一评价序列,第一评价集分别包括第一评价单元的输入值集(第一情况数据)和由第一评价单元从中获得的第一评价集。

工作层次和评价层次都可以包括另外的人工学习单元,每个人工学习单元都如图6所示耦合。因此,工作层次可以包括第三(并且可能是第四、第五……)工作单元,其通过由第二(或在前的)工作单元的输出值确定的调节函数耦合到第二工作单元(或相应的在前的工作单元)。同样地,评价层次可以包括第三(以及可能的第四、第五……)评价单元,其通过调节函数耦合到第二评价单元(或耦合到相应的在前的一个),调节函数由第二(或在前的)评价单元的评价确定。相应的第n个工作单元和评价单元之间的相互作用于是可以像第二工作单元和第二评价单元之间的相互作用那样发生,即,尤其是,第n个评价单元影响第n个工作单元。

输入值的示例性处理

下面通过示例描述输入数据的结果处理或分析。输入数据形成工作单元810、820的输入值。输入值对于两个工作单元可以是相同的或不同的,例如在时间序列中的不同时间。输入值X

第一工作单元810根据输入值X

如果(基于第一评价)确定第一条件不满足或仅满足一定程度,则输入值X

这可以迭代多次,直到确定满足第一条件,在次处,第一输出值可以用作系统的(总)输出或总输出值。随后,输入值然后可以由第二评价单元820处理和/或支配可以传递到第二评价单元。这样产生的第二输出值然后可以附加地或替代地成为总的或整体的输出,可能取决于支配。

可替代地或另外地,如果例如不可能满足所有的第一条件或仅有有限的时间段是可用的,例如在实时系统中,第二工作单元820的处理和/或第二工作单元的支配也可以优选地在预定的时间段(由定时器控制)之后,在已经达到预定次数的迭代之后,当第一输出值不再在两个连续迭代之间的预定公差内变化时终止,或当第一评价不再在两次连续迭代之间的预定公差内变化时。这些的组合也是可以想到的。

如果支配返回到第一工作单元810,例如在输入值X

可选地,尤其是如果第二工作单元820占支配地位,情况数据也可以由投影层次850基于第二工作单元820的第二输出值(输出12)形成,并由第一评价单元830评价,即检查第二输出值是否符合第一条件。如果不是或仅部分是这种情况,则第二工作单元也可能受到(现在改变的)第一评价的影响,类似于第一评价对第一工作单元的影响,由此在此不应当使用调节函数,尤其是不应当调节由第一调节函数调节的第二工作单元820的参数,即函数f

由第一评价单元830形成的第一评价还经由耦合,即借助于第三调节函数f

第二评价单元840接收在投影层次850中形成的第二情况数据(其不必与由第一评价单元830接收的第一情况数据相同)作为输入值。优选地,该第二情况数据是基于至少第二人工学习单元820的第二输出值(输出12)形成的,即,第二情况数据可以包括部分或全部第二输出值或从其导出的值;此外,还可以至少部分地基于第一人工学习单元810的第一输出值(输出11)或其他值来形成情况数据。

当第二工作单元820处理输入值X

通过由这些第二评价来影响该第二工作单元,总体上,至少如果这些第二评价不是所有的第二条件都被满足并且该第二工作单元已经被相应地训练,则产生经修改的第二输出值(输出12),从该经修改的第二输出值由该投影层次进而形成经修改的情况数据,如果必要的话,这些经修改的情况数据被该第二评价单元检查并且产生经修改的第二评价。

这可以在多次迭代中重复,直到例如达到预定次数的迭代,预定时间段已经过去或者第二输出值不再在两次连续迭代之间的预定公差内改变。这些或其它条件的组合也是可以想到的。

因此,第二评价单元840与第二工作单元820之间的相互作用对应于第一评价单元830与第一工作单元810之间的相互作用。然而,另外,由于两个评价单元的耦合,第二评价单元840的评价,即第二评价,受到第一评价单元810获得的第一评价的影响。由此,优选地以这样的方式控制该定时,使得首先进行第一工作单元与第一评价单元之间的相互作用,并且然后发生第二工作单元与第二评价单元之间的相互作用。

尽管以上已经将输入值的处理呈现为各个人工学习单元中的连续处理步骤的处理,但是应当注意,单元(第一、第二工作单元,第一、第二评价单元)原则上可以彼此异步地工作,即,每个单元可以使用当前可用的输入数据或调节(其是其他单元的部分输出)根据其自身速度工作。可以但不必提供时间同步。因此,这些单元可以彼此并行地工作。

训练

下面描述整体系统的示例性训练。如上所说明的,在监督学习中,给出输入值和对应的(即,与相应输入值相关联的)期望输出值(即,已知的训练数据),并且在训练期间相对于指示由人工学习单元确定的输出值与期望输出值之间的偏差的误差测量来最小化误差。所使用的典型误差测量是平均(可能加权的)平方误差。在训练期间改变人工学习单元的参数(例如权重)以最小化误差。该方法本身是本领域技术人员已知的。

以这样的方式训练系统,即首先单独地训练工作层次和评价层次。这些表示“人工的/人工地学习系统”,结合图1-图5解释其训练。因此,在上述监督学习中,当训练工作层次时,使用输入值(包括传感器数据)作为输入值,并且使用相应的(已知的)期望的输出值(控制参数,状态参数)作为输出值,并且当训练评价层次时,使用状况数据(由输出值或控制参数/状态参数形成)作为输入值,并且使用相应的(已知的)期望的评价(指示条件满足的程度)作为输出值。

此外,在工作和评价层次的耦合操作期间,可以修改或补充条件(见下文)。这个过程可以看作工作和评价层次的联合学习,即整体系统的联合学习。

关于工作层次和评价层次,参考图8中所示的实施例,在两个层次的每一个中,包括第一人工学习单元810、830和第二人工学习单元820、840,它们以类似于图1-图5的方式耦合。这里,尤其是,在一个层次内,最初执行两个(第一/第二)单元中的每一个的独立训练(即,单独地并且独立于耦合单元),由此可以将输入值的相同训练数据集用于两个单元,或者可以使用输入值的不同训练数据集。第一和第二单元之间的不同在于相关联的期望输出值(其对应于输入值,即,其优选地应当在训练中实现),由此第二单元的期望输出值优选地表示第一单元的期望输出值的某种细化。例如,可以设想第一单元的期望输出值是第二单元的期望输出值的真实(非平凡)子集,也可以设想在误差测量中使用用于某些输出值的偏差的不同权重。此外,可以执行耦合(第一/第二)单元的联合训练。这里,可以包括第一和第二单元的误差,由此可以不同地加权第一和第二单元的误差。在联合训练中,还可以产生第一单元的输出值与调节函数的相关性,经由这些调节函数影响第二单元。

第一/第二序列存储器

保存第一/第二评价序列使得有可能跟踪评价单元的“决定”,并且如果必要的话,例如如果它们不按照期望工作或起作用,则使用评价序列来执行进一步的训练。

此外,评价单元830、840可以在确定评价(输出21、输出22)之前或与之并行地将输入的情况数据Y(t3)、Y(t4)与以评价序列或集存储在序列存储器中的评价记录进行比较,即,将输入的情况数据与存储的评价记录中的相应情况数据进行比较。如果发现这些数据是相同或相似的,即相同或相似的情况数据在较早的时间出现,则可以从评分序列中读取较早的评价,并将其用作输出,即对当前情况数据的评价。尤其是,可以跳过其中出现相同或相似情况数据的评价记录,并且如果适用的话,可以跳过在相应序列中跟随它的评价记录。因此,较早的评价被用作对输入的情况数据Y(t3)、Y(t4)的当前评价,输入的情况数据取自在相应评价序列中的稍后时间出现的评价记录(为此目的,评价记录有利地被提供有时间戳,根据其出现的顺序来编号和/或排列)。“相似”应理解为在每种情况下具有适当选择的公差。

可以跳过最大数目的评价记录,直到评估指示已经达到预定数目的跳过评价记录和/或时间信息指示在评价序列内和/或在相应的评价序列中已经经过了预定时间段,与评价序列中的先前条目相比,评价单元的输入值(情况数据)在预定公差内不变。该过程可引起过程流的加速。

第一和/或第二评价序列在第一或第二序列存储器中的存储优选地以密码保护的形式执行,以便保护其免受操纵。尤其是,为此目的提供了区块链的使用,由此序列的条目(例如第一评价序列的一个或多个评价记录)形成区块链的区块。因此,块在每种情况下包括至少一个估值记录,并根据区块链原理链接到存储在先前块中的先前估值记录的序列。

复杂性结构

优选地提供的是,工作层次和评价层次的复杂性结构是如具体结合图1和图5所描述的来设计的,即,该第一工作单元对这些输入值进行相对粗略的分析或划分成相对少的类别,并且与之相比,第二工作单元执行相对精细的分析或划分成相对多的类或子类以及进一步的层级,并且第一评价单元还检查第一情况数据或第一输出值是否满足相对粗略的条件,并且第二评价单元检查第一情况数据或第一输出值是否满足相对粗略的条件。其中,第一评价单元还检查第一情况数据或第一输出值是否满足相对粗略的条件,相比,第二评价单元检查第二情况数据或第二输出值是否满足相对精细的条件。

第一评价单元830可以被分配分类存储器(未示出),该分类存储器被设计成具有相对较少的层次和类别。在本示例中,假设第一评价单元830的层次和/或类别的数目显著小于作为分析单元提供的第二工作单元820的层次和/或类别的数目,例如小一个或多个数量级。类似地,第二评价单元840的层次和/或类别的数目可以显著大于第一评价单元830的层次和/或类别的数目。此外,第二工作单元820的层次和/或类别的数目可以显著大于第一工作单元810的层次和/或类别的数目。存储器也可以进一步不同,但是在这种情况下,存储器大小和复杂度之间的明显不对称性通常将占支配地位。

调节或补充条件

如关于图7所解释的,可能存在这样的情况,其中整体系统未能找到第一/第二输出值,即,整个输出,使得导出分别与所有第一和第二条件一致的第一/第二情况数据。由于从第一工作单元到第二工作单元以及相应地从第一工作单元到第二工作单元的支配转变,这尤其涉及表示系统的最终总输出的第二输出值或第二情况数据。

因此,优选地意在执行条件的改变或补充,优选地第二条件的改变或补充,使得对于这些情况中的至少一些,相应的输出值或情况数据被认为满足补充的条件。因此,发生影响未来输入值的处理的系统调节。

然而,优选地,对于不是所有条件都可以满足的所有情况,不执行这样的条件添加,但是仅仅当满足某些条件时。一个可能的条件是所有条件中只有一定数量或百分比(例如,20%或10%或5%)不能满足,而其他条件满足。

可以在输入值的正常处理期间和/或在某些时间区间使用存储在总序列存储器中的总序列来实现条件的添加。如果使用存储的总序列,则它可以用作补充条件的先决条件,该条件是在相同类型的总序列的某个最小数量(例如10、50或100)中(在某个公差内)不满足该条件,即,对于这些总序列,当使用补充条件(根据未满足的类型,包括可能的公差)来补充该条件时,认为满足该条件。

在作为神经网络的评价单元的简单示例中,当条件被添加/改变时,值的范围可以被添加到对应于该条件的神经元的输出。因此这里神经元被分配给条件之一。例如,神经元具有输出功能,使得该神经元的输出作为数值在-1和+1之间的范围内。在初始训练中,网络可能已经被训练,使得如果满足条件,则该神经元输出从-0.1到0.1的区间中的值,并且如果不满足条件,该值位于该范围之外。如果现在出现不满足工作层次的输出的条件的情况,即神经元输出不在区间[-0.1;+0.1]的值R,并且如果条件要被补充,则值R可以作为有效值被添加到区间。优选地,不仅加上值R本身,而且加上围绕值R的小范围,例如R±0.01。添加该条件的原因可以是满足上述条件中的一个,例如该条件是不满足的唯一一个或多个中的一个,或者在多个总序列中出现在R±0.01范围内的输出。

进而有两个区间,即[-0.1;+0.1]和[R-0.01;R+0.01]。如果在处理将来的输入值时,神经元的输出位于这两个区间之一中,则认为满足了对应的条件。在进一步添加的情况下,可以将更多的区间添加到这两个区间中,使得该条件由一组区间表示。这些区间可以存储在评价单元的分类存储器中。

当然,类似于该示例,条件也可以与多个神经元相关联,在这种情况下,神经元的输出位于作为n维空间的子集的总值范围中,其中n等于与该条件相关联的神经元的数目。如果这些多个神经元的输出位于总值范围的一个或多个子集(对应于前述示例中的区间)中,则认为该条件被满足。然后可以以相同的方式完成这些子集。

原始条件和对条件的每次添加可以附加地提供有层次S的指示,其可以与条件/添加一起存储在评价单元的分类存储器中。原始的可以是例如第0级,S=0。于是,添加将具有较高层次,S>0。然后,例如通过指定层次,相关联的评价可以附加地指示满足条件的程度。或指定对应的值,如0.9

添加的层次可以取决于满足哪个和/或多少个引起添加的条件来确定。例如,如果先决条件是仅一个或多个条件未被满足,则该层次可以等于所满足的条件的最高层次加一。

通过这些阶段或层次,引入了条件的层次结构,可以说,利用该层次结构,原始条件变得越来越精细或更加有分支的。取决于层次或对应程度,再次通过影响工作层次,通过评价,优选某些输出值。

这种过程原则上可以在第一和第二条件下进行。然而,优选的是仅补充或改变第二条件。另一方面,第一条件应保持不变;也就是说,这些代表基本的、不变的条件。在如上述道德契约的条件的示例中(在本发明的公开部分中),第一绝对考虑将因此是不可变的,而第二相对考虑可以随时间改变,这取决于实际的总输出值。可以说,当在机器控制中使用该方法时,机器道德将演变。

与其他系统的兼容性检查

此外,当两个整体系统彼此通信时,第一整体系统能够评估第二整体系统的整体输出值和/或评估与它自己的评估兼容的程度,即与第一和第二条件一致。

根据第一实施例,第二整体系统将通常包括若干整体记录的整体序列发送到第一整体系统。然后,第一系统使用包括在总集中的输入值和/或情况数据作为其自己的工作或评价层次的输入值/情况数据,并将从其获得的第一/第二评价和/或第一/第二输出值与包括在所发送的总序列中的对应值进行比较。如果这些至少部分地匹配,则第一整体系统可以认为第二整体系统是可信的或兼容的(即,与第一/第二条件不矛盾),并且将例如从其接收的分析数据(即,由工作单元获得的数据)分类为正确的或兼容的,并且在其自己的处理中使用它们。否则,所接收的数据被分类为不正确的或不兼容的,并且不被使用或仅在一定程度上被使用。所接收的数据可以是在整体系统中用作输入值的数据。例如,如果两个总系统作为控制系统被包括在两个自主交通工具中,则数据可以包括速度、制动等。如果一个交通工具在另一个交通工具后面的一定距离处行驶,则可以取决于前方交通工具中的整体系统的可信赖性/兼容性来选择该距离(这里由评价单元检查的条件将包括例如在突然制动的情况下的交通工具特定制动减速,其可以随交通工具而变化)。

根据可替换地或附加地使用的另一实施例,可以在问题-回答过程中执行兼容性检查。在此替代方案中,第二整体系统不需要具有整体序列存储器,而是仅需要是从输入值产生输出值的系统。为此目的,第一整体系统从其整体序列存储器中取出一个或优选地多个整体序列,并将其中包含的输入值(问题)发送给用于每个整体序列的第二整体系统。第二整体系统处理这些并基于它们确定输出值,该输出值被发送到第一整体系统(应答)。第一整体系统将该答案馈送到其投影层次,或者可能直接馈送到评价层次,并且通过评价层次确定第一/第二评价。针对所有的整体序列重复。如果所有总序列的评价显示满足第一/第二条件,则第二总系统被分类为兼容的。可替换地或附加地,还可以执行从第二整体系统的响应确定的评价与包含在整体序列中的对应评价的比较,由此如果在比较中仅发现微小差异,例如在预定公差内,则将第二整体系统分类为兼容的。

这些方法的显著优点还在于条件本身未被公开给其它系统。例如,如果条件编撰道德-伦理规则,则这是有利的,道德-伦理规则本身不应该是可公开访问的,特别是如果它们已经如上被修改或补充。这同样适用于例如可能涉及商业秘密的经济方面。

当然,上述兼容性检查的可能性预先假定第二整体系统的输入和输出值的含义对于第一整体系统是已知的,从而它可以将它们分配给它自己的工作和评价单元的输入/输出。在自主交通工具的情况下,该分配例如可以是制造商特定的或以标准化形式作为规范给出或实现为接口。

投影层次的进一步信息

评价单元被训练成评价存在于投影层次850中或由投影层次形成的情况数据。情况数据可以是,例如,如已经提到的,输入数据,和/或来自两个工作单元810、820之一的输出数据,和/或另外的数据。例如,在投影层次850中也可以仅处理输出数据,可选地具有附加信息。然而,优选地,在投影层次中不使用工作层次的输入值X

此外,有可能在投影层次之前以某种方式处理或例如简化数据。响应于评价单元对情况数据的对应于分类或评价的处理,可以执行各种动作,尤其是影响工作层次,这些动作对整体系统的最终输出值和通向致动器、输出接口等的关联信号具有影响,和/或影响整体系统和尤其是被包括在系统中的其他单元的的进一步行为的动作。

还可以想到将投影层次中的数据彼此链接,以便产生至少一条附加信息。此外,可以存在指示例如某个输出值在什么时间被输出的时间参数。这种时间参数可以包括绝对时间指示,也可以包括取决于当前评价时间或另一参考时间的相对时间指示。同样,可以不指定固定的时间点,而是指定单元的一个或多个输入和/或输出值被分配的时间段。作为对实际时间参数的补充或替换,序列可以与数据的至少一部分相关联,使得即使在投影层次中没有明确的时间规范,也可以识别在哪个序列中存在的多个数据值被生成或处理,例如以投影层次中的输出值的分配编号的形式。

这样,投影层次中存在的数据,尤其是工作单元的输出值,可以形成例如时间序列。任选地,还可以标记这样的序列,使得例如指定某一时间段或指定的输出值属于定义的序列。为了进一步处理、存储或评价,然后可以将以这种方式形成的序列作为一个整体来处理。或者,可以一起处理属于相同时间周期或相同序列的不同输入和/或优选输出值,例如相互比较。通过在时间上将数据放置在投影层次中并将它们分组为可以再次访问的特定进程和序列,可以使类似存储器的构造成为可能。可以提供定时器(未示出)来控制这些工作单元之间的支配,该定时器也可以根据结合图4所描述的思想而被用在这个系统中。

优选为投影层次850提供的存储器852例如可以被设计为易失性存储器元件或以环形存储器或另一短期存储器形式的非易失性存储器元件。要在投影层次850中处理的数据可被储存在该投影存储器中。可以非常不同的方式来设计数据的储存持续时间和待储存的数据的选择。例如,最初可以指定固定的储存时间段。在该时间过去之后,可以丢弃和/或重写投影存储器中的数据。附加地或可选地,系统的一部分,例如评价单元830、840中的一个或两个,可以做出关于投影存储器中的数据是否至少部分地被传递到系统的另一元件的决定。为了防止数据丢失,可以在预定的储存时间段期满之前做出该决定。例如,评价单元之一可以决定储存在投影层次850或投影存储器中的一些或全部数据应当被传递到另一储存元件用于长期储存。这例如也可以是工作单元的储存元件之一。通过储存在系统中稍后评价新情况的其它单元的存储器中,已经被评价的情况因此可以以类似于经验的方式被合并。然而,原则上,也可以提供单独的存储器模块(未示出)作为长期存储器,其中它可以由单元之一固定或可定义,该单元可以访问储存在那里的数据以及访问到什么程度。

下面解释本发明的进一步细节和实施例。基于该第一和/或第二评价,可以决定该第一和/或第二工作单元的第一和/或第二输出值是否在有效范围或参数内,或者它们是否满足某些规范规则,即它们是否被允许作为有效(在条件或规则的意义上)解决方案,或者至少在某种程度上被允许。如果在此确定例如第一和/或第二工作单元的当前输出值(其在先前的示例中被确定为系统的总输出值)位于可允许的范围之外,则可以基于该评价来防止或停止整体系统的反应,从而例如不将先前获得的第一/第二工作单元的第一/第二输出值传递到致动器或接口。被评价为不允许的或无效的输出值然后可以被丢弃,但是也可以与该评价一起被储存,以便能够在以后的情况下例如通过比较来退回。以这种方式,通过不追求已经被识别为无效的解决方案或者仅追求具有较低优先级的解决方案,可以简化或加速对稍后检测到的情况的评价。可替换地,第一/第二输出值也可以用作总输出,例如如果不能找到满足所有条件的解,由此根据本发明的工作和评价层次之间的交互确保找到最佳可能的解。

不仅可以检查输出值和解决方案的可容许性,还检查它们是否特别好地对应于某些条件或规范,即表示可能的最理想解决方案。以这种方式找到的输出值然后可优选地用作整体系统的整体输出,或者可以存储在例如长期存储器中,以便能够快速检索将来找到的最佳解决方案。相反地,已经被评价为尤其不利或有利的输出值也可以被提供有对应的评价参数,该评价参数也可以被存储和/或进一步传输为链接到这些值。这些评价选项可以单独地或彼此组合地实现。

例如,可以基于评价单元的这种评估来做出传送和储存来自前面描述的投影层次750、850的数据的决定。

在另一实施例中,还可以最初仅将用作第一和第二工作单元的输入值的系统的输入值存储在投影层次或其相关联的存储器752、852中。这可以被认为是当前情况的未处理图像。同时,第一和第二工作单元开始如前描述地处理这些输入值,即使用不同的可能性,诸如改变工作单元之间的支配并调节第二工作单元的确定参数和函数。

找到的解,即第一和/或第二工作单元的输出值,然后可以被传送到投影层次,由此它们可以重写相应的相关输入值,或者也可以被储存并与它们链接在一起。例如,取决于变型,从相同输入值获得的每个较新的结果可以重写较旧的结果。在其它情况下,可以将结果传送到投影层,同时保留较旧的解决方案,使得例如当前和先前解决方案的比较也可用于评价较晚或较早的结果是否更好地对应于评价系统的规范或条件。作为链接的示例,例如,就图像而言,可以考虑同时叠加的元素或者也可以考虑叠加的元素。

可选地,还可以考虑先前描述的耦合单元之间的支配,从而例如仅处理当前支配网络的输出值并将其存储在投影层次或其存储器中。在该过程中,时间参数可以再次链接到这些值。例如,可以定义具有相同或不同长度的时间段,然后将相应的输入值和输出值适当地分配给这些时间段,以便再现情况的时间序列。例如,在第一时间段中可以存储输入值,而在下一时间段中存储第一工作单元的输出值,然后存储第二工作单元的输出值。此外,然后可以将改进的或至少改变的输出值存储在另外的部分中。可以为每个输出值的块指定时间段,可以可选地将其标记为属于一起,以便阐明所识别的情况的序列。

在示例性实施例中,对投影存储器中或来自投影存储器的数据储存的控制也可以至少部分地由系统的多个单元来承担。例如,已经描述了一种情况,其中在具有所定义单元的支配的系统中,检查输入值是否改变超过预定水平,从而假定新的情况。在这种情况下,支配可以传递到第一工作单元以创建输入值的新的粗略分类。同时,第一工作单元然后可以向投影存储器发出信号,指示存储在那里的数据(对应于先前的情况)是否应当被传送到另一个存储器元件,例如长期存储器,或者它是否可以稍后被重写。类似地,取决于当前的处理操作,第一和/或第二工作单元可以调整投影存储器中的储存持续时间以响应不同的情况或目标。例如,如果需要长的、深入的解决方案搜索,则可以在投影层中设置较长储存持续时间,而快速的决定可以引起所储存数据的快速改变。

可选地,也可能的是,单元中的一个可以优先地决定例如储存持续时间,使得例如第一工作单元丢弃投影存储器中的先前数据的决定可以被第二工作单元检查或阻止,使得相应的数据仍然被储存,例如在重复输入值的情况下。此外,还可以想到的是,至少在有限的程度上,这些单元之一可以对另一个单元的分类存储器进行改变,并且例如创建新的类别。然而,也可以定义受保护区域,其中储存了不能被任何单元改变或删除的所有默认值。

如在图4所示的系统中,如果指定了能够测量时间区间并将该信息传递给单元的定时器,则该定时器例如还可以监视指定的储存持续时间。这样,储存时间也可以与系统的不同单元之间的支配分布协调或同步。然而,可替代地,可以为此目的提供该系统的另一部分。原则上,评价单元还可以改变和重新定义预定义储存时间段。这样做时,也可以为不同的值定义储存持续时间的不同规范。例如,可以规定,第一工作单元(例如是快速分类单元)的输出值仅在投影层次中储存短时间,从而为它们定义储存持续时间的第一时间规范,而第二工作单元的输出值具有储存持续时间的较长时间规范。还可以仅储存第一工作单元的输出值直到第二工作单元的输出值可用为止。可选地,可以首先等待评价单元对输出值的检查。如果确定第二单元的输出值由于它们不对应于预定条件而无效,则可以取消这些值的储存,同时继续保持第一工作单元的粗略输出值。

此外或可选地,评价单元还可以基于它们执行的评价进一步修改第一和第二单元之间详述的调节。

该系统可以被设计成使得评价系统不单独决定结果和输出值的有效性或无效性,而是与系统的其它单元相结合,例如通过影响处理参数、储存时间和其它元素。

在评价单元(即评价层次)被设计为评价或验证单元的情况下,这些可以例如包括基本上包含诸如禁止、优先级、规范规则和值类似规范的特征的分类。通过使这样的评价层次评价工作层次的输出值,可以确保只有那些解决方案被批准用于符合这些规范的整体系统。这些可以是系统的简单固定边界条件;但是它们还可以被进一步开发成类似伦理的模块,该模块将整体系统的开发和决策保持在由值和规则给出的方向上。这些边界条件尤其是通过评价层次中的分类来预定义的,这些边界条件可以优选地针对第一评价单元被稳固地定义和存储,而不被系统改变,并且优选地针对第二评价单元可以从预定义条件开始改变。因此,还可以想到,系统在工作和评价单元的交互中至少部分地自己学习这些分类,即对应于非监督学习,从而至少部分地形成其自己的价值系统或学习的一组边界条件。还可以使用这样的设计,其中预定义不可改变的边界条件的基本系统,然后可以在训练阶段的过程中或在操作期间和/或通过外部数据输入来补充这些条件。

由评价单元指定的条件既可被应用于耦合的网络的联合训练阶段,也可以应用于先前训练的系统的后续评价阶段。可选地,评价单元的分类存储器可以包含对应于多个封闭分类组的多个单独预置设置。如果需要,则可以例如取决于手头的情况来选择这些组中的一个。可以再次基于第一和/或第二工作单元的结果来识别手头的相应情况和分配待应用的分类组。这样,例如,可以实现系统的不同风险偏好或“基本情绪”。在这种情况下,也可以预定义基本设置,其仅在某些情况下改变。还可以想到,根据耦合的系统的训练和操作阶段中评价层次的不可改变的基本设置,主动地形成具有用于评价层次的附加或灵活边界条件的新分类组。

作为示例,在用于解救人的自主交通工具或飞行器(例如,无人驾驶飞机)的情况下,只要不携带乘客,特别是如果交通工具要快速到达预定位置,则可以允许更危险的驾驶方式。在例如可以由第一工作单元执行的情况(例如“警报情况”)的粗略识别之后,因此可以为第一评价单元选择对应的分类组,然后基于该分类组优选地由第一工作单元和/或还可能由第二工作单元评价解或输出值。类似地,在第二评价单元中选择可能更精细的分类组,由此该选择由于第三调节函数而受到第一评价的影响。以此方式,可以继续观察基本边界条件,例如避免事故,但是同时可以放松其他边界条件(例如快速转弯、接受损坏或其他)。一旦系统检测到新的情况,例如交通工具中乘客的存在,就可以分别对第一评价单元和第二评价单元应用不同的分类组,这现在可以更集中于乘客的健康或者甚至被解救受害人。在扩展的实施例中,还可以创建另外的标准目录,其可以用于在特定情况下的分类,例如在装载运输期间、在消防期间、在侦察飞行或侦察旅行期间以及其他情况下。如果可以将情况分类为这样的已知情况,则可以将评价层次限制为保持边界条件的有效性,并且只要不发生矛盾,就保持被动。然而,如果出现可能导致损坏或其他不希望的后果的更复杂或未知的情况,则评价层次还可以更积极地干预工作层次的解决方案查找,并且例如指定新的搜索空间、改变或调整工作单元的参数,或者以其他方式支持适当解决方案的查找。

这样,整体系统的框架条件,例如禁止、优先级和价值系统,因此位于评价层次的存储器中,优选地对于第一评价单元永久地编程,并且对于第二评价单元在一定程度上可修改。还可以通过排除某些解决方案来实现处理加速。评价层次可以通过诸如奖励和惩罚的动作或通过引入新的步长来积极地干预工作层次的解决方案发现。因此,工作层次的输出值也通过特殊类型的反馈而受到评价层次的影响。

作为进一步的选择,评价层次可以影响定时器和系统中各个单元的支配的关联确定,优选地在工作层次中,其在已经结合图4描述的多个耦合的单元的系统中实现。例如,评价层次可以检查用于支配转移的指定时间参数是否引起可感知的结果,或者是否应当指定时间段的不同分布或规范。这使得能够例如灵活地对需要比通常更粗略的归类的情况作出反应,并且例如必须在更短的时间内决定。因此,如果需要,可以使用从评价层次到定时器模块的信号来为每个耦合的人工学习单元设置一个或多个新的时间参数,然后在其基础上如已经描述的那样执行支配的进一步确定。类似地,在情况数据的时间评价之后,评价层次可以确定输入值以及由此待评价的情况非常快速地大量改变,或者情况长时间以准静态方式保持不变,并且在此基础上规定用于处理的其它时间参数。

图7和图8中描述的元件和处理步骤当然并不旨在局限于所示的具有四个人工学习单元的实施例。在所有实施例中,应当理解,各个元件,例如存储器元件、人工学习单元(神经网络),这些元件之间的连接也可以与这里所示的不同地实现。例如,当然还可以存在未在这些示意图中示出的其它存储器元件,或者这些存储器中的一些或全部可以是单个物理存储器元件的形式,例如通过寻址相应地细分。

上述各种子方法可以,特别是彼此组合地,引起关联和独立的作用系统。与仅在一个专门领域中训练的智能系统相比,这种系统可以覆盖更宽范围的应用。在传统系统中,数据处理对应于在多维空间中找到误差最小值或成功最大值。该空间具有的维数越多(通过分类、选项、分级层次),系统越可能卡在局部最小值或最大值中。另一方面,具有应用于权重、步长、函数和更多的调节函数的形式的第一单元对第二单元的先前描述的耦合和影响,允许取决于所定义的步长在搜索空间中跳跃到否则不会到达的最初未检查的区域。在该过程中,任务也可以在短时间内改变,如在每种情况下,快速检查新的解决方案空间是否相关。

例如,如果从输入值中辨识出潜在危险但不可识别的动物,对于该输入值,第一和第二工作单元都不能找到合适的图像图案,则该系统现在可以通过经调节的步长(例如随机引起的)跳到声音分析中,并且在那里找到由不可识别的动物记录的合适的声音。现在,以这种方式调节的第二工作单元可以检查找到的解是否可应用于先前不可分类的图像,这对应于关联的执行。

类似地,投影层次的引入可以复制关联行为,因为现在,例如,可以将决策(以输出值的形式)与先前的决策进行比较,并且可选地也进行评价。因此,代替基于积极或消极奖励的抽象学习能力,以关联的方式来完成评价系统。例如,如果系统在跳跃区域中没有找到更好的解,则它可以跳回到迄今为止最佳解的区域,该最佳解的区域由投影层次中的评价来确定并可选地储存,并且可以启动新的跳跃变型。以这种方式,例如,由第一单元进行的调节可以总是从基于由评价层次进行的评价而找到的合适的起始点进行。

作为可能的应用示例,应当考虑适合于用户的个人AI系统。理想地,这样的系统可以通过耦合多个人工学习单元来开发硬人工智能意义上的智能行为,人工学习单元尤其包括通过调节的反馈以及具有相应储存选项的评价层次。这样的系统应该优选地能够自由地关联和独立地分类问题。此外,特定于用户的行为应该是可能的,使得AI系统能够单独地响应用户,即,尤其是,它应该能够检测和/或学习用户具有的兴趣、特质、情绪、情感、角色特质和知识水平。

这里,这种和其它外部收集的数据可被添加到系统中。对整体系统的更新也是可能的,例如在某些限制内改变工作层次或分类和/或评价层次或条件。然而,优选地,设置有机制来完全防止从系统输出数据,特别是由于它在非常个人的层次上操作。因此,个人数据不应当向外部公开,并且可选地也是不可访问的。例如,还可以设想AI系统主要离线工作,即没有到外部通信网络或其它接口的连接。为了更新系统或加载背景知识和其它数据,然后可以建立时间受限的安全连接,例如,其可以完全由用户控制。例如,可以指定所添加数据的源,并且可以向用户给出是否同意该连接的选择。

可以提供系统的初始训练阶段,其中发生与外国人、预定义训练数据集和/或并非源自系统实际用户的数据的学习通信。该训练阶段可用于为主题、知识、经验和专业知识提供一般的基本设置,以便以后仅在特殊情况下必须求助于外部数据。还可以设置预定义的通信特征以及用于一般状态的学习过程和关联的初始深度。此外,可以在训练阶段中训练问题识别和对情况的适当反应以及关联通信过程。

在可以由制造商执行的该初始训练阶段完成之后,例如,可以由最终用户执行第二训练阶段。这里,例如,现在可以将时间参数设置给用户(同步)。通过从耦合的网络来学习和调整系统,先前初始设置的通信特征可以适应于最终用户(通过镜像或补充)。类似地,先前为一般用户设置的角色特征和兴趣现在可以适应于特定的最终用户。此外,在示例性实施例中,尤其是包括视觉评价的实施例中,投影层次可以生成其状态的当前图像并将其显示在屏幕上。然后,该叠加图像允许外部用户或训练者在工作阶段期间并且尤其是在训练阶段期间进行评价,该外部用户或训练者可以使用该图像来确定系统如何近似地评价当前情况。以此方式,有可能在早期阶段识别该系统是如何工作的,或者如果必要的话,干预以校正或修改某些方面并且因此加速训练阶段。

在这些训练阶段之后,系统优选地随时可用。然而,补充训练阶段也可以在以后使用。

取决于该实施例,AI系统可具有不同的接口来记录由用户执行的环境条件和动作以及用户的情绪和精神状态。为此目的可以使用各种传感器,例如照相机、麦克风、运动传感器、红外传感器,用于化学化合物的传感器(“人造鼻”)、超声传感器和任何其它传感器。这些可以单独地布置、分布和/或组合在适当的移动或静态对象中,以使得能够进行最全面的分析。另外,可提供AI系统可与用户通信的其它接口,例如用于语音输出的扬声器或用于视觉显示和文本表示的屏幕和其它显示装置。

在一个可能的实施例中,提供了一种为用户集成这种AI系统的对象。这可以是移动物体,例如技术设备(例如智能电话),但尤其也可以是家具或日常使用的物体,例如灯、花瓶、屏幕、镜子或在家中已经具有固定位置的其它物体。系统的任务是为用户个人提供人工个人智能伴侣。该系统建立用户的身份,并且例如如果安装在房间中的屏幕或投影的话,经由语音和/或图像与他或她通信。因此,输出被连接到接口(例如扬声器、屏幕、投影仪)。

基于上述发明要素,该系统可以对情况进行分类,引入储存的和学习的知识并进行关联。目的是提供启发、给出建议、桥接用户的孤独感和情绪低落、充当教练或还充当专业顾问/问题求解器。应用领域包括用作休闲伴侣(帮助厌烦、给予谈话冲动、娱乐、给予生活帮助);作为智力、科学、艺术冲动的鼓励者;为教练或顾问提供心理或智力支持,尤其是为精神病患者提供支持;作为各种日常情况(时尚、卫生、健康、职责、护理)的顾问;作为个人秘书,可以创建和使用广泛的知识数据库;作为最多样化游戏的游戏伙伴;以及其它。

尤其是,这样的系统可以在短期(例如当前的心情)和长期(例如用户的角色类型)适应用户。其中,经由投影层次处理并存储在长期存储器中的信息可用于此目的。理想地,系统可以配备有代码、生物计量用户识别(图像、语音、指纹、语音音调或其他特征)和用于此目的的其他访问控制选项。

优选地,可以用这种系统和所描述的处理步骤来实现道德-伦理系统。例如,个人智能伴侣可以鼓励用户和他的环境的满足和有用需求;它可以引起对适应于用户的类型、角色状况和心情的道德-伦理问题的注意,并且例如传播某些美德(帮助、慷慨、善良、勇气、智慧)。

通过评价层次中的适当条件,可以设置系统以避免损害、疼痛和痛苦,不仅针对用户,而且针对受其决定影响的所有人。在预期严重错误的决定情况下,个人服务员可以开始讨论,特别是争论某些行动过程的后果,并对备选方案提出建设性建议。不会优先考虑对行动做出规定,而是对行动应该或可能如何的理想做出规定。个人服务员可以识别困境情况并向用户指出,同时寻找备选解决方案或从中选择最有利的解决方案。特别是在用户艺术作品的情况下,个人智能伴侣仅经由预编程和学习的评价来提供支持的可能性。在这种情况下,反思可已经适应用户。该系统的关联能力在这里起重要作用。

作为实现方式的另一示例,描述了“智能镜”。在入口区域或浴室区域中已经存在镜子。在前面的一般示例中已经描述的输入和输出接口,例如各种传感器,可以容易地集成在镜子中。通过使用用户短暂但频繁传递的对象,可以在这种AI系统中实现多种可能性。

例如,合适的照相机、麦克风、运动检测器、超声传感器、人造鼻子、红外传感器等可用于收集关于用户和主要情况和用户习惯的各种信息,而不必主动输入。尤其是在入口区域中,也可以实施入口和出口控制。

这样,例如,智能AI系统可以警告用户衣着问题并给出衣着建议;它可以指出预期天气并且如果它检测到缺少必要器具,则指出这些必要器具。用户携带的物品可以被记录和识别。如果需要,可以在与用户的对话中澄清问题(通过语音或其它输入手段),例如是否需要,忘记或丢失了一些东西。

还可以包括由麦克风记录的评论,使得用户可以例如通过对情况或对象进行注释或主动地将它们指出用于记录来主动地支持这些过程。在一段时间之后,AI系统可以以这种方式知道几乎所有的物体、衣物及他们在公寓中的位置。如果正在搜索某物,或者如果用户有关于他或她的衣服、食物库存、书籍库存等的问题,则系统可以用提示来帮助。例如,当用户进入公寓时,可以告知他正在佩戴眼镜,并且可以断定眼镜必定在公寓内。

用于日常生活的预约日记、列表和其它支持帮助也可以由AI系统通过对话来管理。因此,该系统还特别适用于年老和生病的人或一般在日常生活中以某种方式受到限制的人。

通过对所记录数据进行适当评价,例如面部表情识别和对语音音调或其它数据的评价,系统可以在短期内记录用户的情绪,并且还基于此给出对应的指示,例如如果某人想要匆忙地开始长途旅行。例如,检测到的情绪可被包括在由上述实施例示例中的评价层次执行的评价中。

在这种情况下,检测选项以及对话不必绑定到对象,即在这种情况下是智能镜子。为了防止用户不得不在不合适的位置与AI系统进行长时间的对话,系统因此可以经由扬声器、麦克风和分布在公寓适当位置的其他设备启动或继续与用户的对话。AI系统本身的组件也可以分布在多个模块上,并且可以例如经由适当的无线或有线通信接口彼此连接。

对于这里提出的所有AI系统,优选地应当实施严格保护所记录和存储的数据,尤其是个人数据,尤其是提供密码保护的数据存储。为此目的,还可以集成识别系统,该识别系统可以从图像、声音以及从运动特征、语音重点的评价或任何其它生物统计特征可靠地识别用户。这可以防止个人信息在对话中被公开给客人或其他未授权的人。

可以单独地或以彼此和与上述实施例的任何组合来实施的其他可能的实施例总结如下:

例如,根据一个实施例,可以在具有多个人工学习单元的系统中实现一种方法,包括将输入值输入到至少第一人工学习单元和第二人工学习单元,由此获得第一人工学习单元的第一输出值。基于第一人工学习单元的输出值,可以形成一个或多个调节函数,然后将其应用于第二人工学习单元的一个或多个参数。一个或多个参数可以是以某种方式影响第二人工学习单元中输入值的处理和输出值的获得的参数。此外,获得第二人工学习单元的输出值。这些可以表示例如第二单元的调节输出值。

这样,两个人工学习单元被耦合在一起以形成人工学习系统,而不使用输入或输出值的直接反馈。相反,这些单元中的一个单元用于通过调节某些功能上相关的参数来影响第二单元的功能,从而产生与常规学习单元相比引起不同结果或输出值的新颖耦合。此外,通过在两个耦合的单元中处理输入值,可以在比传统系统更短的时间内或利用更深入的分析来实现结果,从而可以提高整体效率。尤其是,目前的问题被快速分类并考虑快速变化。

在示例性实施例中,人工学习单元(工作单元和评价单元)中的至少一个可以包括具有多个节点的神经网络,尤其是应用调节函数的人工学习单元中的一个。在这种情况下,该一个或多个参数可以是以下各项中的至少一项:神经网络的节点的加权、节点的激活函数、节点的输出函数、节点的传播函数。这些是确定网络中数据处理的神经网络的基本组件。调节函数可以用于叠加调节网络的现有的、自学习的和/或预定义的函数,而不是为节点定义新的权重或函数,这取决于第一人工学习单元的结果。因此,调节函数的这种应用尤其也可以发生在网络的训练阶段之外,从而在输入值的处理中实现两个或更多个网络的主动耦合。

根据一个示例性实施例,这些人工学习单元(工作和评价单元)中的至少一个、优选地每一个可以被分配分类存储器,其中这些人工学习单元中的每一个将这些输入值分类成储存在该分类存储器中的一个或多个类别,其中这些类别分别被结构化为一个或多个依赖层次,并且其中第一人工学习单元(第一工作/评价单元)的第一分类存储器中的类和/或层次的数目小于第二人工学习单元(第二工作/评价单元)的第二分类存储器中的类和/或层次的数目。通过以这种方式使两个耦合的人工学习单元的分类存储器不对称,可以进行具有不同目标的输入值的并行或时间相关的交替评价,例如输入值的快速分类与输入值的深度、较慢的分析的组合。

可替换地或者除了分类存储器的非对称设计之外,第一和第二人工学习单元的复杂度也可以被不同地设计,使得例如第一人工学习单元(第一工作/评价单元)具有比第二人工学习单元(第一工作/评价单元)明显更低的复杂度。例如,在神经网络的情况下,第一神经网络可以具有比第二神经网络明显更少的节点和/或层和/或边。

在一个可能的实施例中,该至少一个调节函数的应用可以引起该第二人工学习单元的参数的时间相关叠加,其中该至少一个调节函数可以包括以下特征之一:周期函数、阶梯函数、具有短暂增加振幅的函数、阻尼振荡函数、作为多个周期函数的叠加的拍频函数、连续增加函数、连续减小函数。这些功能的组合或时间序列也是可以想到的。这样,学习单元的相关参数可以以时间相关的方式叠加,使得例如输出值由于调节而“跳跃”到搜索空间中,这在没有叠加的情况下则不会达成。

可选地,第二人工学习单元可以包括具有多个节点的第二神经网络,其中应用至少一个调节函数引起节点的至少一部分的停用。这种类型的停用也可以被认为是基于第一人工学习单元的输出值的“丢弃”,并且还可以提供分类中新打开的搜索区域以及减少的计算工作量,从而加速该方法的执行。

在示例性实施例中,该方法还可以包括确定系统中的当前支配人工学习单元,以及从当前支配单元的输出值形成系统的总输出值。这样,系统中的两个或多个人工学习单元可以有意义地耦合和同步。

例如,至少直到第二人工学习单元(尤其是第二工作单元)的一个或多个输出值可用为止,第一人工学习单元(尤其是第一工作单元)可被设置为支配单元。以此方式,可以确保该系统在所有时间都是决策安全的,即该系统的反应在所有时间都是可能的(在该第一工作单元的第一次运行之后),甚至在该系统的所有现有人工学习单元已经对这些输入值进行了完全分类之前。

还可以通过系统的至少一个人工学习单元进一步应用当前输入值与先前输入值的比较,由此,如果比较引起高于预定输入阈值的偏差,则将第一人工学习单元设置为支配单元。以此方式,可以确保基本上改变的输入值(例如,通过传感器对新情况的检测)立即对输入值的新分析做出反应。

附加地或替代地,可以进一步进行第一人工学习单元的当前输出值与第一人工单元(尤其是第一工作单元)的先前输出值的比较,由此,如果比较引起高于预定输出阈值的偏差,则第一人工学习单元被确定为支配单元。通过评价输出值中的偏差,例如,如果与先前运行相比,存在偏差类别,则输入值中的变化也可以因此被间接检测到,其具有一定的显著性并且因此使得新的分类有意义。

在某些实施例中,该系统还可以包括至少一个定时器,该定时器储存与一个或多个人工学习单元相关联的一个或更多个预定时间段,该定时器被设置为每次针对一个人工学习单元,测量与该单元相关联的预定时间段的通过。例如,这样的元件形成了使系统的不同单元同步的可能性,并且形成了在期望或进一步处理某个单元的输出值时进行控制的可能性。因此,可以使用定时器来定义整体系统的可调节延迟时间,在该延迟时间内可以获得作为系统的整体输出值的决定。该时间可以是例如几毫秒,例如30或50毫秒,并且尤其可以取决于计算单元和可用计算单元(处理器或其它数据处理装置)的现有拓扑。

例如,一旦该人工学习单元被确定为支配单元,就可以开始为人工学习单元之一分配的预定时间段的测量。以这种方式,可以确保单元在预定时间内开发解决方案,或者可选地,确保数据处理甚至被中止。

在一个可能的实施例中,如果为第一人工学习单元预定的定时器中的第一时间段已经过去,则第二人工学习单元(尤其是第二工作单元)可以被设置为支配单元。这确保了在由另外的人工学习单元分析输入值之前基于第一人工单元的反应已经成为可能,而随后由第二单元更详细地评价数据。

在任何实施例中,输入值可以包括例如以下中的一个或多个:由一个或多个传感器检测的测量值、由用户接口检测的数据、从存储器检索的数据、经由通信接口接收的数据、由计算单元输出的数据。例如,它可以是由相机捕获的图像数据、音频数据、位置数据、诸如速度的物理测量、距离测量、电阻值,以及通常由合适的传感器捕获的任何值。类似地,数据可以由用户经由键盘或屏幕输入或选择,并且可选地链接到诸如传感器数据的其它数据。

应当理解,上述示例可以以任何方式组合。例如,在所描述的任何实施例中,还可以有结合图4所描述的定时器。类似地,在所有示例中,学习单元可以具有如结合图5作为示例描述的分类存储器。所有这些变型同样适用于多于三个或四个人工学习单元的耦合。

技术分类

06120116224593