一种基于发育型聚类的无人车智能迁移方法及系统

文献发布时间：2023-06-19 10:48:02

技术领域

本发明涉及无人车机迁移技术领域，尤其涉及一种基于发育型聚类的无人车智能迁移方法及系统。

背景技术

面向无人驾驶汽车正常行驶过程的主动安全技术，预防发生交通事故，已成为当前无人车技术的研究重点。无人车当前面临的主要困难是如何应对未知环境下的各种情况，及时做出合理的判断。因而使得无人车具备实时地感知交通环境中车辆、交通标志、行人等主要参与者的动态变化是十分必要的，这可以使得车辆能够及时准确地预警潜在的危险的能力，并做出相应的控制决策策略，必要时直接干预车辆操控，预防发生交通事故，保障驾乘人员的生命和财产安全。

针对于无人车从已知环境到未知环境的迁移，目前大多是采用基于深度模型的迁移方法，但模型的泛化能力并不是很理想，主要原因在于该类深度模型的结构固定，不能灵活变化，导致迁移能力差。上述基于深度模型的迁移方法中关键技术即为实现聚类，目前常用的主流聚类算法主要包括以下两类：另一类是基于增量数据形式的增量聚类方法，但是该两类聚类算法均存在一定的问题：

1、第一类：基于给定聚类模型条件下的批量数据聚类方法。批量数据聚类方法主要分为三类：一是按照先验知识设计聚类模型结构参数和初始模型参数，再利用样本对参数进行调整。如基于划分的聚类方法，包括AP算法、K-means及其优化算法；基于模型的聚类方法，如高斯混合模型(Gaussian Mixture Models)；基于神经网络的方法，如SOM算法等。二是对所有数据先进行预处理找出聚类模型参数，再对样本进行聚类。比如基于密度的DBSCAN及其扩展算法、CFSDP算法。三是可变结构的聚类方法，该方法将少量样本构成的小数据簇逐渐汇聚为大数据簇，算法执行中需要引入大量超参数，如基于层次的PERCH、GRINCH算法、基于网格的STING算法等。

但上述批量数据聚类算法普遍会存在以下问题：

(1)需要依赖先验参数：如K-means及其优化算法需要依赖簇数K；密度型算法对半径Eps和MinPts的设置敏感。如果先验参数设置不合理，将导致学习失败，需要调整参数后重新启动算法。(2)对数据的细分能力不足：在数据量较少的样本空间中，簇内样本的差异会被放大，算法实际应该倾向于样本区分；而随着数据量的不断增大，簇内样本的差异在更大的样本空间中缩小，算法实际应该倾向于样本间的融合。但批处理聚类算法得到的结果是固定不变的，细分的能力不会随样本的增多而变化，无法随着数据量变化作出适应性的调整。(3)小样本聚类时算法失效：样本太少导致大多数算法失效，即无法实现从0样本开始的发育式学习。(4)遗忘现象难以克服：如果在学习过的数据集中增加新样本，有可能破坏已学习好的成果，特别是对需要通过预处理获取聚类结构参数的聚类方法。例如在层次聚类算法中，新样本增加后会改变底层的链接关系，导致整个向上聚合的分类关系发生连锁变化。

2、第二类：基于增量数据形式的增量聚类方法。目前增量聚类方法通常包括两类：一类是将上述传统批量数据聚类算法调整为增量形式，例如增量K-means算法、增量DBSCAN算法以及增量CFSDP算法等；另一类是由底向上的聚合型层次聚类算法，例如层次BIRCH算法。但是这些增量聚类算法普遍存在一个问题，即需要人为设置先验参数来指导样本形成簇(簇相当于类，表示相似度高的样本被聚为一堆，相似度低的样本被聚到不同的堆里)，导致聚类结果对参数的设置敏感，从而很难适应在样本数量动态增长的数据库中发现知识。且如增量K-means算法不适用于非凸数据集，而且控制簇数变化的先验参数对应最终聚类结果影响很大；层次BIRCH方法最重要的一步是构建CF树，但构建过程中需要人为设置三个先验参数，导致聚类的结果可能和真实的类别分布不同；其次对高维特征的数据聚类效果不好，而且不适用于非凸数据集。

综上，目前主流聚类方式由于结构和参数都是依据经验及专家知识等预先进行设定，无法随样本的变化而实现逐渐发育，相当于算法的学习阶段和使用阶段完全是两个独立不相干的过程。而实际上，对于每一个新增数据，应当要能够根据已学习的结果对其进行合理判断，同时根据新增数据本身的信息对已学习结果进行调整，类似于人类的智能发育过程中学习和使用应当是相辅相成的。因而在无人车中使用传统基于深度模型的迁移方法，对于未知环境的迁移，是与已知环境的学习过程相互独立的，无法利用已知环境的学习结果对未知环境实现合理判断，也无法根据未知环境的信息对已知环境学习结果进行调整，致使迁移性能不佳。目前亟需提供一种能够应用于无人车中以实现智能迁移的方法，以使得能够将已知环境的学习结果与未知环境相互融合，实现样本的自我发育，提高迁移的性能。

发明内容

本发明要解决的技术问题就在于：针对现有技术存在的技术问题，本发明提供一种实现方法简单、迁移效率高且灵活性强、可扩展性好的基于发育型聚类的无人车智能迁移方法及系统。

为解决上述技术问题，本发明提出的技术方案为：

一种基于发育型聚类的无人车智能迁移方法，步骤包括：

S1.在学习阶段，获取历史已知环境下车辆输入感知信息、输出操作信息进行聚类，聚类时按照增量形式不断发育出聚类结果，即聚类过程中不断加入待聚类信息进行聚类，并获取各类所述输入感知信息与所述输出操作信息之间的对应关系，构建形成输入输出关联网络；

S2.当需要迁移至未知环境中时，获取未知环境下的新增输入感知信息，将所述新增输入感知信息与所述输入输出关联网络中的各类输入感知信息进行聚类，根据聚类结果将与所述新增输入感知信息同类的输入感知信息所对应的输出操作信息，迁移给所述新增输入感知信息。

进一步的，所述步骤S2中进行聚类时，根据平均最近邻距离确定控制参数以控制进行聚类，所述平均最近邻距离为当前所有已学习过的样本数据点中最近邻距离的平均值，所述样本数据点为所述输入输出关联网络中输入感知信息对应的数据点，对于每个样本数据点i，所述最近邻距离为样本数据点i的最近样本点到样本数据点i之间的距离。

进一步的，步骤S2中进行聚类的步骤包括：

S21.获取新增输入感知信息后，将新增输入感知信息作为新增样本数据点，从所述输入输出关联网络中搜索出与所述新增样本数据点距离最近的样本数据点，得到最近邻样本数据点；计算所述新增样本数据点与搜索出的最近邻样本数据点之间的距离，得到最近邻距离；

S22.根据所述最近邻距离更新所述平均最近邻距离，得到更新后平均最近邻距离；

S23.根据当前控制参数以及所述更新后平均最近邻距离确定调整后的控制参数；

S24.使用所述调整后的控制参数对所述新增输入感知信息进行聚类。

进一步的，所述步骤S21中，搜索所述最近邻样本数据点时，若存在多个最近邻样本数据点，优先选择旧样本数据点或优先选择新增样本数据点。

进一步的，所述步骤S22中更新所述平均最近邻距离时，继承上一次生成得到的平均最近邻距离

进一步的，所述步骤S23中，所述控制参数采用已学习样本数据点的平均最近邻距离，或采用更新后的平均最近邻距离。

进一步的，所述步骤S24中，选择

进一步的，所述步骤S24中聚类时，是对包括新增样本数据点在内的所有样本数据点重新聚类，或是在不改变原有聚类结果时只对新增样本数据点聚类。

一种基于发育型聚类的无人车智能迁移系统，包括：

关联网络构建模块，用于在学习阶段，获取历史已知环境下车辆输入感知信息、输出操作信息进行聚类，聚类时按照增量形式不断发育出聚类结果，即聚类过程中不断加入待聚类信息进行聚类，并获取各类所述输入感知信息与所述输出操作信息之间的对应关系，构建形成输入输出关联网络；

智能迁移模块，用于当需要迁移至未知环境中时，获取未知环境下的新增输入感知信息，将所述新增输入感知信息与所述输入输出关联网络中的各类输入感知信息进行聚类，根据聚类结果将与所述新增输入感知信息同类的输入感知信息所对应的输出操作信息，迁移给所述新增输入感知信息。

一种基于发育型聚类的无人车智能迁移系统，包括处理器以及存储器，所述存储器用于存储计算机程序，所述处理器用于执行所述计算机程序，所述处理器用于执行所述计算机程序，以执行如上述方法。

与现有技术相比，本发明的优点在于：

1、本发明针对无人车在未知环境下的迁移问题，通过构建一种发育型聚类方法实现模型结构根据样本变化的迁移，基于发育型聚类方法实现自发育型，只需要无人车在已知环境下先学习到输入输出信息的聚类关系，再迁移至未知环境中，对未知环境下的输入信息做聚类，得到对应类的输出，从而实现无人车的迁移过程，聚类模型结构会根据样本的变化为迁移，且无需人为干涉，可以有效提高无人车在未知环境下的智能迁移能力，实现无人车的智能、快速迁移。

2、本发明基于发育型聚类方法实现无人车的智能迁移，迁移过程中不需要任何先验知识，而且能够随着样本的增多而自我发育，在聚类过程中只需要根据样本空间中的聚集特征就能够得到较好的聚类结果，从而使得无人车在未知环境下能够根据不断增多的新的感知信息及时作出调整。

3、本发明中采用的发育型聚类方法是不断进化型的，能够在每增加一个样本后给出一个合理的聚类结果，因此在样本量较少时倾向于区分，样本量加多时倾向于融合，具有较强的细分数据集的能力，可以解决传统聚类方法中对样本进行聚类时聚类结果是固定不变而样本的标签是变化的问题，使得无人车在未知环境下能够直接通过迁移给出精准、合理的输出操作。

4、本发明中采用的发育型聚类方法是基于增量形式的，可以从0个样本开始学习，随着样本的增加直到学习出K的簇为止，在针对小样本的应用场景时即完全能够给出合理的聚类结果，而且不需使用经验知识，使得无人车可以不断应用于未知环境中实现智能迁移。

5、本发明采用的发育型聚类方法会随着样本的增长逐渐发育，当增加新样本后，能够根据已学习的成果对新样本做出判断，并能根据新样本引入的信息调整已学习的聚类结果，不需要从头开始计算，从而不会出现遗忘现象，可以解决传统批量聚类方法中存在的遗忘现象，使得无人车在迁移过程中可以充分利用所有已学习过的已知环境的信息完成有效迁移。

附图说明

图1是本实施例基于发育型聚类的无人车智能迁移方法的流程示意图。

图2是本实施例基于发育型聚类的无人车智能迁移方法的实现原理示意图。

图3是在具体应用实施例中得到的Compound数据集测试结果示意图。

图4是在具体应用实施例中得到的3-spiral数据集测试结果示意图。

图5是在具体应用实施例中得到的R15数据集测试结果示意图。

具体实施方式

以下结合说明书附图和具体优选的实施例对本发明作进一步描述，但并不因此而限制本发明的保护范围。

如图1所示，本实施例基于发育型聚类的无人车智能迁移方法步骤包括：

S1.在学习阶段，获取历史已知环境下车辆输入感知信息、输出操作信息进行聚类，聚类时按照增量形式不断发育出聚类结果，即聚类过程中不断加入待聚类信息进行聚类，并获取各类输入感知信息(如图像、雷达等信息)与输出操作信息(如启停、转向等决策操作信息)之间的对应关系，构建形成输入输出关联网络；

S2.当需要迁移至未知环境中时，获取未知环境下的新增输入感知信息，将新增输入感知信息进行聚类，根据聚类结果以及输入输出关联网络，将与新增输入感知信息同类的输入感知信息所对应的输出操作信息迁移给所述新增输入感知信息。

本实施例针对无人车在未知环境下的迁移问题，通过构建一种发育型聚类方法实现模型结构根据样本变化的迁移，该发育型聚类方法能够实现自发育型，只需要无人车在已知环境下先学习到输入输出信息的聚类关系，再迁移至未知环境中，对未知环境下的输入信息做聚类，得到对应类的输出，从而实现无人车的迁移过程，基于发育型聚类方法，模型结构会根据样本的变化为迁移，可以有效提高无人车在未知环境下的智能迁移能力，实现无人车的智能、快速迁移。

本实施例首先构建一种基于增量数据的DBEC聚类方法以实现发育型聚类，即将学习阶段的感知信息(图像、雷达等信息)、决策信息(启停、转向等操作)进行聚类，然后在面临未知环境时，将输入的未知环境下的感知信息与已聚类(也即已学习)的感知信息进行相似度判断，若同属于一类，则在此未知环境下执行同类感知信息对应的决策输出。该DBEC聚类方法，无需任何先验参数即能够从零样本开始学习，聚类结构能随样本自身分布与聚集属性而不断演化、发育，实现从0到K的不断演化，其中从0到K表示算法从0样本状态开始运行，没有任何先验信息可用，K代表样本聚类的簇数，K值不是事先人为设定的，而是一个随着样本自身的聚集状态不断演化的值，能够根据新加入样本与已有样本的分布关系自适应的变化。

本实施例步骤S2中进行聚类时，具体根据平均最近邻距离确定控制参数以控制进行聚类，平均最近邻距离为当前所有已学习过的样本数据点中最近邻距离的平均值，样本数据点为输入输出关联网络中输入感知信息对应的数据点，对于每个样本数据点i，最近邻距离为样本数据点i的最近样本点到样本数据点i之间的距离。由于对于平均最近邻距离

本实施例聚类过程中的控制参数选用从样本集中主动学习的平均最近邻距离

本实施例步骤S2中进行聚类的步骤包括：

S21.获取新增输入感知信息后，将新增输入感知信息作为新增样本数据点，从输入输出关联网络中搜索出与新增样本数据点距离最近的样本数据点，得到最近邻样本数据点；计算新增样本数据点与搜索出的最近邻样本数据点之间的距离，得到最近邻距离；

S22.根据最近邻距离更新平均最近邻距离，得到更新后平均最近邻距离；

S23.根据当前控制参数以及更新后平均最近邻距离确定调整后的控制参数；

S24.使用调整后的控制参数对新增输入感知信息进行聚类。

本实施例DBEC聚类方法通过在继承之前学习成果的基础上，由新增样本引入的信息及时调整原有聚类模型结构与参数，实现了聚类过程中学与用的统一，使得学习的过程也是聚类模型自我发育的过程。DBEC聚类方法的结构和控制参数可以从0样本开始发育，完全不用任何先验知识，能够根据新增样本的信息及时调整已学习结果，可以解决传统批处理聚类方法需要依赖先验参数、对数据集缺乏细分能力、对小样本聚类时失效、存在遗忘现象等问题，以及解决传统增量聚类算法普遍存在的需要设置大量先验参数等问题。

如图2所示，在已知环境中，根据驾驶员驾驶的数据得到大量输入信息(图像信息、雷达数据等)与输出信息(驾驶员面对同样输入时做出的操作，例如刹车、转向等)的对应关系，构成基本的输入输出关联网络。即当面对同类型的输入时，做出该类型对应的输出操作即可。当迁移至未知环境中时，面对新的输入信息，只需要将该新增输入信息与基本的输入输出关联网络中的输入信息进行聚类，得到该新增输入信息的聚类结果，然后直接将同类输入对应的操作迁移过来即可。如当新增图像信息img_n+1时，先对img_n+1聚类，聚类结果显示它与img_6为同一类，那么在关联网络中，img_6对应的输出为启动或右转，那么将该输出迁移至img_n+1的输出，即面对目前未知环境时，建议执行启动或右转操作。上述输入一般为图像信息，聚类的对象也为图像信息。输出为相应操作，即车的控制量，包括速度、转向角度等。

上述聚类过程中各步骤中均可以采用不同的策略。如步骤S21中，搜索最近邻样本数据点时，若存在多个最近邻样本数据点，可以采用优先选择旧样本数据点的策略，也可以优先选择新增样本数据点的策略。

上述步骤S22中更新平均最近邻距离时，更新方式可以采用策略：继承上一次生成得到的平均最近邻距离

上述步骤S23中，控制参数可以采用已学习样本数据点的平均最近邻距离的策略，也可以采用更新后的平均最近邻距离的策略。

上述步骤S24中，可以采用策略：选择

上述步骤S24中聚类时，可以采用策略：对包括新增样本数据点在内的所有样本数据点重新聚类，也可以采用策略：在不改变原有聚类结果时只对新增样本数据点聚类。

上述各步骤具体的策略可按照实际需求进行配置。

本实施例DBEC聚类方法能够对应每一种情况下的样本集都给出一个合理的聚类结果，样本的标签会随着样本集的变化而变化，即为实现自我发育型，针对不同环境给出不同的结果，且根据策略选择的不同，能够在具有不同特征的样本空间中发现有用的知识。

以下以在具体应用实施例中采用本发明上述聚类方法实现无人机智能迁移过程中聚类为例，对本发明进行进一步说明。

本实施例首先进行参数定义，x

样本x

对于控制参数ε的选择，本实施例考虑平均最近邻距离

由于

策略1(ES1)：搜索新样本x

策略2(ES2)：引入新样本会导致已学习样本的最近邻关系发生变化，是否更新已学习样本的最近邻信息。

策略3(ES3)：

策略4(ES4)：控制参数ε可采用已学习样本的平均最近邻距离，即

策略5(ES5)：确定是按照倾向区分的策略还是倾向融合的策略对样本进行聚类。若倾向于区分，则选择

策略6(ES6)：引入新样本后，对所有样本重新聚类还是在不改变原有聚类结果时只对新样本聚类。

将上述策略表示为策略向量ES＝[ES

表1进化策略二值表

本实施例中基于DBEC聚类方法实现迁移过程中聚类时，引入未知环境下新样本x

本实施例构建的DBEC算法具体如下，其中，

上述步骤输入为新增样本x

本实施例基于DBEC聚类方法实现迁移过程中聚类的详细步骤为：

Step 1：引入新增样本数据点x

Step 2：然后由更新函数(UpdateDmean()函数)根据ε

Step 3：结合ε

Step 4：结合更新后的ε和选择的策略5、策略6，采用聚类函数(Clustering()函数)对新增样本数据点进行聚类。

本实施例需要将无人机车迁移至未知环境时，获取未知环境下的输入感知信息，即引入新增样本数据点，再根据选定的策略按照上述步骤，即可以实现无人车在未知环境下新增输入感知信息的聚类学习，迁移得到未知环境下的输出操作信息，且无需先验参数，控制参数、算法结构能够随样本的增加不断演化，并根据新样本及时调整已学习结果。

本实施例中DBEC聚类算法涉及到6种进化策略(ES1～ES6)，每个策略存在两种选择，可以组合出64种不同的进化聚类方法，不同组合的聚类方法可以产生不同的聚类性能，从而实现不同效果的迁移。其中ES5不涉及样本的历史数据信息，只是在聚类时倾向于将数据区分开还是融合在一起，而其他5种策略都涉及到对已学习样本的历史偏好问题，因此根据这5个进化策略的不同组合方式，本实施例按照表2对不同策略组合构成的不同类型DBEC聚类进行分析。

表2进化算法的策略组合

上述表2中三种类型的DBEC聚类具体如下：

1)保守型DBEC(ES＝[0,0,0,0,0,0])：即保持已学习样本的学习成果，引入未知环境下新增输入信息后不调整已学习样本的最近邻关系及聚类结果。该保守型聚类方法对早期形成的聚类结果和知识具有很强的依赖性、计算量小，但对早期所犯的错误也缺乏纠错能力。

2)稳健型DBEC算法(ES＝[0,1,0,1,0,1])：既尊重历史数据，也能适应新数据。未知环境下新增输入信息引入后，对已学习样本的最近邻关系进行更新，采用递推格式计算

3)激进型DBEC算法(ES＝[0,1,1,1,0,1])：未知环境下新增输入信息引入后，对已学习样本的最近邻关系进行更新，基于更新后的数据重新计算

本实施例DBEC聚类方法作为一种自我发育模式的机器学习方法，能够实现从0样本开始发育的过程，完全不需要先验参数，聚类的结果及控制参数完全从样本中获得，并根据样本的增加而不断发育演化，在功能上模拟了人类认知发育的过程；根据聚类过程中选择策略的不同，还可以构成不同类型的发育型聚类，能够适应具有不同样本聚集特性的聚类问题，具有较强的鲁棒性和稳定型；同时上述DBEC聚类方法能够在每一种情况下都能给出合理的聚类结果，样本的标签是随着其所在样本集的变化而变化。因而基于该发育型聚类方法，当无人车需要将已知环境迁移至未知环境时，可以充分利用已知环境信息以及未知环境信息之间的相互融合，将已知环境迁移至未知环境，同时由未知环境调整已学习的模型，实现快速、高效的智能迁移，提高迁移性能。

为进一步验证本发明的有效性，以稳健型DBEC聚类方法为例，在三个具有不同特征的UCI数据集上进行实验。如图3、4、5所示，采用稳健型DBEC聚类方法能够找出每个簇的核心区域，并且能够识别具有复杂形状的簇，例如簇的内嵌、环绕、重叠等。其中由于微型簇中包含的样本数较少，所以在图中使用实心点表示，属于一个簇的样本用相同形状表示。即本实施例DBEC聚类方法能够快速、准确的实现聚类，且不需要依赖于先验信息。

本发明基于发育型聚类的无人车智能迁移方法，迁移过程主要根据输入的感知信息与输出的决策信息实现，首先在已知环境下学习到输入输出的聚类模式，然后迁移至未知环境中，并对未知环境下的感知信息聚类，根据聚类结果做出决策，并根据新增的未知环境调整已学习的模型，从而使得无人车具备更好的迁移能力。

本发明聚类方法同样可以适用于神经网络模型及分类等应用中，并不局限于无人车智能环境迁移。

本实施例进一步包括基于发育型聚类的无人车智能迁移系统，包括：

关联网络构建模块，用于在学习阶段，获取历史已知环境下车辆输入感知信息、输出操作信息进行聚类，聚类时按照增量形式不断发育出聚类结果，即聚类过程中不断加入待聚类信息进行聚类，并获取各类输入感知信息与输出操作信息之间的对应关系，构建形成输入输出关联网络；

智能迁移模块，用于当需要迁移至未知环境中时，获取未知环境下的新增输入感知信息，将新增输入感知信息进行聚类，根据聚类结果以及输入输出关联网络，将与新增输入感知信息同类的输入感知信息所对应的输出操作信息迁移给新增输入感知信息。

本实施例基于发育型聚类的无人车智能迁移系统与上述基于发育型聚类的无人车智能迁移方法为一一对应，两者具有相同的实现原理以及技术效果，在此不再一一赘述。

在另一实施例中，本发明基于发育型聚类的无人车智能迁移系统还可以为：包括处理器以及存储器，存储器用于存储计算机程序，处理器用于执行计算机程序，处理器用于执行所述计算机程序，以执行如上述基于发育型聚类的无人车智能迁移方法。

上述只是本发明的较佳实施例，并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明。因此，凡是未脱离本发明技术方案的内容，依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均应落在本发明技术方案保护的范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：谢海斌;李鹏;庄东晔;蒋天瑞;闫家鼎;
专利申请人：中国人民解放军国防科技大学;

上一篇：一种基于簇形状边界闭包聚类的图像分割方法及系统
下一篇：阴影贴图的烘焙方法、装置、设备及计算机可读存储介质