导航：首页> 生物化学；啤酒；烈性酒；果汁酒；醋；微生物学；酶学；突变或遗传工程>一种自动驾驶算法更新方法、装置及存储介质

一种自动驾驶算法更新方法、装置及存储介质

文献发布时间：2023-06-19 18:34:06

技术领域

本申请涉及自动驾驶技术领域，尤其涉及一种自动驾驶算法更新方法、装置及存储介质。

背景技术

自动驾驶是未来驾驶技术的发展方向，可以完全取代人工驾驶，通常采用自动驾驶系统基于先进的通信、计算机、网络和控制技术，对目标车辆实现实时和连续的控制，随着自动驾驶技术的不断发展，自动驾驶功能日趋完善和多样化。

现有技术中为提升自动驾驶的安全性和舒适性，会对目标车辆进行大规模的自动驾驶测试，进而基于自动驾驶测试结果数据对自动驾驶算法进行优化指导。但是现有的测试覆盖面比较单一，对自动驾驶算法的更新无法提供准确且高效的指导。

发明内容

本申请提供了一种自动驾驶算法更新方法、装置及存储介质，不仅能够全面且高效的对自动驾驶算法进行评价，而且还能提高自动驾驶算法评价的准确率。

一方面，本申请提供一种自动驾驶算法更新方法，包括：获取目标车辆基于自动驾驶算法在自动驾驶过程中的多维评价数据，所述多维评价数据指示所述目标车辆的行驶状态和所述目标车辆上目标对象的乘坐状态；

对所述多维评价数据进行数据映射处理，得到与所述多维评价数据对应的算法评价特征；

基于所述算法评价特征进行所述自动驾驶算法的效果评估预测，得到效果评估结果；

在所述效果评估结果满足预设算法更新条件的情况下，确定所述自动驾驶算法为待更新驾驶算法。

进一步的，所述多维评价数据包括车辆行驶数据，在所述获取目标车辆基于自动驾驶算法在自动驾驶过程中的多维评价数据之后，所述方法还包括：

若所述车辆行驶数据中存在满足驾驶安全预警条件的数据，确定所述自动驾驶算法为待更新驾驶算法。

进一步的，所述对所述多维评价数据进行数据映射处理，得到与所述多维评价数据对应的算法评价特征，包括：

基于预设对应关系，确定所述多维评价数据中各评价数据各自对应的评价特征信息，所述预设对应关系表征所述多维评价数据中各评价数据与所述评价特征信息间的对应关系；

对所述各评价数据各自对应的评价特征信息进行特征编码处理，得到所述各评价数据各自对应的初始评价特征；

对所述各评价数据各自对应的初始评价特征进行特征拼接处理，得到所述算法评价特征。

进一步的，所述基于所述算法评价特征进行所述自动驾驶算法的效果评估预测，得到效果评估结果包括：

对所述算法评价特征进行特征嵌入处理，得到与所述多维评价数据对应的整体特征信息和交叉特征信息；

对所述整体特征信息和所述交叉特征信息进行深度特征提取处理，得到所述效果评估结果。

进一步的，所述对所述算法评价特征进行特征嵌入处理，得到与所述多维评价数据对应的整体特征信息和交叉特征信息，包括：

对所述初始评价特征进行特征嵌入处理，得到所述多维评价数据中各评价数据各自对应的特征嵌入向量；

对所述特征嵌入向量进行线性拼接处理，得到所述整体特征信息；

对所述特征嵌入向量进行特征交叉处理，得到所述交叉特征信息。

进一步的，所述方法还包括：

获取初始评价模型和评价数据集，所述评价数据集包括历史多维评价数据和对应的算法评价标签；

以所述历史多维评价数据作为所述初始评价模型的输入，以所述算法评价标签作为所述初始评价模型的期望输出，对所述初始评价模型进行算法评价的约束训练，得到所述目标评价模型，所述目标评价模型用于进行所述自动驾驶算法的效果评估预测。

进一步的，在所述在所述效果评估结果满足预设算法更新条件的情况下，确定所述自动驾驶算法为待更新驾驶算法之后，所述方法还包括：

将所述多维评价数据发送至云服务器；

接收所述云服务器发送的算法更新数据，所述算法更新数据为基于所述多维评价数据对所述自动驾驶算法进行算法优化得到的；

基于所述算法更新数据对所述自动驾驶算法进行更新，得到更新的自动驾驶算法。

另一方面，本申请提供一种自动驾驶算法更新装置，所述装置包括：

第一获取模块：用于获取目标车辆基于自动驾驶算法在自动驾驶过程中的多维评价数据，所述多维评价数据指示所述目标车辆的行驶状态和所述目标车辆上目标对象的乘坐状态；

第一处理模块：用于对所述多维评价数据进行数据映射处理，得到与所述多维评价数据对应的算法评价特征；

第二处理模块：用于基于所述算法评价特征进行所述自动驾驶算法的效果评估预测，得到效果评估结果；

确定模块：用于在所述效果评估结果满足预设算法更新条件的情况下，确定所述自动驾驶算法为待更新驾驶算法。

另一方面，本申请提供一种计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行如上所述的自动驾驶算法更新方法。

另一方面，本申请提供一种实现上述自动驾驶算法更新方法的电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的自动驾驶算法更新方法。

本申请提供的一种自动驾驶算法更新方法、装置及存储介质具有如下有益效果：

本申请获取目标车辆基于自动驾驶算法在自动驾驶过程中的多维评价数据，多维评价数据指示目标车辆的行驶状态和目标车辆上目标对象的乘坐状态；对多维评价数据进行数据映射处理，得到与多维评价数据对应的算法评价特征；基于算法评价特征进行自动驾驶算法的效果评估预测，得到效果评估结果；在效果评估结果满足预设算法更新条件的情况下，确定自动驾驶算法为待更新驾驶算法。如此，不仅能够全面且高效的对自动驾驶算法进行评价，而且还能提高自动驾驶算法评价的准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本申请实施例提供的一种自动驾驶算法更新方法的流程示意图；

图2为本申请实施例提供的一种算法评价特征的获取方法流程示意图；

图3为本申请实施例提供的一种效果评估结果的获取方法流程示意图；

图4为本申请实施例提供的一种整体特征信息和交叉特征信息的获取方法流程示意图；

图5为本申请实施例提供的一种评价模型的训练方法流程示意图；

图6为本申请实施例提供的一种目标评价模型的结构示意图；

图7为本申请实施例提供的一种自动驾驶算法的更新方法流程示意图；

图8为本申请实施例提供的一种自动驾驶算法更新的流程示意图；

图9为本申请实施例提供的一种自动驾驶算法更新装置的结构示意图；

图10为本申请实施例提供的一种用于实现自动驾驶算法更新方法的电子设备的硬件结构框图。

具体实施方式

为了使本技术领域的人员更好地的理解本申请的方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在介绍本申请提供的方法实施例之前，先对本申请方法实施例中可能涉及的相关术语或者名词进行简要介绍，以便于本申请领域技术人员理解。

人工智能(Artificial Intelligence，AI)：利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。其中，人工智能软件技术主要包括计算机视觉技术、机器学习/深度学习等方向。

机器学习(MachineLearning，ML)：是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

深度学习：深度学习是机器学习的一种，而机器学习是实现人工智能的必经路径。深度学习的概念源于人工神经网络的研究，含多个隐藏层的多层感知器就是一种深度学习结构，深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

特征工程(feature engineering)是这样一个过程：将数据转换为能更好地表示潜在问题的特征，从而提高机器学习性能。如果把数据理解为一个n维空间中的向量(n是列数)，那么我们可以考虑，能不能创建一个k维(k＜n)的子集，完全或几乎完全表示原数据，从而提升机器学习速度或性能。

独热编码(One-Hot Encoding)是一位有效编码。独热编码方法是使用N位状态寄存器来对N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候，其中只有一位有效。对于每一个特征，如果它有m个可能值，那么经过独热编码后，就变成了m个二元特征。并且，这些特征互斥，每次只有一个激活。

Embedding(嵌入)是指将高维原始数据(图像，句子)映射到低维流形，使得高维的原始数据被映射到低维流形之后变得可分，而这个映射就叫嵌入。简单地说，Embedding就是把一个东西映射到一个向量。如果两个东西很像，那么它们对应的向量欧式距离很小。Embedding就是从原始数据提取出来的特征，也就是那个通过神经网络映射之后的低维向量。

以下结合图1介绍本申请实施例提供的一种自动驾驶算法更新方法，本申请实施例提供的自动驾驶算法更新方法应用于车载终端。

图1为本申请实施例提供的一种自动驾驶算法更新方法，本申请实施例提供的一种自动驾驶算法更新方法包括：

S101.获取目标车辆基于自动驾驶算法在自动驾驶过程中的多维评价数据，多维评价数据指示目标车辆的行驶状态和目标车辆上目标对象的乘坐状态。

如此，能够提高自动驾驶测试的覆盖面，进而能够全面的对自动驾驶算法进行评价，进而提高自动驾驶算法评价的准确率。

一些实施例中，目标车辆可以为自动驾驶等级为L2及L2以上的车辆。其中，L2级别表征部分自动驾驶，目标车辆对方向盘和加减速中的多项操作提供驾驶支持,驾驶员负责其余驾驶操作；L3级别表征条件自动驾驶，目标车辆完成绝大部分驾驶操作，驾驶员需要在适当的时候提供应答；L4级别表征高度自动驾驶，目标车辆完成所有驾驶操作，驾驶员无需对所有的系统请求做出应答,但限定道路和环境条件；L5级别表征完全自动驾驶，目标车辆完成所有驾驶操作，驾驶员无需保持注意力。

一些实施例中，自动驾驶算法为实现目标车辆驾驶自动化的相关算法，具体的，自动驾驶算法包括但不限于感知算法、预测算法、规划算法、决策算法和控制算法。

一些实施例中，多维评价数据可以包括但不限于自动驾驶里程数据、目标车辆提示驾驶员接管次数数据、自动驾驶路线数据、驾驶员类型分布数据、驾驶员生理因素数据、驾驶员舒适性数据和驾驶员疲劳程度数据。

其中，自动驾驶里程数据指示预设时间内目标车辆自动驾驶的总里程，示例性的，总里程可以为400Km。具体的，基于目标车辆的车辆行驶数据获取自动驾驶里程数据，目标车辆的车辆行驶数据包括驾驶自动化系统的运行结果数据，驾驶自动化系统指实现驾驶自动化的硬件和软件所共同组成的系统。

其中，目标车辆提示驾驶员接管次数数据指示预设时间内目标车辆在自动驾驶过程中提醒驾驶员接管车辆的总次数,示例性的，总次数可以为8次。具体的，基于目标车辆的行驶数据获取目标车辆提示驾驶员接管次数数据。

其中，自动驾驶路线数据指示预设时间内目标车辆自动驾驶过程中的道路状况，示例性的，道路状况可以为城市、高速、郊区和/或园区，其中，城市道路状况的复杂程度高于高速道路状况的复杂程度。具体的，基于预设道路标签获取自动驾驶路线数据。

其中，驾驶员类型分布数据指示预设时间内驾驶目标车辆的所有目标对象类型分布的情况，示例性的，目标对象类型可以为激进型、一般型和/或保守型。

其中，驾驶员生理因素数据指示预设时间内驾驶目标车辆的目标对象的生理指标的高低，示例性的，生理指标可以为心率变异性、皮肤导电性、皮肤湿度、相对呼吸深度和/或脉搏率。具体的，基于车载生理检测装置获取驾驶员生理因素数据，车载生理检测装置可以包括人体检测贴片，在对目标车辆进行自动驾驶测试的情况下，将人体检测贴片贴于目标对象的目标区域，以持续性对目标对象进行预设生理指标的检测。

其中，驾驶员舒适性数据指示预设时间内驾驶目标车辆的目标对象的舒适性，示例性的，舒适性指标可以为振动程度、上下颠簸程度、噪声程度和/或左右摇摆程度。具体的，基于车载状态检测装置获取驾驶员舒适性数据，车载状态检测装置可以车载陀螺仪。

其中，驾驶员疲劳程度数据指示预设时间内驾驶目标车辆的目标对象的疲劳程度，示例性的，疲劳指标可以为眨眼次数频率、打哈欠次数频率、低头次数频率和/或视线偏移(左顾右盼)次数频率。具体的，基于目标车载摄像头获取驾驶员疲劳程度数据，目标车载摄像头朝向目标对象设置，目标对象在目标车载摄像头的拍摄范围内。

其中，预设时间可以为目标车辆自动驾驶测试的一个周期，具体的，可以为48H。

本申请实施例中，多维评价数据包括车辆行驶数据，在S101之后，自动驾驶算法更新方法还包括：

若车辆行驶数据中存在满足驾驶安全预警条件的数据，确定自动驾驶算法为待更新驾驶算法。

一些实施例中，在驾驶自动化系统中预设监控算法，监控算法用于检测目标车辆在自动驾驶过程中生成的车辆行驶数据，并识别筛选满足驾驶安全预警条件的数据。在筛选出满足驾驶安全预警条件的数据的情况下，确定自动驾驶算法为待更新驾驶算法。如此，能够提高目标车辆的驾驶安全性。

示例性的，目标车辆刹车失灵对应的车辆行驶数据即为满足驾驶安全预警条件的数据，目标车辆突然超速对应的车辆行驶数据即为满足驾驶安全预警条件的数据。

S102.对多维评价数据进行数据映射处理，得到与多维评价数据对应的算法评价特征。

本申请实施例中，请参见图2，S102包括：

S201.基于预设对应关系，确定多维评价数据中各评价数据各自对应的评价特征信息，预设对应关系表征多维评价数据中各评价数据与评价特征信息间的对应关系。

一些实施例中，基于多维评价数据中各评价数据和预设对应关系，确定与多维评价数据中各评价数据对应的评价特征信息，其中，评价特征信息指示多维评价数据中各评价数据的数据评分。具体的，数据评分可以为0-10中的任一数值。

示例性的，基于自动驾驶里程数据获取目标车辆自动驾驶的总里程，总里程为实车测试总里程数和仿真测试总里程数之和。在总里程大于或等于500Km的情况下，确定自动驾驶里程数据对应的数据评分为10；在总里程大于或等于200Km，且小于500Km的情况下，确定自动驾驶里程数据对应的数据评分为5；在总里程小于200Km的情况下，确定自动驾驶里程数据对应的数据评分为0。

示例性的，基于目标车辆提示驾驶员接管次数数据获取目标车辆在自动驾驶过程中提醒驾驶员接管车辆的总次数，在总次数大于或等于10的情况下，确定目标车辆提示驾驶员接管次数数据对应的数据评分为0；在总次数大于或等于1，且小于10的情况下，确定目标车辆提示驾驶员接管次数数据对应的数据评分为5；在总次数为0的情况下，确定目标车辆提示驾驶员接管次数数据对应的数据评分为10。

示例性的，基于自动驾驶路线数据获取目标车辆自动驾驶过程中的道路状况信息，在道路状况仅为高速路况的情况下，确定道路状况为简单道路状况，确定自动驾驶路线数据对应的数据评分为0；在道路状况仅包括城市路况的情况下，确定道路状况为中等道路状况，确定自动驾驶路线数据对应的数据评分为5；在道路状况包括城市路况和郊区路况的情况下，确定道路状况为复杂道路状况，确定自动驾驶路线数据对应的数据评分为10。

示例性的，基于驾驶员类型分布数据获取目标对象的类型信息，在目标对象仅包括激进型、一般型或保守型中的一种的情况下，确定驾驶员类型分布数据对应的数据评分为0；在目标对象包括激进型、一般型或保守型中的至少两种，且比例不均匀的情况下，确定驾驶员类型分布数据对应的数据评分为5；在目标对象包括激进型、一般型和保守型，且比例均匀的情况下，确定驾驶员类型分布数据对应的数据评分为10。

示例性的，基于驾驶员生理因素数据获取目标对象的生理指标信息，在目标对象的生理指标偏高的情况下，确定驾驶员生理因素数据对应的数据评分为0；在目标对象的生理指标偏低的情况下，确定驾驶员生理因素数据对应的数据评分为0；在目标对象的生理指标正常的情况下，确定驾驶员生理因素数据对应的数据评分为10。

示例性的，基于驾驶员舒适性数据获取目标对象的舒适性指标信息，基于预设等级，确定舒适性指标信息对应的等级，进而基于舒适性指标信息对应的等级确定驾驶员舒适性数据对应的数据评分。具体的，预设等级可以包括10个等级，不同的等级对应的不同的数据评分，其中，等级越高，对应的数据评分越低。

示例性的，基于驾驶员疲劳程度数据获取目标对象的疲劳程度指标信息，在疲劳程度指标偏高的情况下，确定驾驶员疲劳程度数据对应的数据评分为0；在疲劳程度指标正常的情况下，确定驾驶员疲劳程度数据对应的数据评分为10。

S202.对各评价数据各自对应的评价特征信息进行特征编码处理，得到各评价数据各自对应的初始评价特征。

一些实施例中，可通过特征处理方法，对各评价数据各自对应的评价特征信息进行特征处理，得到各评价数据各自对应的初始评价特征。其中，初始评价特征表征评价特征信息编码处理后得到的评价子向量。可选的，上述特征处理方法包括独热编码。

独热编码(One-Hot Encoding)是使用N位状态寄存器来对N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候，其中只有一位有效。对于每一个特征，如果它有m个可能值，那么经过独热编码后，就变成了m个二元特征。并且，这些特征互斥，每次只有一个激活。

S203.对各评价数据各自对应的初始评价特征进行特征拼接处理，得到算法评价特征。

一些实施例中，将各评价数据各自对应的初始评价特征按照预设位置进行拼接，得到算法评价特征。算法评价特征包括各评价数据各自对应的初始评价特征，是多维评价数据中各评价数据的数学表现形式。

S103.基于算法评价特征进行自动驾驶算法的效果评估预测，得到效果评估结果。

本申请实施例中，请参见图3，S103包括：

S301.对算法评价特征进行特征嵌入处理，得到与多维评价数据对应的整体特征信息和交叉特征信息。

本申请实施例中，请参见图4，S301包括：

S401.对初始评价特征进行特征嵌入处理，得到多维评价数据中各评价数据各自对应的特征嵌入向量。

在算法评价特征中提取对应的初始评价特征，对初始评价特征进行特征嵌入处理，得到多维评价数据中各评价数据各自对应的特征嵌入向量。

S402.对特征嵌入向量进行线性拼接处理，得到整体特征信息。

一些实施例中，对多维评价数据中各评价数据各自对应的特征嵌入向量中的特征嵌入值与相关系数，或者与特征嵌入值所在维度对应的权重系数线性相乘，再拼接线性相乘后的特征嵌入向量，生成多维评价数据对应的整体特征信息。具体的，整体特征信息是多维评价数据的数学表现形式。

S403.对特征嵌入向量进行特征交叉处理，得到交叉特征信息。

对特征嵌入向量进行特征交叉处理，得到交叉特征值；基于交叉特征值，得到交叉特征信息。具体的，交叉特征信息表征多维评价数据中各评价数据之间的关联性。

一些实施例中，特征交叉处理包括对各评价数据各自对应的特征嵌入向量进行乘积处理，得到各评价数据各自对应的特征嵌入向量之间的向量积。具体的，乘积处理可以为内积或外积，不同的乘积处理得到不同的向量积，在乘积方式为内积对应的乘积方式的情况下，向量积为内积；在乘积方式为外积对应的乘积方式的情况下，向量积为外积。

S302.对整体特征信息和交叉特征信息进行深度特征提取处理，得到效果评估结果。

一些实施例中，对整体特征信息和交叉特征信息进行深度特征提取处理，得到自动驾驶算法需更新的概率。

S104.在效果评估结果满足预设算法更新条件的情况下，确定自动驾驶算法为待更新驾驶算法。

一些实施例中，在自动驾驶算法需更新的概率大于或等于预设概率阈值的情况下，确定效果评估结果满足预设算法更新条件，进而确定自动驾驶算法为待更新驾驶算法。

需要说明的是，预设概率阈值是根据实际应用场景确定的概率阈值，本申请对预设概率阈值的大小不做限定。

本申请实施例中，自动驾驶算法更新方法还包括目标评价模型的训练，其中，目标评价模型用于实现上述步骤S401、S402、S403和S302。

本申请实施例中，请参见图5，自动驾驶算法更新方法还包括：

S501.获取初始评价模型和评价数据集，评价数据集包括历史多维评价数据和对应的算法评价标签。

一些实施例中，评价数据集包括训练集、验证集和测试集，示例性的，训练集的占比为60％，验证集的占比为20％，测试集的占比为20％。

一些实施例中，算法评价标签表征历史多维评价数据对应的自动驾驶算法需更新的概率。

S502.以历史多维评价数据作为初始评价模型的输入，以算法评价标签作为初始评价模型的期望输出，对初始评价模型进行算法评价的约束训练，得到目标评价模型，目标评价模型用于进行自动驾驶算法的效果评估预测。

一些实施例中，基于初始评价模型对历史多维评价数据进行数据评价，得到每一历史多维评价数据对应的自动驾驶算法需更新的概率；对每一历史多维评价数据对应的自动驾驶算法需更新的概率和对应的算法评价标签及进行比较处理，得到比较结果；基于比较结果和预设优化算法，对初始评价模型进行优化更新，得到目标评价模型。

一些实施例中，请参见图6，图6中的目标评价模型为基于概率神经网络(Probabilistic Neural Network，PNN)训练的神经网络模型，该模型本质上是基于乘法的运算来体现特征交叉的深度神经网络(Deep Neural Networks,DNN)。

具体的，可将算法评价特征输入至目标评价模型，由目标评价模型的输入层601执行在算法评价特征中提取对应的初始评价特征，即图6中的评价子向量A、评价子向量B、…、评价子向量N，分别对应于多维评价数据中各评价数据，算法评价特征即为由评价子向量A、评价子向量B、…、评价子向量N组合的向量。

具体的，由特征嵌入层602执行S401步骤，得到多维评价数据中各评价数据各自对应的特征嵌入向量，即图6中的特征嵌入向量A、特征嵌入向量B、…、特征嵌入向量N。

具体的，由二阶向量积层603执行S402和S403，得到整体特征信息和交叉特征信息，并将整体特征信息和交叉特征信息进行拼接输入至全连接层604。

具体的，由全连接层604和全连接层605执行S302，对整体特征信息和交叉特征信息进行深度特征提取处理，并由输出层606输出效果评估结果。

如此，通过目标评价模型将高维离散的初始评价特征进行线性嵌入处理为低维稠密的整体特征，能够在保证多维评价的前提下，提高效果评估结果输出的准确率和效率。

本申请实施例中，请参见图7，在S104之后，自动驾驶算法更新方法还包括：

S701.将多维评价数据发送至云服务器。

一些实施例中，技术人员可以远程访问云服务器，从而获取多维评价数据和对应的自动驾驶算法数据，如此，可以实现技术人员非接触车辆访问多维评价数据，降低自动驾驶算法更新的处理成本，提高处理效率和时效性。

本申请实施例中的云服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

具体地，云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。云技术能够应用于各种领域，如医疗云、云物联、云安全、云教育、云会议、人工智能云服务、云应用、云呼叫和云社交等，云技术基于云计算(cloud computing)商业模式应用，它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”，“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。作为云计算的基础能力提供商，会建立云计算资源池(简称云平台，一般称为IaaS(Infrastructure as a Service，基础设施即服务))平台，在资源池中部署多种类型的虚拟资源，供外部客户选择使用。云计算资源池中主要包括：计算设备(为虚拟化机器，包含操作系统)、存储设备、网络设备。

具体地，上述涉及的云服务器可以包括实体设备，可以具体包括有网络通信子模块、处理器和存储器等等，也可以包括运行于实体设备中的软体，可以具体包括有应用程序等。

S702.接收云服务器发送的算法更新数据，算法更新数据为基于多维评价数据对自动驾驶算法进行算法优化得到的。

一些实施例中，云服务器中设置有优化模块，优化模块基于多维评价数据对自动驾驶算法数据进行算法优化，得到算法更新数据。之后，将算法更新数据发送至目标车载终端。算法更新数据可以包括感知算法更新数据、预测算法更新数据、规划算法更新数据、决策算法更新数据和控制算法更新数据。

另一些实施例中，技术人员可以远程访问云服务器，获取多维评价数据和对应的自动驾驶算法数据，通过人工分析或优化算法，对自动驾驶算法进行算法优化，得到算法更新数据，之后，通过标准化程序将算法更新数据发送至云服务器，以使云服务器将算法更新数据转发至目标车载终端。

S703.基于算法更新数据对自动驾驶算法进行更新，得到更新的自动驾驶算法。

一些实施例中，目标车载终端基于云服务器发送的算法更新数据对自动驾驶算法进行更新，如此，可以实现在非接触车辆的情况下完成自动驾驶算法的更新。

请参见图8，以下结合具体应用场景介绍本申请实施例提供的自动驾驶算法更新方法，图8为本申请实施例提供的一种自动驾驶算法评价的流程示意图，包括:

S1.获取目标车辆基于自动驾驶算法在自动驾驶过程中的多维评价数据，多维评价数据指示目标车辆的行驶状态和目标车辆上目标对象的乘坐状态。

S2.基于预设对应关系，确定多维评价数据中各评价数据各自对应的评价特征信息，预设对应关系表征多维评价数据中各评价数据与评价特征信息间的对应关系。

S3.对各评价数据各自对应的评价特征信息进行特征编码处理，得到各评价数据各自对应的初始评价特征。

S4.对初始评价特征进行特征嵌入处理，得到多维评价数据中各评价数据各自对应的特征嵌入向量。

S5.对特征嵌入向量进行线性拼接处理，得到整体特征信息。

S6.对特征嵌入向量进行特征交叉处理，得到交叉特征信息。

S7.对整体特征信息和交叉特征信息进行深度特征提取处理，得到效果评估结果。

S8.在效果评估结果满足预设算法更新条件的情况下，将多维评价数据发送至云服务器。

S9.接收云服务器发送的算法更新数据，算法更新数据为基于多维评价数据对自动驾驶算法进行算法优化得到的。

S10.基于算法更新数据对自动驾驶算法进行更新，得到更新的自动驾驶算法。

本申请实施例提供的自动驾驶算法更新方法不仅能够全面且高效的对自动驾驶算法进行评价，而且还能提高自动驾驶算法评价和更新的准确率。

本申请实施例还提供了一种自动驾驶算法更新装置，请参见图9，本申请实施例提供的一种自动驾驶算法更新装置包括:

第一获取模块910：用于获取目标车辆基于自动驾驶算法在自动驾驶过程中的多维评价数据，多维评价数据指示目标车辆的行驶状态和目标车辆上目标对象的乘坐状态。

第一处理模块920：用于对多维评价数据进行数据映射处理，得到与多维评价数据对应的算法评价特征。

第二处理模块930：用于基于算法评价特征进行自动驾驶算法的效果评估预测，得到效果评估结果。

确定模块940：用于在效果评估结果满足预设算法更新条件的情况下，确定自动驾驶算法为待更新驾驶算法。

本申请实施例中，第一处理模块920包括：

确定单元：用于基于预设对应关系，确定多维评价数据中各评价数据各自对应的评价特征信息，预设对应关系表征多维评价数据中各评价数据与评价特征信息间的对应关系。

第一处理单元：用于对各评价数据各自对应的评价特征信息进行特征编码处理，得到各评价数据各自对应的初始评价特征。

第二处理单元：用于对各评价数据各自对应的初始评价特征进行特征拼接处理，得到算法评价特征。

本申请实施例中，第二处理模块930包括：

第三处理单元：用于对算法评价特征进行特征嵌入处理，得到与多维评价数据对应的整体特征信息和交叉特征信息。

第四处理单元：用于对整体特征信息和交叉特征信息进行深度特征提取处理，得到效果评估结果。

本申请实施例中，第三处理单元包括：

第一处理子单元：用于对初始评价特征进行特征嵌入处理，得到多维评价数据中各评价数据各自对应的特征嵌入向量。

第二处理子单元：用于对特征嵌入向量进行线性拼接处理，得到整体特征信息。

第三处理子单元：用于对特征嵌入向量进行特征交叉处理，得到交叉特征信息。

本申请实施例中，自动驾驶算法更新装置还包括：

第二获取模块：用于获取初始评价模型和评价数据集，评价数据集包括历史多维评价数据和对应的算法评价标签。

模型训练模块：用于以历史多维评价数据作为初始评价模型的输入，以算法评价标签作为初始评价模型的期望输出，对初始评价模型进行算法评价的约束训练，得到目标评价模型，目标评价模型用于进行自动驾驶算法的效果评估预测。

本申请实施例中，确定模块940之后，自动驾驶算法更新装置还包括：

发送模块：用于将多维评价数据发送至云服务器。

接收模块：用于接收云服务器发送的算法更新数据，算法更新数据为基于多维评价数据对自动驾驶算法进行算法优化得到的。

更新模块：用于基于算法更新数据对自动驾驶算法进行更新，得到更新的自动驾驶算法。

如上所述的装置实施例中的装置与方法实施例基于同样的申请构思。

请参考图10，本申请实施例提供了一种用于实现上述自动驾驶算法更新方法的电子设备，该电子设备包括处理器和存储器，该存储器中存储有至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的自动驾驶算法更新方法。

存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、功能所需的应用程序等；存储数据区可存储根据所述设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。

本申请实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行，即上述电子设备可以包括移动终端、计算机终端、服务器或者类似的运算装置。其中，上述的服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。

图10是本申请实施例提供的一种用于实现上述自动驾驶算法更新方法的电子设备的硬件结构框图。如图10所示，该电子设备1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(Central Processing Units，CPU)1010(处理器1010可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1030，一个或一个以上存储应用程序1023或数据1022的存储介质1020(例如一个或一个以上海量存储设备)。其中，存储器1030和存储介质1020可以是短暂存储或持久存储。存储在存储介质1020的程序可以包括一个或一个以上模块，每个模块可以包括对电子设备中的一系列指令操作。更进一步地，中央处理器1010可以设置为与存储介质1020通信，在电子设备1000上执行存储介质1020中的一系列指令操作。电子设备1000还可以包括一个或一个以上电源1060，一个或一个以上有线或无线网络接口1050，一个或一个以上输入输出接口1040，和/或，一个或一个以上操作系统1021，例如Windows Server

处理器1010可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

输入输出接口1040可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备1000的通信供应商提供的无线网络。在一个实例中，输入输出接口1040包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，输入输出接口1040可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯。

操作系统1021可以包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。

本领域普通技术人员可以理解，图10所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，电子设备1000还可包括比图10中所示更多或者更少的组件，或者具有与图10所示不同的配置。

本申请的实施例还提供了一种计算机可读存储介质，所述存储介质可设置于电子设备之中以保存用于实现方法实施例中一种自动驾驶算法更新方法相关的至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的自动驾驶算法更新方法。

可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本申请的实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述的各种可选实现方式中提供的方法。

需要说明的是：上述本申请实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：付勇;方芳;高文建;徐聪;
专利申请人：中汽创智科技有限公司;