掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及一种车辆换挡控制技术领域,特别是关于一种基于注意力机制和深度学习的特种车辆自动换挡预测方法及系统。

背景技术

特种车辆(如重型矿车)不同于普通公路汽车,具有重量和体积大、空载和满载循环变化、长时间全油门驱动、换人不停车的工作模式等特征,同时面临着严峻、多变的行驶工况,对运输效率和驾驶员安全驾驶有一定不利影响。

现有文献中为了解决车辆传动系统的时变、分布不确定性等问题,制定了模糊移位策略,目的是提高车辆经济性。文献基于神经网络的策略,可以通过优化神经网络来进行模型训练,由于系统主要以三参数,即车速、油门位置和车辆加速度作为输入变量,虽然增加了修正模块,因为没有考虑到长时间实车数据的连续性,因此在面对更严峻的驾驶情况时预测精度不高。文献四参数工程动态换挡规律中,除考虑原有的三参数(常规的车速、加速度、油门开度)外,又引入油泵压力,使得换挡规律更加符合实际工况。文献T-S模糊神经网络的最佳挡位判断方法中,以二参数即车速和油门开度作为输入预测自动换挡策略,考虑到车辆动力性,采用BP(Back Propagation)神经网络针制定换挡策略,与PNN换挡策略采用实车离线数据进行对比分析,换挡准确率大大提升。现有文献考虑时间连续性,将RNN(Recurrent Neural Network)模型应用于自动换挡策略,从预测结果来看比BP算法具有更高的精确度,但是该算法仍存在缺点,不适用于长时间跨度的预测,存在梯度消失或者爆炸的问题。

由于特种车辆面临严峻、多变的行驶工况,制定一种通用的自动换挡策略十分重要。目前在基于神经网络控制的大部分自动换挡控制策略的相关研究中,由于缺乏神经网络的反馈连接,无法从后往前对信息进行编码,因此处理长时间连续的实车数据时导致预测精确度不高的问题。

发明内容

针对上述问题,本发明的目的是提供一种特种车辆自动换挡预测方法及系统,其具有实时性好、预测精度高的特点,可应用于基于时间序列数据的多路况下重型矿车。

为实现上述目的,本发明采取以下技术方案:一种特种车辆自动换挡预测方法,其包括:远程采集特种车辆实时运行数据并进行预处理,得到运行数据中各参数的真实物理数据,进行本地存储做为数据集;构建ABi-LSTM模型,将所述数据集输入至ABi-LSTM模型构成该模型的输入层,对所述ABi-LSTM模型进行训练,由训练好的ABi-LSTM模型对挡位进行预测。

进一步,所述采集特种车辆实时运行数据并进行预处理,包括:

根据CAN通信协议,由CAN总线将采集到的数据进行解析,将每一段特种车辆上各传感器采集的运行数据的CAN数据帧进行重组,得到有效的物理数据;

对多参数异常值进行处理,保证数据质量;

将对异常值处理后的实车数据进行归一化,消除特征间差异和尺度的影响,使实车数据更加符合分布规律。

进一步,所述将每一段特种车辆运行数据的CAN数据帧进行重组,包括:

设置每个标志对应特种车辆数据中的相应参数,写入原始标识位数组中,记为XO

将XO

将最终的XN

进一步,所述构建ABi-LSTM模型,包括:

隐藏层,依次将前向i时刻下各自独立方向的状态相加,以及后向i时刻下各自独立方向的状态相加,将每个方向下的最终隐藏层状态值进行求和;

Attention层,用于获取隐藏层在t+i时刻下对于Bi-LSTM最终状态的注意力概率分布,得到基于注意力分布的最终特征;

输出层,将最终特征经softmax函数得到基于Attention机制下挡位类别的概率分布,输出最终的预测挡位值。

进一步,所述对所述ABi-LSTM模型进行训练,包括:

设置数据集大小,初始化超参数,包括迭代次数、学习率、Bi-LSTM层数、隐藏层数和嵌入层数;

将Bi-LSTM层输出的向量b输入到Attention层,将权重向量c与输出向量b进行相乘,通过softmax函数得出注意力权重系数后输入到全连接层中,得出挡位分类;

计算注意力的概率分布,利用注意力分布的最终特征向量中某一个分量值与所有类别标签分量相除,通过输出层的softmax函数,计算得出分类标签的概率分布,利用注意力分布对最终挡位分类结果进一步优化,优化后的状态作为最终的挡位特征;

将最终的挡位特征经softmax函数分类,得到基于Attention机制下挡位类别的概率分布;

若根据当前ABi-LSTM模型预测出下一时刻的换挡结果与固定变量标签数据之间的误差值在预设范围值内,则将当前ABi-LSTM模型记为最佳训练模型。

进一步,所述由训练好的ABi-LSTM模型对挡位进行预测,包括:

将部分数据集作为验证集,将验证集输入训练好的ABi-LSTM模型,得到预测挡位值;

在ABi-LSTM模型中添加Adam优化器计算梯度,动态调整各参数的学习率;

梯度反向传播更新权值参数;

按照预设间隔每循环预先设定次数的训练集后,将测试集输入ABi-LSTM模型,记录准确率,并保存最高准确率时的网络权重作为最终权重;

判断是否达到规定的迭代次数,在损失函数已达到最小值后,提前终止迭代;

使用训练好的模型和权重执行挡位预测任务,使用测试集对模型进行评估,获取挡位预测结果,统计每条挡位预测的精确度,以所有预测结果的精确度取平均值做为最终精确度。

进一步,所述预测方法还包括验证的步骤:对从最低前进挡到最高前进挡的m个连续实车数据进行统计,得到挡位预测时间最大值、最小值和平均值,以兼顾预测时间和预测精度作为验证评价指标。

一种特种车辆自动换挡预测系统,其包括:数据采集处理模块,远程采集特种车辆实时运行数据并进行预处理,得到运行数据中各参数的真实物理数据,进行本地存储做为数据集;挡位预测模块,构建ABi-LSTM模型,将所述数据集输入至ABi-LSTM模型构成该模型的输入层,对所述ABi-LSTM模型进行训练,由训练好的ABi-LSTM模型对挡位进行预测。

一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行上述方法中的任一方法。

一种计算设备,其包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行上述方法中的任一方法的指令。

本发明由于采取以上技术方案,其具有以下优点:

本发明通过CAN总线采集人工驾驶过程中产生的车辆状态数据,并将其处理成合适的顺序格式。一部分数据用于训练ABi-LSTM网络模型进行换挡预测,另一部分数据用于验证。为了评估机器学习模型的性能,采用其他的递归神经网络,包括Bi-LSTM网络模型、LSTM网络模型和RNN网络模型进行比较,ABi-LSTM网络模型的准确率高于其他三个模型。此外,对于换挡的时间实时性进行对比实验,ABi-LSTM网络模型相比其他三个模型的换挡预测耗时最低,符合车辆实时处理的要求。因此,ABi-LSTM模型具有实时性好、预测精度高的特点,可应用于基于时间序列数据的多路况下重型矿车。

附图说明

图1是本发明实施例中特种车辆自动换挡预测方法流程图;

图2是本发明实施例中原始数据处理流程图;

图3是本发明实施例中ABi-LSTM的模型结构图;

图4是本发明实施例中ABi-LSTM模型训练流程图;

图5是本发明一实施例中的计算设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

本发明提供一种特种车辆自动换挡预测方法及系统,首先从重型矿车采集实车原始数据,解析CAN协议,再将数据作为训练集输入到本文所采用的ABi-LSTM模型当中,通过不断调整参数最终输入新的测试集进行预测挡位,最后对预测时间进行统计,得到单条挡位预测的最大时间,最小时间以及平均时间,完成挡位预测任务。本发明采用的ABi-LSTM网络模型能实现换挡预测耗时最低,符合车辆实时处理的要求。ABi-LSTM模型具有实时性好、预测精度高的特点,可应用于基于时间序列数据的多路况下重型矿车。

在本发明的一个实施例中,如图1所示,提供一种特种车辆自动换挡预测方法,本实施例中,以重型矿车为例进行说明,该方法包括以下步骤:

1)远程采集特种车辆实时运行数据并进行预处理,得到运行数据中各参数的真实物理信号,进行本地存储做为数据集;

2)构建ABi-LSTM模型(注意力机制结合双向长短期记忆模型,Attention Bi-directional Long Short-Term Memory,ABi-LSTM),将数据集输入至ABi-LSTM模型构成该模型的输入层,对ABi-LSTM模型进行训练,由训练好的ABi-LSTM模型对挡位进行预测。

上述步骤1)中,因ABi-LSTM模型训练需要实车多工况下的海量数据,因此需要先对实车数据进行采集。将以报文形式从CAN总线传输的数据根据CAN通信协议进行解析并进行数据预处理,得到各参数的真实物理信号,并通过无线通讯发送至远程在线数据存储中心进行存储。存储的数据将作为建立模型的数据集。本实施例中以重型矿车为例,与换挡相关的矿车,可通过参数组号(PGN)从原始数据中按时间顺序进行解码,矿车性能配置参数如表1所示。

表1矿车参数性能配置表

具体的,采集特种车辆实时运行数据并进行预处理,包括以下步骤:

1.1)根据CAN通信协议,由CAN总线将采集到的数据进行解析,将每一段重型矿车上各传感器采集的运行数据的CAN数据帧进行重组,得到有效的物理信号,即HTD(HeavyTruck Data,重型矿车数据);

在本实施例中,由于各个参数属于其不同的PGN,所以需要对每一段重型矿车数据的CAN数据帧进行重组。

1.2)对多参数异常值进行处理,保证数据质量;

在本实施例中,对于重型矿车数据可能会产生异常值,这是由于传感器作为电子元件在工作过程中会受到温度、路况等环境因素的影响。在实际的驾驶过程中,环境因素会发生波动,所以在采集的数据中会出现一些数值记录异常。

为了找到离群点,本实施例中采用了基于箱形图的离群点检测方法,排除实车数据中的异常值,以保证数据质量。对所有参数分别计算上边缘(UE)、上四分位数(Q3)、中位线、下四分位数(Q1)、下边缘(LE)和离群值。当该值大于上限UE或小于下限LE时,视为离群值。经过计算和分析,不存在离群值。

1.3)为了避免出现奇异样本及之后加快网络模型学习的速度,将对异常值处理后的实车数据进行归一化,使得所有样本的输入数据其均值接近于0或与其均方差相比很小,保证所有数据都在[0,1]范围内,通过标准化后,消除特征间差异和尺度的影响,使实车数据更加符合分布规律同时加强模型的泛化能力,公式如式(1)所示。

式中,

上述步骤1.1)中,将每一段特种车辆数据的CAN数据帧进行重组,如图2所示,包括以下步骤:

1.1.1)设置每个标志对应特种车辆数据中的相应参数,写入原始标识位数组中,记为XO

1.1.2)将XO

1.1.3)将最终的XN

上述步骤2)中,由于传统RNN算法会出现在某一时刻梯度爆炸或消失的问题,无法获取到当前时刻的所有单元状态,改进后的LSTM(Long Short Term Memory)仍存在无法读入未来时刻的单元状态,即无法从后到前对信息进行编码的问题,Bi-LSTM(Bi-directional Long Short-Term Memory)虽然可以保存长期状态,但是在面对多个变量的数据集时,由于在模型训练过程中因忽略某些具有很强的时间连续性数据,将导致模型无法准确考虑具体变量对换挡的影响,进而会影响预测的精确度,而将注意力机制结合双向长短期记忆循环神经网络算法应用到自动变速器自动换挡策略中,不仅可以考虑实车实际行驶过程中的时间连续性,并对各参数赋予了不同的权重,本发明的更有针对性,很好地解决上述几个模型产生的问题。本发明采用以Bi-LSTM模型为基础的ABi-LSTM模型,去训练具有时序性的数据集,建立换挡预测模型得出最佳换挡点。

在本实施例中,构建ABi-LSTM模型,包括:

隐藏层,依次将前向i时刻下各自独立方向的状态相加,以及后向i时刻下各自独立方向的状态相加,将每个方向下的最终隐藏层状态值进行求和;

Attention层,用于获取隐藏层在t+i时刻下对于Bi-LSTM最终状态的注意力概率分布,得到基于注意力分布的最终特征;

输出层,将最终特征经softmax函数得到基于Attention机制下挡位类别的概率分布,输出最终的预测挡位值。

在本实施例中,ABi-LSTM模型结构如图3所示,其中x

首先,计算Bi-LSTM单元输出值h

h

计算i时刻内的H,由h

其中,计算注意力机制的概率分布a

式中,a

计算基于注意力机制概率分布的最终i时刻状态注意力概率分布特征r

式中,h

在得到最终的概率分布r

式中,V表示ABi-LSTM模型输出层对应的权重矩阵,L为挡位类别标签的数量。对每一个权重r

上述步骤2)中,对ABi-LSTM模型进行训练,如图4所示,将数据集输入到ABi-LSTM模型中,构成模型的输入层,开始训练过程,在一定数量的有效的重型矿车数据中,一部分用于模型训练,其余用于验证。具体包括以下步骤:

2.1)设置数据集大小,初始化超参数,包括迭代次数、学习率、Bi-LSTM层数、隐藏层数和嵌入层数;

在本实施例中,由于异常值或考虑到因时间延迟性而导致数据丢失的问题而导致实车数据的延迟问题,数据集大小将设置为用i-t的数据来预测i+t时刻数据。

2.2)将Bi-LSTM层输出的向量b输入到Attention层,将权重向量c与输出向量b进行相乘,通过softmax函数得出注意力权重系数后输入到全连接层中,最终得出挡位分类;

具体的,输入三个Bi-LSTM层,这三个层设置成相同的参数设置。初始化超参数,其中包括迭代次数,学习率、Bi-LSTM层数、隐藏层数、嵌入层数,对其中的各参数设置如表2所示。

表2超参数初始化表

将第三个Bi-LSTM层的输出后的向量b输入到Attention层后,将计算得出的权重向量c与输出向量b合并,得到的向量作为全连接层的输入。

2.3)计算注意力的概率分布,利用注意力分布的最终特征向量r’

经过全连接层的训练后,输出值将通过Sigmoid进行运算;

2.4)将最终的挡位特征经softmax函数分类,得到基于Attention机制下挡位类别的概率分布;

若根据当前ABi-LSTM模型预测出下一时刻的换挡结果与固定变量标签数据之间的误差值在预设范围值内,则将当前ABi-LSTM模型记为最佳训练模型。

上述步骤2)中,由训练好的ABi-LSTM模型对挡位进行预测,包括:

2.5)将部分数据集作为验证集,将验证集输入训练好的ABi-LSTM模型,得到预测挡位值;

2.6)在ABi-LSTM模型中添加Adam优化器计算梯度,动态调整各参数的学习率;

2.7)梯度反向传播更新权值参数;

2.8)按照预设间隔每循环预先设定次数的训练集后,将测试集输入ABi-LSTM模型,记录准确率,并保存最高准确率(Accuracy)时的网络权重作为最终权重;

2.9)判断是否达到规定的迭代次数,在损失函数已达到最小值后,提前终止迭代;

2.10)使用训练好的模型和权重执行挡位预测任务,使用测试集对模型进行评估,获取挡位预测结果,统计每条挡位预测的精确度,以所有预测结果的精确度取平均值做为最终精确度。

最终得到评价指标准确率、F1分数,并与Bi-LSTM、LSTM和RNN模型进行了对比实验,评估ABi-LSTM的泛化能力,最终发现ABi-LSTM模型的准确率最高,Bi-LSTM次之,RNN最低。

其中,评价指标准确率Accuracy、F1分数和损失值如式(8)~(9)所示:

其中TP、FP、TN和FN分别表示错误预测为正类、错误预测正样本、正确预测负样本以及错误预测负样本。

上述各实施例中,本发明的预测方法还包括验证步骤3):对从最低前进挡到最高前进挡的m个连续实车数据进行统计,得到挡位预测时间最大值、最小值和平均值,以兼顾预测时间和预测精度作为验证评价指标。

具体的,将ABi-LSTM模型的挡位预测时间,与Bi-LSTM、LSTM和RNN模型进行对比实验。对从最低前进挡到最高前进挡的m个连续实车数据实验进行统计,得到运行时间最大值(max)、最小值(min)、平均值(avg)作为评价指标。通过对运行时间结果发现,四个模型的平均运行时间基本一致。在兼顾运行时间和精度的前提下,ABi-LSTM模型比其他三个模型在重型矿车换挡领域具有更好的适应性。

在本发明的一个实施例中,提供一种特种车辆自动换挡预测系统,其包括:

数据采集处理模块,远程采集特种车辆实时运行数据并进行预处理,得到运行数据中各参数的真实物理数据,进行本地存储做为数据集;

挡位预测模块,构建ABi-LSTM模型,将数据集输入至ABi-LSTM模型构成该模型的输入层,对ABi-LSTM模型进行训练,由训练好的ABi-LSTM模型对挡位进行预测。

本实施例提供的系统是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。

如图5所示,为本发明一实施例中提供的计算设备结构示意图,该计算设备可以是终端,其可以包括:处理器(processor)、通信接口(Communications Interface)、存储器(memory)、显示屏和输入装置。其中,处理器、通信接口、存储器通过通信总线完成相互间的通信。该处理器用于提供计算和控制能力。该存储器包括非易失性存储介质、内存储器,该非易失性存储介质存储有操作系统和计算机程序,该计算机程序被处理器执行时以实现一种挡位预测方法;该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、管理商网络、NFC(近场通信)或其他技术实现。该显示屏可以是液晶显示屏或者电子墨水显示屏,该输入装置可以是显示屏上覆盖的触摸层,也可以是计算设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。处理器可以调用存储器中的逻辑指令,以执行如下方法:远程采集特种车辆实时运行数据并进行预处理,得到运行数据中各参数的真实物理数据,进行本地存储做为数据集;构建ABi-LSTM模型,将所述数据集输入至ABi-LSTM模型构成该模型的输入层,对所述ABi-LSTM模型进行训练,由训练好的ABi-LSTM模型对挡位进行预测。

此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算设备的限定,具体的计算设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在本发明的一个实施例中,提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:远程采集特种车辆实时运行数据并进行预处理,得到运行数据中各参数的真实物理数据,进行本地存储做为数据集;构建ABi-LSTM模型,将所述数据集输入至ABi-LSTM模型构成该模型的输入层,对所述ABi-LSTM模型进行训练,由训练好的ABi-LSTM模型对挡位进行预测。

在本发明的一个实施例中,提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储服务器指令,该计算机指令使计算机执行上述各实施例提供的方法,例如包括:远程采集特种车辆实时运行数据并进行预处理,得到运行数据中各参数的真实物理数据,进行本地存储做为数据集;构建ABi-LSTM模型,将所述数据集输入至ABi-LSTM模型构成该模型的输入层,对所述ABi-LSTM模型进行训练,由训练好的ABi-LSTM模型对挡位进行预测。

上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术分类

06120114683706