掌桥专利:专业的专利平台
掌桥专利
首页

一种基于GAPSO-SVM模型的行驶工况识别方法及系统

文献发布时间:2023-06-19 13:29:16


一种基于GAPSO-SVM模型的行驶工况识别方法及系统

技术领域

本发明属于车辆行驶工况识别技术领域,尤其涉及一种基于GAPSO-SVM模型的行驶工况识别方法及系统。

背景技术

目前,车辆的行驶工况指时间-速度曲线,车辆在行驶过程中能量消耗会受工况影响,针对不同工况,可以制定不同的车辆能量管理策略,进而达到节能减排的效果。目前不少学者对行驶工况识别算法进行了研究,王宪彬等分析了商用车在行驶过程中的工况特点,基于朴素贝叶斯分类器对高速公路行驶工况进行识别。Lin等采用K-means算法对工况进行聚类,再通过学习向量量化神经网络实时识别行驶工况。Xie等提出了一种马尔可夫链与模糊分类相结合的混合模型,将该模型用于识别行驶工况,并使用一种统计方法来估计两种模型之间切换的最佳时间,以修正识别结果。上述方法中,传统聚类算法对聚类中心敏感,中心值选取对识别结果影响大;使用传统的神经网络算法时,需要预先获得大量训练数据,在实际操作中有一定困难;传统模糊识别方法对专家经验依赖大,需要反复调整隶属度函数。支持向量机(support vector machine,SVM)初始设置少、无需反复调整函数,具有较好的鲁棒性。因此,亟需一种新的、基于支持向量机的行驶工况识别方法及系统。

通过上述分析,现有技术存在的问题及缺陷为:

(1)现有的车辆行驶工况识别方法中,传统聚类算法对聚类中心敏感,中心值选取对识别结果影响大。

(2)现有的车辆行驶工况识别方法中,使用传统的神经网络算法时,需要预先获得大量训练数据,在实际操作中有一定困难,如训练时间过长、数据量小时训练效果不佳等。

(3)传统模糊识别方法对专家经验依赖大,需要反复调整隶属度函数。

(4)传统SVM识别模型采用k-cv进行参数寻优,计算量较大。

解决以上问题及缺陷的难度为:

需要大量样本,迭代次数较多,难以较好地收敛至最优解。

解决以上问题及缺陷的意义为:

在传统SVM识别模型的参数寻优部分使用该算法,能较好地将参数收敛至最优解,并提升识别精度。

发明内容

针对现有技术存在的问题,本发明提供了一种基于GAPSO-SVM模型的行驶工况识别方法及系统。

本发明是这样实现的,一种基于GAPSO-SVM模型的行驶工况识别方法,所述基于GAPSO-SVM模型的行驶工况识别方法包括以下步骤:

步骤一,行驶工况样本获取;

步骤二,行驶工况样本特征提取及预处理;

步骤三,基于GAPSO-SVM模型的行驶工况识别仿真。

进一步,步骤一中,所述行驶工况样本获取,包括:

根据不同工况的特点,选定城市、郊区以及高速3类典型工况进行识别,每类行驶工况特点如下:①城市工况:红绿灯多,交通流量相对较大,偶尔会出现道路拥堵的情况,车速偏低;②郊区工况:车辆能够保持一定速度稳定行驶,与城市工况相比怠速及停车情况更少;③高速工况:速度较高且整体波动较小,几乎不存在拥堵情况。

选取各国发布的标准行驶工况进行裁剪拼接,将每个标准行驶工况分别选取80%和20%构成训练数据和测试数据,使用标准行驶工况WLTP低速部分、NYCC、USA_CITY_II、UDDS构成城市工况;WLTP中速部分、ARTEMIS_ROAD、USA_CITY_I构成郊区工况;WLTP高速及超高速部分、USA_FTP_HIGHWAY、ARTEMIS_MOTORWAY构成高速工况,对数据拼接处做平滑处理。

定义城市工况、郊区工况、高速工况的编号分别为1、2、3,考虑到拼接后每类工况的总时长不同,使用随机数法抽取样本;取连续数据片段120s构成一组样本,从每类行驶工况的训练数据中抽取160组样本构成训练集,从每类行驶工况的测试数据中抽取40组样本构成测试集,共计600组样本。

各样本的初始时刻为:

t

式中,α为在区间(0,1)内的随机数,T为某类工况数据的总时长,ΔT为样本片段时长,即120s。

进一步,步骤二中,所述行驶工况样本特征提取及预处理,包括:

通过计算得到每组样本的12个特征参数,将特征值进行归一化处理,统一特征参数的数量级:

式中,X

使用主成分分析法对特征参数进行预处理,选取累计贡献率达到80%以上且特征值大于1的主成分作为后续的识别模型输入参数。

进一步,所述12个特征参数,包括:①最大速度,单位km/h;②平均速度,单位km/h;③平均加速度,单位m/s

进一步,步骤三中,所述基于GAPSO-SVM模型的行驶工况识别仿真,包括:

(1)利用GAPSO模型优化SVM的C、g参数;

(2)将优化结果输入SVM进行行驶工况的识别;

(3)使用测试样本验证识别模型的准确率。

进一步,步骤三中,所述基于GAPSO-SVM模型的行驶工况识别仿真,还包括:

行驶工况识别仿真使用k-cv法SVM、PSO-SVM和GAPSO-SVM分别进行模型训练,再进行识别准确率对比。

使用k-cv法对参数C和g进行网格寻优时,最优参数值为识别准确率最高时对应的参数值,设置C、g取值范围为:

C∈{2

使用PSO模型进行参数寻优时,设置最大迭代次数为100,种群数量为40,ω为0.6,c

使用GAPSO模型进行参数寻优时,设置最大迭代次数为100,种群数量为40,ω为0.6,c

本发明的另一目的在于提供一种应用所述的基于GAPSO-SVM模型的行驶工况识别方法的基于GAPSO-SVM模型的行驶工况识别系统,所述基于GAPSO-SVM模型的行驶工况识别系统包括:

样本获取模块,用于进行行驶工况样本获取;

样本预处理模块,用于进行行驶工况样本特征提取及预处理;

行驶工况识别模块,用于进行基于GAPSO-SVM模型的行驶工况识别仿真。

本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

行驶工况样本获取;行驶工况样本特征提取及预处理;基于GAPSO-SVM模型的行驶工况识别仿真:利用GAPSO模型优化SVM的C、g参数;将优化结果输入SVM进行行驶工况的识别;使用测试样本验证识别模型的准确率。

本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:

行驶工况样本获取;行驶工况样本特征提取及预处理;基于GAPSO-SVM模型的行驶工况识别仿真:利用GAPSO模型优化SVM的C、g参数;将优化结果输入SVM进行行驶工况的识别;使用测试样本验证识别模型的准确率。

本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的基于GAPSO-SVM模型的行驶工况识别系统。

结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的基于GAPSO-SVM模型的行驶工况识别方法,支持向量机(support vector machine,SVM)初始设置少、无需反复调整函数,具有较好的鲁棒性,本发明使用遗传粒子群算法(geneticalgorithm for particle swarm optimization,GAPSO)优化SVM进行行驶工况识别。

本发明利用现有标准工况构建3类典型工况,对不同类别的工况进行特征参数提取,并使用归一化、主成分分析进行数据预处理;建立GAPSO-SVM识别模型,并在MATLAB上进行仿真实验。在测试集上分别用k-cv法SVM、PSO-SVM、GAPSO-SVM模型对比识别精度,实验结果表明,GAPSO-SVM模型的识别精度分别比k-cv法SVM、PSO-SVM高出5.59%、2.63%。

车辆在不同行驶工况下能量消耗不同,对行驶工况进行识别能够进一步制定能量管理策略,因此本发明提出一种基于GAPSO-SVM模型的行驶工况识别算法,利用现有的标准工况数据,构建“城市工况”、“郊区工况”和“高速工况”三类典型工况数据库,并划分训练数据与测试数据进行取样,提取样本特征参数后采用主成分分析法进行降维处理,再采用GAPSO-SVM模型识别行驶工况。同时,本发明将优化后的GAPSO-SVM模型与k-cv法SVM模型、PSO-SVM模型进行对比,结果表明:该模型识别准确率为84.38%,比k-cv法SVM模型、PSO-SVM模型识别准确率分别高出5.59%、2.63%。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于GAPSO-SVM模型的行驶工况识别方法的流程图。

图2是本发明实施例提供的GAPSO-SVM算法流程图。

图3是本发明实施例提供的基于GAPSO-SVM模型的行驶工况识别系统的结构框图;

图中:1、样本获取模块;2、样本预处理模块;3、行驶工况识别模块。

图4是本发明实施例提供的3类工况训练数据示意图。

图5是本发明实施例提供的3类工况测试数据示意图。

图6是本发明实施例提供的行驶工况识别方法流程图。

图7是本发明实施例提供的k-cv网格寻优过程示意图。

图8是本发明实施例提供的PSO寻优过程示意图。

图9是本发明实施例提供的GAPSO寻优过程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

针对现有技术存在的问题,本发明提供了一种基于GAPSO-SVM模型的行驶工况识别方法及系统,下面结合附图对本发明作详细的描述。

如图1所示,本发明实施例提供的基于GAPSO-SVM模型的行驶工况识别方法包括以下步骤:

S101,行驶工况样本获取;

S102,行驶工况样本特征提取及预处理;

S103,基于GAPSO-SVM模型的行驶工况识别仿真。

如图3所示,本发明实施例提供的基于GAPSO-SVM模型的行驶工况识别系统包括:

样本获取模块1,用于进行行驶工况样本获取;

样本预处理模块2,用于进行行驶工况样本特征提取及预处理;

行驶工况识别模块3,用于进行基于GAPSO-SVM模型的行驶工况识别仿真。

下面结合具体实施例对本发明的技术方案作进一步描述。

1、发明概述

支持向量机(support vector machine,SVM)初始设置少、无需反复调整函数,具有较好的鲁棒性,本发明使用遗传粒子群算法(genetic algorithm for particle swarmoptimization,GAPSO)优化SVM进行行驶工况识别。

车辆在不同行驶工况下能量消耗不同,对行驶工况进行识别能够进一步制定能量管理策略,因此本发明提出一种基于GAPSO-SVM模型的行驶工况识别算法,利用现有的标准工况数据,构建“城市工况”、“郊区工况”和“高速工况”三类典型工况数据库,并划分训练数据与测试数据进行取样,提取样本特征参数后采用主成分分析法进行降维处理,再采用GAPSO-SVM模型识别行驶工况。同时,本发明将优化后的GAPSO-SVM模型与k-cv法SVM模型、PSO-SVM模型进行对比,结果表明:该模型识别准确率为84.38%,比k-cv法SVM模型、PSO-SVM模型识别准确率分别高出5.59%、2.63%。

2、GAPSO-SVM模型简介

2.1SVM算法原理

传统SVM是一种经典的二分类算法,该算法能够将输入的样本特征转换至高维特征空间,使样本线性可分,再求解寻找超平面,在保证识别精度的同时使该超平面与样本间的间隔尽可能大。

假设给定训练样本:

D={(x

式(1)中:x

超平面记作:

(w·x)+b=0 (2)

式(2)中:w为超平面的法向量,b为超平面的截距。

支持向量是重要样本点,其距离超平面最近,不同类别的支持向量间隔d为:

使d最大等同于使||w||

构建Lagrange函数求解该约束优化问题:

式(5)中:a

在解决实际问题时,样本通常是非线性可分的。针对非线性问题,SVM引入了核函数,同时定义松弛变量ξ

由于高斯核函数可映射到无穷维度,且结构不复杂,本文使用经验法选取常用的高斯核函数作为核函数:

K(x,x

式(8)中:g为核函数宽度参数。

在SVM求解过程中,C和g两个参数的选取对分类效果影响大。C越大表示容错性小,可能会出现过拟合的情况,C越小则可能欠拟合;g越大表示支持向量越少,g越小则支持向量越多。本文通过GAPSO算法对C和g进行参数寻优。

2.2PSO算法原理

标准PSO算法中,各粒子进行信息传递,粒子记录并更新个体极值p

式(9)中:ω为惯性权重系数;

根据速度,粒子对自身位置x

2.3GAPSO-SVM算法

PSO算法具有收敛速度快的特点,同时可能因为过早收敛陷入局部最优。本文使用的GAPSO算法通过引入遗传算法(genetic algorithm,GA)中的杂交和变异操作,允许粒子在过早收敛前跳出局部最优搜寻其他区域。

随机选取2个粒子,按照杂交概率决定该轮循环是否进行杂交操作,新粒子的位置更新公式为:

式(11)中:p

按照变异概率决定该轮循环是否进行变异操作,并随机选取变量进行变异,新粒子的位置更新公式为:

式(12)中:N(0,1)为服从期望为0、方差为1的高斯分布。若变异后子代适应度高于父代,粒子位置更新为子代位置,否则位置不变。GAPSO-SVM算法流程见图2。

3、参数设置及仿真

本节使用现有的标准工况构建典型工况数据库,在MATLAB平台上结合Libsvm软件包完成GAPSO-SVM模型仿真,并使用该模型进行行驶工况识别。

3.1行驶工况样本获取

根据不同工况的特点,现有文献选定城市、郊区、高速3类典型工况进行识别,每类行驶工况特点如下:

1)城市工况。红绿灯多,交通流量相对较大,偶尔会出现道路拥堵的情况,车速偏低;

2)郊区工况。车辆能够保持一定速度稳定行驶,与城市工况相比怠速及停车情况更少;

3)高速工况。速度较高且整体波动较小,几乎不存在拥堵情况。

本文选取各国发布的标准行驶工况进行裁剪拼接,将每个标准行驶工况分别选取80%和20%构成训练数据和测试数据,使用标准行驶工况WLTP低速部分、NYCC、USA_CITY_II、UDDS构成城市工况;WLTP中速部分、ARTEMIS_ROAD、USA_CITY_I构成郊区工况;WLTP高速及超高速部分、USA_FTP_HIGHWAY、ARTEMIS_MOTORWAY构成高速工况,对数据拼接处做平滑处理。拼接后的3类工况训练数据见图4,3类工况测试数据见图5。

定义城市工况、郊区工况、高速工况的编号分别为1、2、3,考虑到拼接后每类工况的总时长不同,使用随机数法抽取样本。取连续数据片段120s构成一组样本,从每类行驶工况的训练数据中抽取160组样本构成训练集,从每类行驶工况的测试数据中抽取40组样本构成测试集,共计600组样本。各样本的初始时刻为:

t

式(13)中:α为在区间(0,1)内的随机数,T为某类工况数据的总时长,ΔT为样本片段时长,即120s。

3.2特征提取及预处理

行驶工况的特征值反应了不同工况的特点,根据现有文献,综合分析选取12个特征参数,见表1。

表1行驶工况特征参数

通过计算得到每组样本的12个特征参数,为了统一特征参数的数量级,将特征值进行归一化处理:

式(14)中:X

车辆行驶过程中特征值会随着工况的变化而变化,且特征参数之间存在一定关系,若考虑所有特征参数进行行驶工况识别反而会降低识别准确率。因此使用主成分分析法对特征参数进行预处理,主成分贡献率及累计贡献率见表2。

表2主成分贡献率及累积贡献率

根据文献,累计贡献率达到80%以上且特征值大于1的主成分包含大部分信息。由表2可知前4个主成分的累计贡献率为88.9021%,已超过80%,且前4个主成分的特征值均大于1,因此选取前4个主成分作为后续的识别模型输入参数。

3.3基于GAPSO-SVM模型的行驶工况识别仿真

行驶工况识别仿真使用k-cv法SVM、PSO-SVM和GAPSO-SVM分别进行模型训练,再进行识别准确率对比。本文使用的行驶工况识别方法流程图见图6。

使用k-cv法对参数C和g进行网格寻优时,最优参数值为识别准确率最高时对应的参数值,设置C、g取值范围为:

C∈{2

k-cv网格寻优过程见图7。

使用PSO模型进行参数寻优时,设置最大迭代次数为100,种群数量为40,ω为0.6,c

使用GAPSO模型进行参数寻优时,设置最大迭代次数为100,种群数量为40,ω为0.6,c

3种模型的训练结果对比见表3。使用GAPSO-SVM模型的训练集最优识别精度分别比k-cv法SVM和PSO-SVM模型高出1.04%和0.21%。

表3训练结果对比

4、仿真结果分析

测试样本共120组,城市工况、郊区工况、高速工况各40组,为消除样本抽取时随机数的影响,重复实验20次,取平均值作为识别结果,3种模型的测试集识别结果见表4~表6。使用k-cv法SVM、PSO-SVM和GAPSO-SVM的识别精度分别为78.79%、81.75%和84.38%,使用GAPSO-SVM模型的总识别精度相较于k-cv法SVM、PSO-SVM分别提升了5.59%、2.63%。3种模型对测试集的郊区工况识别错误率最高,同时GAPSO-SVM模型的各工况识别精度要高于其他2种模型。

表4 k-cv法SVM测试集识别结果

表5 PSO-SVM测试集识别结果

表6 GAPSO-SVM测试集识别结果

5、利用现有标准工况构建3类典型工况,对不同类别的工况进行特征参数提取,并使用归一化、主成分分析进行数据预处理。建立GAPSO-SVM识别模型,并在MATLAB上进行仿真实验。在测试集上分别用k-cv法SVM、PSO-SVM、GAPSO-SVM模型对比识别精度,实验结果表明,GAPSO-SVM模型的识别精度分别比k-cv法SVM、PSO-SVM高出5.59%、2.63%。

由于不同地区的道路交通规则不同,标准工况训练出的识别模型未必适用于所有地区,后续研究将实际采集车辆行驶工况进行模型训练。同时车辆行驶过程中行驶工况会受路况影响,后续研究将考虑结合路况信息对识别结果进行修正。

在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上;术语“上”、“下”、“左”、“右”、“内”、“外”、“前端”、“后端”、“头部”、“尾部”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid StateDisk(SSD))等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

相关技术
  • 一种基于GAPSO-SVM模型的行驶工况识别方法及系统
  • 一种基于U-Net网络模型的孔洞识别方法及系统
技术分类

06120113692379