掌桥专利:专业的专利平台
掌桥专利
首页

面向驾驶风险评估的驾驶风格辨识方法、电子设备、介质

文献发布时间:2024-04-18 19:59:31


面向驾驶风险评估的驾驶风格辨识方法、电子设备、介质

技术领域

本发明属于驾驶行为数据处理领域,尤其涉及一种面向驾驶风险评估的驾驶风格辨识方法、电子设备、介质。

背景技术

驾驶风格指的是驾驶员操作车辆的特有、习惯性的方式,能够体现其驾驶倾向、偏好以及个性化的驾驶模式。尽管驾驶员在个体属性以及所面对的交通和道路环境的不同使得不同驾驶员在驾驶操作上千差万别,但仍存在一些共性,使得我们能将驾驶员划分为不同的驾驶风格。对于驾驶风格的深入研究,构建准确的驾驶风格辨识模型,对于交通安全的提升和个性化车辆服务的设计,具有重要意义。

在现有研究中,通常会利用先验知识设计实验或者采用专家评估的方法,以获得带有驾驶风格标签的样本集,导致样本集的客观程度难以保证。同时,现有研究中,往往会忽略交通和道路环境对于驾驶员操作的影响,导致所提取的驾驶风格特征不能准确的反应驾驶员的真实风格。最后,现有研究倾向于将驾驶风格分为谨慎型、一般型和激进型等类别,然而上述分类方法往往无法直接应用与具体的显示场景,尤其是在车辆保险行业。

发明内容

鉴于此,本发明提出了一种面向驾驶风险评估的驾驶风格辨识方法、电子设备、介质。

第一方面,本发明实施例提供了一种面向驾驶风险评估的驾驶风格辨识方法,所述方法包括:

获取某一车险周期中车辆的驾驶操作数据、车辆状态数据和出险记录;

将驾驶操作数据作为样本,将出险记录作为样本标签,根据车辆状态数据对样本进行预处理、标准化;

将驾驶操作数据以及对应的速度序列输入预先训练好的驾驶风格特征提取模型,提取得到驾驶特征,所述驾驶特征包括驾驶风格特征以及速度映射;其中,驾驶风格特征提取模型对应的损失函数为输入的驾驶操作数据与驾驶风格特征提取模型预测输出的驾驶操作数据之间的均方差、输入的速度序列与驾驶风格特征提取模型预测输出的速度序列之间的均方差、世界轻型汽车测试循环工况规定的速度序列与速度映射之间的均方差之和;

对提取到的驾驶特征进行聚类;

获取每一聚类结果的轮廓系数、出险概率标准差、样本分布,根据轮廓系数、出险概率标准差、样本分布获取每一聚类结果的聚类结果评分,将聚类结果评分最高的聚类结果作为最优聚类结果;其中,出险概率标准差的计算过程包括:所有样本被聚类分为若干个驾驶风格类别,根据每一样本在该车险周期中的出险记录,计算每个驾驶风格类别的平均出现概率,得到出险概率标准差;

根据最优聚类结果按照出现概率划分出险风险等级。

第二方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的面向驾驶风险评估的驾驶风格辨识方法。

第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的面向驾驶风险评估的驾驶风格辨识方法。

与现有技术相比,本发明的有益效果为:

1、本发明从车辆CAN-BUS中采集一批驾驶员实际用车过程中的多维驾驶操作数据(方向盘转角、档位、加速踏板行程及制动踏板行程),形成原始数据集,以反映不同驾驶员的驾驶风格。

2、采用融合了自注意力机制的卷积神经网络来对多维驾驶操作数据进行特征降维,能提取到空间和时间的综合特征。

3、通过在自编码器中添加标准化功能,能够将不同的驾驶员约束到同一驾驶速度序列上,实现了不同驾驶员在统一工况下的驾驶风格特征的提取,以世界轻型汽车测试循环工况规定的速度序列与速度映射之间的均方差为约束条件,通过WLTC测试循环以还原国内的常见工况,使得所得的驾驶风格特征能表征驾驶风险。

4、本发明综合轮廓系数、出险概率标准差和样本分布选择合适的聚类个数,结合了驾驶员上一保年的实际车辆保险出险数据,计算了不同风格驾驶员的出现概率。结果显示,本文开发的特征提取算法能够准确提取表征驾驶风险的特征,不同驾驶风格的驾驶员在出险概率上具备显著的差异。

附图说明

为了更清楚的说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图做简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的面向驾驶风险评估的驾驶风格辨识方法的示意图;

图2为本发明实施例提供的自编码器的结构图;

图3为本发明实施例提供的自编码器训练结果的示意图;

图4为本发明实施例提供的一种电子设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,下述的实施例及实施方式中的特征可以相互组合。

本发明实施例提供了一种面向驾驶风险评估的驾驶风格辨识方法,如图1所示,所述方法具体包括以下步骤:

步骤S1,获取某一车险周期中车辆的驾驶操作数据、车辆状态数据和出险记录。

具体地,所述驾驶操作数据指驾驶员操纵车辆方向盘、档位球、加速踏板、制动踏板等产生的数据,包括方向盘转角、档位、加速踏板行程值、制动踏板行程值;所述车辆状态数据包括车速、时间戳、车辆累计里程。出险记录指该驾驶员在上一保险周期中是否有出险,有出险则标记为1,否则标记为0。

进一步地,在本实例中通过乘用车控制器局域网总线(Control Area Network,CAN)采集某一车险周期中车辆的驾驶操作数据、车辆状态数据,并存储于云端数据库。

需要说明的是,乘用车控制器局域网总线(Control Area Network,CAN)采集驾驶员操作车载设备(方向盘、档位球、加速踏板、制动踏板)时产生的多维数据,如方向盘转角、档位、加速踏板行程及制动踏板行程。驾驶操作数据是驾驶员的驾驶操作直接产生的数据,能够最直接的反应驾驶员的驾驶风格。驾驶员通常会根据行车工况同时操作多个车载设备,因此这些多维驾驶操作数据(方向盘转角、档位、加速踏板行程值、制动踏板行程值)之间不是互相孤立,综合分析这些数据能够更为全面的表征驾驶员的驾驶风格。

步骤S2,将驾驶操作数据作为样本,将出险记录作为样本标签,根据车辆状态数据对样本进行预处理、标准化。

具体地,所述步骤S2具体包括以下子步骤:

步骤S201,对样本中的连续数据按照预设的长度进行切片,计算每段数据的派生值,筛选并删除异常的数据以及异常的派生值。

在本实例中,所述样本中的连续数据为指的是采样时间间隔为10s的数据,切片长度设置为3600,每段数据包含3600个数据点。

所述派生值包括累计里程、车速标准差、累计时长、累计里程与累计时长的比值。

进一步地,筛选并删除异常的数据以及异常的派生值包括:删除车速标准差等于0的数据段,车速标准差等于0的数据段说明车速在整个时段中没有变化,应为错误数据;删除累计里程与累计时长比值大于220的数据段,累计里程与累计时长比值大于220的数据段说明车辆累计里程的统计可能存在跳跃;删除车速标准差等于0的数据段,车速标准差等于0的数据段说明在此时间段内,没有记录到任何车速,应为异常。

步骤S202,采用Z-Score算法对步骤S201预处理后的数据进行标准化,表达式如下:

式中,X表示原始数据,

步骤S3,将驾驶操作数据以及对应的速度序列输入预先训练好的驾驶风格特征提取模型,经驾驶风格特征提取模型提取得到驾驶特征,所述驾驶特征包括驾驶风格特征以及速度映射;所述驾驶风格特征提取模型对应的损失函数为输入的驾驶操作数据与驾驶风格特征提取模型预测输出的驾驶操作数据之间的均方差、输入的速度序列与驾驶风格特征提取模型预测输出的速度序列之间的均方差、世界轻型汽车测试循环工况规定的速度序列与速度映射之间的均方差之和。

如图2所示,本实例中,所述驾驶风格特征提取模型采用卷积自编码器,包括编码器部分以及解码器部分;所述编码器部分包括依次连接的输入层、第一卷积层(Convolutional layer)、第一最大池化层(Maxpooling layer)、第二卷积层、第二最大池化层、自注意力机制模块和两层全连接层(Fully-connected Layer,FC layer);所述解码器部分包括依次连接的两层全连接层、第一反最大池化层(Unmaxpooling layer)、第一反卷积层(Unconvolutional layer)、第二反最大池化层、第二反卷积层以及输出层。

其中,所述自注意力机制模块由一个自注意力层与一个可学习的参数构成,假设自注意力层的输入为X

X′

进一步地,经驾驶风格特征提取模型提取得到驾驶特征Feature可以被分解为驾驶风格特征f以及速度映射v,三者的关系可以表示为:

f=[f

v=[v

进一步地,所述驾驶风格特征提取模型的对应的损失函数为:输入的驾驶操作数据DA与驾驶风格特征提取模型预测输出的驾驶操作数据DA′之间的均方差、输入的速度序列VS与驾驶风格特征提取模型预测输出的速度序列VS′之间的均方差、世界轻型汽车测试循环工况规定的速度序列SV与速度映射v之间的均方差之和。表达式如下:

式中,n为样本数量,i=1,2,3,…,n,SV为世界轻型汽车测试循环工况(Worldwideharmonized Light-duty vehicles Test Cycle,WLTC)规定的速度序列。该测试工况能够表征中国驾驶工况的普遍特征。以世界轻型汽车测试循环工况规定的速度序列与速度映射之间的均方差为约束条件,通过训练过程中损失函数的收敛使得每个驾驶员都能实现WLTC规定的驾驶序列,能够提取到不同驾驶员在同一工况下的特征。

进一步地,驾驶风格特征提取模型的训练结果如图3所示,驾驶风格特征提取模型能够很好的完成速度映射v同WLTC速度序列之间的一致化,超过95%样本点的误差在(-2.0km/h,2.0km/h)之间,能够满足行业场景的应用。

需要说明的是,经过自编码器提取的驾驶风格特征是长度为1800的时间序列数据。卷积层的使用能够提高模型对于多维数据临近区域的特征提取能力,包括不同维度的数据之间的空间特征以及不同时间步的数据之间的时间特征。在用车过程中,驾驶员可能在间隔不定的情况下遇到相似的交通和道路环境,进而产生相似的驾驶操作。自注意力机制的使用能够提高模型对于多维数据不定距离下的特征提取能力,能更好的提取此类特征。

步骤S4,对步骤S3提取到的驾驶特征进行聚类。

具体地,在本实例中,采用TimeSeriesKMeans算法来对步骤S3提取到的驾驶特征进行聚类。TimeSeriesKMeans时序数据均值聚类是一种以数据迭代为基础,一步步寻求最佳聚类结果的机器学习方法。具体包括以下步骤:

步骤S401,首先指定聚类个数k,指定迭代次数,随机选取k个聚类中心。

步骤S402,接下来根据softDTW算法计算每个样本与聚类中心之间的距离,将距离最近的样本构成一类。

步骤S403,然后判断前后两次迭代的误差是否在预设的平均误差范围之内,如果不符合,则更新聚类中心,将样本重新分配,并计算平均误差,如果符合,则结束迭代。

步骤S404,最终输出迭代结束或完成后的聚类结果。

步骤S5,获取每一聚类结果的轮廓系数、出险概率标准差、样本分布,根据轮廓系数、出险概率标准差、样本分布获取每一聚类结果的聚类结果评分,将聚类结果评分最高的聚类结果作为最优聚类结果;其中,出险概率标准差的计算过程包括:所有样本被聚类分为若干个驾驶风格类别,根据每一样本在该车险周期中的出险记录,计算每个驾驶风格类别的平均出现概率,得到出险概率标准差。

具体地,出现概率标准差SC包括:

出险概率标准差用于表征当次聚类结果中,各个类别的平均出险概率之间的差异,出现概率标准差SC越大,表示不同驾驶风格在出险概率上差异越大,风格辨识越准确。

经过聚类,所有样本v

式中,|

出险概率标准差可以表示为:

式中,

样本分布SD包括:

样本分布用于表征当此聚类结果中,各个驾驶风格类别中样本数量分布的差异,通常情况下,样本分布SD越小,表示样本在各个驾驶风格类别中的分布越均匀。

样本分布SD可以表示为:

式中,

根据轮廓系数、出险概率标准差、样本分布获取每一聚类结果的聚类结果评分σ,表达式如下:

式中,SI表示轮廓系数。

式中,j表示进行聚类结果比较的聚类操作次数。

需要说明的是,考虑到驾驶员在呈现类似的驾驶风格的同时,驾驶员本身的独特性仍然存在,并且,当轮廓系数超过一定范围后,聚类结果的有效性已经能得到保证。因此采用轮廓系数SI的平方根值进行聚类结果评分σ的计算以降低过高轮廓系数带来的影响。其中,由于聚类个数的增加无可避免的会造成样本分布SD的降低,因此通过增加权重因子

示例性地,本实施例采集了73名驾驶员在上一保年中的相关数据进行分析,经过特征提取以及聚类,在聚类个数为3、4和5的结果分别如表1和表2所示。出险概率为该类别中所有样本的平均出险概率。

表1

表2

表3

经计算,当k=3时,σ=0.336;当k=4时,σ=0.341;当k=5时,σ=0.323。当k=4时,聚类结果评分σ最大,因此选择聚类个数为4时的聚类结果作为最终结果。

需要说明的是,传统的无监督聚类在进行最优聚类个数选择时,往往仅根据不同聚类个数聚类结果的轮廓系数大小来判断,容易忽略样本数据的实际特点。驾驶员在呈现类似的驾驶风格的同时,驾驶员本身的独特性仍然是存在的,因此本发明在选择最佳聚类个数时除了参考轮廓系数,还会考虑出险概率标准差以及样本分布情况。因为本发明所提取的是不同驾驶员在同一交通和道路条件下的特征,因此不同驾驶风格的驾驶员的出险概率应当具有明显的区别,体现在出险概率标准差的大小上。由于本实施例是完全采集的真实世界的驾驶员数据,可能出现部分极端样本,因此聚类结果中的样本分布也是需要考虑的。

如表1和表2所示,在比较聚类个数分别为3和4的聚类结果时,前者的轮廓系数明显大于后者的轮廓系数,但两者的轮廓系数都处于较高水平,证明两次聚类的结果都是有效的。同时两者的出险概率标准差接近,两次聚类都能区分出出险概率具备明显差异的不同类别的驾驶风格。考虑两次聚类结果中的样本分布,可以看出,两次聚类都能明显辨识出两组极端的样本,而当聚类个数仅为3时,TimeSeriesKMeans算法不足以将大部分样本区分开,而当聚类个数为4时,除了两组极端的样本,剩下的样本被合理的分成了两类不同的驾驶风格,且不同驾驶风格的出现概率具有显著差异,分别为0.267和0.473。

如表3所示,在聚类个数为5时,聚类结果无论在轮廓系数、出险概率标准差以及样本分布上,均未能优于在聚类个数为4时的聚类结果,因此综合考虑下,本实施例应当选择聚类个数为4时的聚类结果作为最终结果。

本发明所提出的三种指标中,轮廓系数能够反应聚类结果的有效性,出险概率标准差能够在一定程度上验证聚类结果的准确性,样本分布能够反应出是否具备极端样本。综合考虑三种指标,根据聚类结果评分高低,选择合适的聚类个数,能够得出最优的驾驶风格辨识结果。

步骤S6,根据最优聚类结果按照出现概率划分出险风险等级。

根据最优聚类结果按照出现概率,将出险风险等级标记为:出险风险等级1、出险风险等级2、…出险风险等级k(k为聚类个数,即驾驶风格类别总数)。

示例性,在本实例中,所有样本被划分为四种驾驶风格,不同风格的驾驶员在出险概率上具有明显的差异。用于车辆保险设计时,Level 4和Level 3风格的驾驶员由于出险概率最高,可以考虑提高保费,而Level 2和Level 1风格的驾驶员出险概率较低,可以考虑降低保费。

如图4所示,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。

还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。

其中,存储器101可以是但不限于,随机存取存储器101(Random Access Memory,RAM),只读存储器101(Read Only Memory,ROM),可编程只读存储器101(ProgrammableRead-Only Memory,PROM),可擦除只读存储器101(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器101(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。

处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器102,包括中央处理器102(Central Processing Unit,CPU)、网络处理器102

(Network Processor,NP)等;还可以是数字信号处理器102(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请所提供的实施例中,应该理解到,所揭露的方法及系统,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

另一方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器101(ROM,Read-Only Memory)、随机存取存储器101(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

相关技术
  • 用于消费者封包商品的自备包装物封包的优质装运
  • 用于密封包装物的密封元件和用于密封包装物的设备
技术分类

06120116521919