一种基于动态知识计算的道路运输安全评估方法

文献发布时间：2024-04-18 19:58:26

技术领域

本发明涉及道路运输安全评估技术领域，具体涉及一种基于动态知识计算的道路运输安全评估方法。

背景技术

随着交通运输业的快速发展，道路运输领域的安全问题日益受到重视。超速、疲劳驾驶等违规行为，以及车辆技术、路况等因素的影响，都可能导致道路交通事故的发生。为了更好地保障道路运输安全，评估和降低企业在道路运输中的安全风险，成为了当前的研究热点。为此，提出一种基于动态知识计算的道路运输安全评估方法。

发明内容

本发明所要解决的技术问题在于：如何更好地保障道路运输安全，结合多维度数据评估和降低企业在道路运输中的安全风险，提供了一种基于动态知识计算的道路运输安全评估方法。

本发明是通过以下技术方案解决上述技术问题的，本发明包括以下步骤：

S1：数据获取

获取不同业务平台的基础数据和历史车辆的动态监控数据；

S2：特征分析与处理

对步骤S1中获取的数据进行特征分析和特征处理，得到处理后各业户的特征表；

S3：构建数据宽表及数据划分

对步骤S2中得到的各业户的特征表打上标签，得到对应的标签数据表，将特征表与标签数据表依据相同特征列联合得到最终使用表，即特征集宽表，对特征集宽表中的数据按照设定比例进行分层抽取，得到多组训练集、验证集和测试集；

S4：模型训练与评估

选取训练集数据训练集成学习模型的参数，保存训练后的集成学习模型，然后利用验证集对训练后的集成学习模型验证并评估模型性能，最后利用对测试集进行测试，并输出评估结果，该结果即为对应测试集的企业道路运输安全评分。

更进一步地，在所述步骤S1中，获取的不同业务平台的基础数据和历史车辆的动态监控数据包括运政车辆信息表、第一违法违规信息表、业户信息表、监控报警信息表、质量信誉考核记录表、上线率表、车辆年审记录信息表、动态监控报警信息表、第二违法违规信息表。

更进一步地，运政车辆信息表包括以下信息：车牌号码、车牌颜色、行业类别、业户ID；第一违法违规信息表包括以下信息：车牌号码、行业类别、企业单位名称、违法事实、违规时间；业户信息表包括：企业单位名称、业户ID、经营许可证；监控报警信息表包括以下信息：车牌号码、报警类型、开始时间、结束时间、最高时速、持续点数、持续时长；质量信誉考核记录表包括以下信息：业户ID、质量信誉考核结果、考核日期；上线率表包括以下信息：企业单位名称、1月上线率、2月上线率、3月上线率、4月上线率、5月上线率、6月上线率；车辆年审记录信息表包括以下信息：车牌号码、车牌颜色、年审年度、审批结果；动态监控报警信息表包括以下信息：车牌号码、报警类型、开始时间、结束时间、最高时速、持续点数、持续时长；第二违法违规信息表包括以下信息：车牌号码、行业类别、企业单位名称、违法事实、违规时间。

更进一步地，在所述步骤S2中，特征分析与处理的过程如下：

S21：对数据进行控制处理、异常值处理，并分别从单表和多表的角度来构建特征；

S22：依据单表的数据，从数量、类别层面进行特征构建；

S23：依据业户ID，联立多表，从业务、时间、报警类型层面构建数据特征；

S24：依据数据特征的相关性系数的大小，选取特征相关性为0.3以上的数据特征，进而形成各业户的特征表。

更进一步地，在所述步骤S3中，标签数据是一种连续值，值域在0-100之间。

更进一步地，在所述步骤S4中，使用MSE、MAE、MAPE对模型性能进行评估。

本发明相比现有技术具有以下优点：该基于动态知识计算的道路运输安全评估方法，以执法数据、企业违法数据等多方位数据为基础，对企业的道路运输安全风险进行评估和预测；采用传统机器学习算法来对这些数据进行回归分析，通过特征提取、特征选择和模型调优等手段来提高模型性能和准确性。

附图说明

图1是本发明实施例一中基于动态知识计算的道路运输安全评估方法的流程示意图；

图2是本发明实施例二中基于动态知识计算的道路运输安全评估系统的结构示意图；

图3是本发明实施例三中电子设备的结构示意图。

具体实施方式

下面对本发明的实施例作详细说明，本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

实施例一

如图1所示，本实施例提供一种技术方案：一种基于动态知识计算的道路运输安全评估方法，包括以下步骤：

S11：采集数据源

获取不同的业务平台的基础数据和历史车辆动态监控数据；

不同的业务平台的基础数据和历史车辆动态监控数据包括以下各表：

表1运政车辆信息表

表2违法违规信息(交通运输违法)表

表3业户信息表

表4监控报警信息(车辆，超速行驶)表

表5质量信誉考核记录表

表6上线率表

表7车辆年审记录信息表

表8动态监控报警信息(车辆，疲劳驾驶)表

表9违法违规信息(道路交通安全)表

S12：获取到的不同的业务平台的基础数据和历史车辆的动态监控数据进行特征分析和特征处理，特征分析和特征处理时数据分析是必不可少的一个环节，通过特征分析和处理，不仅能够直观体现出该特征的含义、分布、及价值表现，还能提高模型的精度。根据数据统计结果以及字段含义的分析，对不同字段进行如下的数据处理过程：

1、根据业户ID进行聚类，构建特征：每个业户ID的车辆总数、各颜色的车辆总数、各行业类别的车辆总数；

2、统计每个企业单位的各行业下的违法事实的数量，根据业户ID的行业类做类别独热编码；

3、联立运政车辆信息表，统计每个业户ID下的超速报警的总时长，总次数，每月平均报警时长(月总时长/总车辆个数*当月上线率/30)、每月平均报警次数(月总次数/总车辆个数*当月上线率/30)，白天报警总时长、白天月平均报警时长，晚上报警总时长、晚上月平均报警时长；其中，夜晚(晚上)时间段定为2：00～5：00；

4、从质量信誉考核记录表对每一个业户ID选取最新的审核结果做类别独热编码，各企业单位的平均上线率、各个企业单位的每月上线率；

5、选取最新的年审数据，根据车牌号码和所属行业id联立，统计每个企业单位的各年审结果的次数做独热编码；

6、联立运政车辆信息表，统计每个业户ID下的疲劳报警的总时长，总次数，每月平均报警时长(月总时长/总车辆个数*当月上线率/30)、每月平均报警次数(月总次数/总车辆个数*当月上线率/30)，白天报警总时长、白天月平均报警时长，晚上报警总时长、晚上月平均报警时长；其中，夜晚(晚上)时间段定为2：00～5：00；

7、筛选包含2022年及以后的数据，统计每个企业单位的各行业下的违法事实的数量；

8、最后依据业户ID联立所有经过特征工程的表，得到最终的原始数据；

9、对原始数据表求所有特征与目标特征的相关性系数，并筛选保留相关性系数在0.3及以上的特征最为最终的特征。

S13：基于以上的数据特征分析和处理，对得到最终的原始数据进行划分打标签，对于打过标签的数据进行分层抽取，选取70％作为训练集，15％为验证集，15％作为测试集。最后得到多组训练集、验证集和测试集，构建一个基础的xgboost模型，选取验证集均方误差最小的划分数据集合。

S14：对上面选取的数据集合送入到预设的子模型[xgboost、lightgbm]和基础学习模型中进行交叉训练并保存训练后的模型，然后利用验证集对训练后的模型进行评估其效果，再对测试集进行测试，并输出值为0-100间的结果。

在步骤S14中，将测试集输入到训练后的模型中使用MSE(均方误差)、MAE(平均绝对误差)、MAPE(平均绝对百分比误差)进行评估，最终MSE值为12.56，MAE值为2.41，MAPE值为0.03。

实施例二

如图2所示，为本实施例中基于动态知识计算的道路运输安全评估系统的结构示意图，用于执行实施例一中的基于动态知识计算的道路运输安全评估方法，包括：数据获取模块S21，主要用于获取到的不同的业务平台的基础数据和历史车辆的动态监控数据。特征分析与处理模块S22，主要用于对从不同业务平台的基础数据和历史车辆的动态监控数据进行分析和处理，对收集的各表的特征进行分析和特征工程，形成最后使用数据表。数据划分与构建数据表模块S23，主要用于对得到最终的使用数据进行划分打标签，对于打过标签的数据进行分层抽取，得到多组训练集、验证集和测试集，构建一个简单的模型，选取验证集均方误差最小的划分数据集合，得到最终的训练集、验证集、测试集。模型训练与评估模块S24，主要用于将训练保存最好的集成模型的超参数，并训练模型，然后用验证集验证并评估此模型效果，再用测试集进行测试，并输出结果。

在一些实施例中，所述数据源表来自不同的业务平台和车载动态监控数据，其中运政车辆信息表包括：车辆牌照号、车牌颜色、行业类别、业户ID；违法违规信息(交通运输违法)表包括：车牌号、行业类别、企业单位名称、违法(规)事实、违规时间；业户信息表包括：企业单位名称、业户ID、经营许可证；监控报警信息(车辆，超速行驶)表包括：车牌号码、报警类型、开始时间、结束时间、最高时速(Km/h)、持续点数、持续时长(秒)；质量信誉考核记录表包括：业户ID、质量信誉考核结果、考核日期；上线率表包括：企业单位名称、1月上线率、2月上线率、3月上线率、4月上线率、5月上线率、6月上线率；车辆年审记录信息表包括：车辆牌照号、车牌颜色、年审年度、审批结果；动态监控报警信息(车辆，疲劳驾驶)表包括：车牌号码、报警类型、开始时间、结束时间、最高时速(Km/h)、持续点数、持续时长(秒)；违法违规信息(道路交通安全)表包括：车牌号、行业类别、企业单位名称、违法(规)事实、违规时间，企业标签数据是一种连续值，值域在0-100之间，用来作为企业道路运输安全评分。

在本实施例中，特征分析及特征处理是数据分析领域中必不可少的一个环节，通过分析，不仅能够直观体现出该特征的含义、分布、及价值表现，还能提高模型的精度。

在本实施例中，构建训练集，验证集和测试集是基于特征处理后的特征表和企业单位的标签数据表进行联合得到最终使用表，即特征宽表，并依据14:3:3的比例对其整个特征集宽表进行划分得到的。

实施例三

如图3所示，提供了基于动态知识计算的道路运输安全评估系统的电子设备实体结构示意图。该电子设备具体包括：处理器S31、通信接口S31、存储器S33和通信总线S33，其中，处理器S31、通信接口S31、以及存储器S33通过总线S33完成相互间的通信。通信接口S32可以用于电子设备的信息传输。处理器S31可以调用存储器S33中的逻辑指令，以执行实施例一中的方法。此外，上述的存储器S33中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明上述各方法实施例的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述实施例一提供的评估方法。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

综上所述，上述实施例的基于动态知识计算的道路运输安全评估方法，以执法数据、企业违法数据等多方位数据为基础，对企业的道路运输安全风险进行评估和预测；采用传统机器学习算法来对这些数据进行回归分析，通过特征提取、特征选择和模型调优等手段来提高模型性能和准确性。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：苏州科大国创信息技术有限公司;