掌桥专利:专业的专利平台
掌桥专利
首页

一种气瓶事故关联规则挖掘方法及系统

文献发布时间:2024-05-31 01:29:11


一种气瓶事故关联规则挖掘方法及系统

技术领域

本发明属于风险监管技术领域,尤其涉及一种气瓶事故关联规则挖掘方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

特种设备是指涉及生命安全、危险性较大的锅炉、压力容器(含气瓶)、压力管道、电梯、起重机械、客运索道、大型游乐设施和场(厂)内专用机动车辆这八大类设备;目前,针对特种设备正推行基于风险的监管,希望能通过对隐患的分析和排查来降低事故发生率;其中,气瓶流动范围广、使用环境多样化,且所充装介质大多具有易燃易爆易致毒、易腐蚀等特性,一旦发生泄漏燃烧或爆炸事故,将严重威胁生命财产安全,造成严重的社会影响,分析气瓶的安全状况对气瓶安全隐患排查和整改显得尤为重要。

影响气瓶安全的各影响因素间的作用关系难以定量描述,且管理部门无法从大量的非结构化的气瓶事故数据中得到直观的信息对气瓶安全进行有效防控;目前人们使用Apriori算法对各类事故进行关联规则挖掘时,一是很少根据挖掘对象的特点对规则前后项进行约束,得到的关联规则常出现因果颠倒的现象,导致算法的准确性较低;二是通常将事务中的项也就是各种风险因素和事故属性均视为同等重要,然而实际上不同的事故与风险因素所造成的危害是不同的,将不同事故中的不同风险因素视为同等重要,然后一起进行数据挖掘是无法准确判定哪些风险因素更为关键的,导致现有方案挖掘出来的规则准确性不高。

发明内容

为克服上述现有技术的不足,本发明提供了一种气瓶事故关联规则挖掘方法及系统,将Apriori算法的支持度与置信度依据事故等级进行加权量化,并通过关联规则前项后项约束来减少冗余规则的产生,提高算法的准确性以及规则挖掘效率。

为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:

本发明第一方面提供了一种气瓶事故关联规则挖掘方法。

一种气瓶事故关联规则挖掘方法,包括:

收集气瓶事故案例数据,从中提取三类信息:气瓶类型、事故风险和事故属性,将其组成初始项集;

为初始项集中的所有项增加前项或后项标签,将气瓶类型作为前项约束,对初始项集进行子集划分,生成候选子项集;

对候选子项集进行迭代的频繁子项集生成和新候选项子集生成,直到无法再生成新的候选项子集,所生成的所有频繁子项集组成频繁项集;

将事故属性作为后项约束,并基于最小置信度阈值,对频繁项集进行筛选,基于筛选后的频繁项集,构建最终的关联规则。

进一步的,所述气瓶类型包括液化石油气瓶、氧气瓶和乙炔气瓶,为关联规则中的前项;

所述事故风险包括人的原因、物的原因、环境原因、管理原因,为关联规则中的前项;

所述事故属性包括事发季节、事发环节、事故类型、事故等级、事故后果,为关联规则中的后项。

进一步的,所述将气瓶类型作为前项约束,是依据气瓶事故案例数据,按照气瓶类型与其他项的相关性,对初始项集进行子集划分。

进一步的,所述频繁子项集生成,是基于当前迭代的候选项子集,计算候选项的支持度,利用预设的最小支持度阈值,进行候选项的筛选,得到频繁子项集。

进一步的,所述新候选项子集生成,是基于当前迭代的候选项子集,通过项组合的方式,生成新的候选项,组成新的候选项子集。

进一步的,所述对频繁项集进行筛选,具体为:

将事故属性作为后项约束,依据待确认的事故属性,对频繁项集进行第一轮筛选;

计算筛选后的频繁项集中频繁项的置信度,基于最小置信度阈值,对频繁项集进行第二轮筛选。

进一步的,所述支持度和置信度的计算,依据事故属性信息中的事故等级进行加权计算。

本发明第二方面提供了一种气瓶事故关联规则挖掘系统。

一种气瓶事故关联规则挖掘系统,包括初始项集构建模块、候选项集构建模块、频繁项集构建模块和关联规则构建模块:

初始项集构建模块,被配置为:收集气瓶事故案例数据,从中提取三类信息:气瓶类型、事故风险和事故属性,将其组成初始项集;

候选项集构建模块,被配置为:为初始项集中的所有项增加前项或后项标签,将气瓶类型作为前项约束,对初始项集进行子集划分,生成候选子项集;

频繁项集构建模块,被配置为:对候选子项集进行迭代的频繁子项集生成和新候选项子集生成,直到无法再生成新的候选项子集,所生成的所有频繁子项集组成频繁项集;

关联规则构建模块,被配置为:将事故属性作为后项约束,并基于最小置信度阈值,对频繁项集进行筛选,基于筛选后的频繁项集,构建最终的关联规则。

本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的一种气瓶事故关联规则挖掘方法中的步骤。

本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的一种气瓶事故关联规则挖掘方法中的步骤。

以上一个或多个技术方案存在以下有益效果:

本发明改进Apriori算法的支持度、置信度指标,将传统的Apriori算法的支持度与置信度指标依据事故伤害程度(即事故属性中的事故等级)进行加权量化,使用加权的关联规则对气瓶事故数据进行分析,并通过关联规则后项约束减少冗余规则的产生,提高气瓶事故关联规则挖掘的准确性以及规则挖掘效率;根据挖掘到的规则,可以关注到不同风险因素与事故之间的关联关系,从而可以针对风险因素关联规则进行防控,能够指导气瓶安全管理和评价的工程实践。

本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1为第一个实施例的方法流程图。

图2为第一个实施例中改进后的Apriori算法流程图。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

关联规则挖掘是一种数据挖掘技术,用来发现一些规则或项目组合或频繁项集,因为它可以揭示数据库中项目之间的强关联,在数据挖掘和知识发现中起着重要的作用,被广泛用于各种领域,诸如金融风险、市场、人类年龄风险和设备安全风险;Apriori算法作为经典的频繁项集挖掘算法,可以针对非结构化数据进行挖掘,从大量的非结构化气瓶安全事故数据中挖掘出频繁出现的风险因素与事故的集合,并将挖掘到的隐含气瓶安全事故的信息进行直观呈现。根据挖掘到的规则,可以关注到不同风险因素与事故之间的关联关系,针对风险因素关联规则进行防控,从而对气瓶这类特种设备进行有效的安全管理。

然而人们在使用Apriori算法进行关联规则挖掘时,通常将事务中的项均视为同等重要,但在气瓶事故当中,不同的事故与风险因素所造成的危害是不同的,将不同事故中的风险因素视为同等重要,一起进行数据挖掘,无法准确地判定关键的风险因素,也就无法针对关键的风险因素对气瓶安全进行防控。

本发明对Apriori关联规则挖掘算法的支持度、置信度指标进行改进,将Apriori算法的支持度与置信度指标与事故等级进行加权量化,使用加权的关联规则对气瓶事故数据进行分析,并通过约束关联规则前后项来减少不同事故维度冗余规则的产生,提高算法的准确性以及规则挖掘效率,以便特种设备管理部门可以针对风险因素关联规则进行防控,能够指导气瓶安全管理和评价的工程实践。

实施例一

本公开的一种实施例中提供了一种气瓶事故关联规则挖掘方法,如图1所示,包括如下步骤:

步骤S1:收集气瓶事故案例数据,从中提取三类信息:气瓶类型、事故风险和事故属性,将其组成初始项集;

步骤S2:为初始项集中的所有项增加前项或后项标签,将气瓶类型作为前项约束,对初始项集进行子集划分,生成候选子项集;

步骤S3:对候选子项集进行迭代的频繁子项集生成和新候选项子集生成,直到无法再生成新的候选项子集,所生成的所有频繁子项集组成频繁项集;

步骤S4:将事故属性作为后项约束,并基于最小置信度阈值,对频繁项集进行筛选,基于筛选后的频繁项集,构建最终的关联规则。

下面对本实施例一种气瓶事故关联规则挖掘方法的实现过程进行详细说明。

首先,通过气瓶安全事故的调查报告收集气瓶事故案例数据,将气瓶事故案例数据分为气瓶类型信息、事故属性信息和事故风险因素信息三大类。

其中,事故属性信息主要包括事发季节、事发环节、事故类型、事故等级、事故后果等5部分内容,具体信息如表1所示。

表1事故属性信息

从气瓶事故的直接原因和间接原因中提取风险因素的信息,并从人、物、环、管四个方面对其进行归类,如表2所示:

表2事故风险因素信息

对气瓶事故案例数据进行处理,将事故属性以及事故风险因素的各个因素进行分类编号,组成初始项集。

然后,基于Apriori算法挖掘不同类型的气瓶的事故属性与风险因素之间的关联规则。

一、改进的支持度、置信度

在关联规则挖掘中,常用支持度、置信度两个指标来对关联规则进行挖掘和衡量,支持度表示关联规则在数据集中出现的频率,置信度表示规则计算的可靠性,只有那些支持度和置信度都大于相应阈值的关联规则才被保留下来进行进一步的关联规则分析。

在一般情况下,使用Apriori算法进行数据挖掘时,会将初始项集中的项均视为同等重要,然而在气瓶事故当中,不同的事故与风险因素所造成的危害是不同的,因此本实施例提出了改进的支持度、置信度指标,采用加权的关联规则对气瓶安全事故数据进行分析,通过造成的气瓶事故后果来设定气瓶事故的加权指标。

气瓶事故后果通过事故造成的伤害程度来衡量,即事故属性中的事故等级,不同事故等级通过死亡人数、经济损失和加权伤害来量化,如表3所示,其中,事故等级划分参考《生产安全事故报告和调查处理条例》及《特种设备安全监察条例》。

表3不同事故等级对应的死亡人数、经济损失和加权伤害量化

关联规则

式中,number(A,B)代表项集A、B,number(M)代表数据库中所有事务的数量。

改进的支持度指标

式中,ω(A)为A项集的加权,ω(A,B)为ω(A)与ω(B)中权值较大者,N表示具有事故伤害信息的气瓶事故数据;改进的支持度指标表示A、B项集同时出现的概率,当项集A或项集B中出现事故等级信息时,依据表3中的权重对其进行加权计算,未出现气瓶事故伤害信息时保持原指标结果。

关联规则

式中,number(A)代表项集A出现的事务数量。

改进的置信度指标

改进的置信度指标表示项集A出现之后,另一个项集B出现的概率,当项集A或项集B中出现事故等级信息时,依据表3中的权重对其进行加权计算,未出现气瓶事故伤害信息时保持原指标结果。

二、规则前后项的约束

传统的Apriori算法是挖掘数据关联规则的经典算法,其思路是对数据进行逐一层次的迭代,不断产生更高维度的频繁项集。本实施例在Apriori算法的基础上添加前后项约束,挖掘不同类型的气瓶的事故属性之间、事故风险因素之间的关联规则,并利用改进的支持度和置信度指标来筛选,从而构建强关联规则,如图2所示,步骤如下:

步骤1初始化:设定最小支持度阈值,用于确定频繁项集,设定最小置信度阈值,用于确定关联规则,所设定的阈值是后续产生频繁项集与强关联规则的基础。

步骤2扫描初始项集,为初始项集中的所有项增加前项或后项标签,关联规则中的前项是气瓶类型和风险因素,后项是事故属性,第一次扫描产生候候选1项集C

步骤3前项约束:根据气瓶类型约束,将候选项集C

步骤4分别对候选1项集

步骤5不断重复步骤4,依次产生候选k项集和频繁k项集,直至无法产生新的候选k+1项集

步骤6后项约束:对频繁项集的后项进行事故属性筛选,并根据步骤1设定的最小置信度阈值,得到强关联规则,具体包括:

利用待确认的事故属性,对频繁项集的后项进行事故属性筛选,作为后项的约束,对频繁项集进行第一轮筛选。

基于公式(4),计算筛选后的频繁项集中频繁项的置信度,基于最小置信度阈值,对频繁项集进行第二轮筛选。

筛选后的频繁项集中,每个项中前项A和后项B,组成强关联规则

实施例二

本公开的一种实施例中提供了一种气瓶事故关联规则挖掘系统,包括初始项集构建模块、候选项集构建模块、频繁项集构建模块和关联规则构建模块:

初始项集构建模块,被配置为:收集气瓶事故案例数据,从中提取三类信息:气瓶类型、事故风险和事故属性,将其组成初始项集;

候选项集构建模块,被配置为:为初始项集中的所有项增加前项或后项标签,将气瓶类型作为前项约束,对初始项集进行子集划分,生成候选子项集;

频繁项集构建模块,被配置为:对候选子项集进行迭代的频繁子项集生成和新候选项子集生成,直到无法再生成新的候选项子集,所生成的所有频繁子项集组成频繁项集;

关联规则构建模块,被配置为:将事故属性作为后项约束,并基于最小置信度阈值,对频繁项集进行筛选,基于筛选后的频繁项集,构建最终的关联规则。

实施例三

本实施例的目的是提供计算机可读存储介质。

计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例一所述的一种气瓶事故关联规则挖掘方法中的步骤。

实施例四

本实施例的目的是提供电子设备。

电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例一所述的一种气瓶事故关联规则挖掘方法中的步骤。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种防止飞机储气瓶积水倒流的方法及气瓶接头
  • 一种纤维缠绕气瓶红外热成像检测系统及其检测方法
  • 全链条物流事故致因关联规则挖掘分析系统及方法
  • 基于关联规则的道路交通事故数据挖掘方法及装置
技术分类

06120116624205