掌桥专利:专业的专利平台
掌桥专利
首页

基于OCR和NLP的施工作业风险控制系统及方法

文献发布时间:2024-04-18 19:58:30


基于OCR和NLP的施工作业风险控制系统及方法

技术领域

本发明涉及电力营销技术领域,具体涉及基于OCR和NLP的施工作业风险控制系统及方法。

背景技术

随着社会的快速发展,人们生活和工作中信息数量爆炸式增长,采集设备也需要对大量数据进行存储、计算、加工、输出等工作,这导致对采集设备的存储能力、计算速度以及传输速度提出了更高的要求。

电力营销设备采集的信号以微弱信号为主,以往对微弱信号检测技术,往往先滤波再放大,如果先滤波再放大,则可能在滤波过程引入其他微弱干扰同时可能使信号产生一定的畸变失真,这就相当于加入更多噪声,由于输入输出检测信号和噪声幅度都很小。这此情况下,要尽可能多的保存信号的信息,减小微弱信号的丢失,现有的对于微弱信号是先滤波再放大,则可能在滤波过程引入其他微弱干扰同时可能使信号产生一定的畸变失真,这就相当于加入更多噪声,导致电力营销数据不准确,抗干扰程度不强,信号传输质量不佳。

发明内容

本发明针对上述现有技术的不足,提供基于OCR和NLP的施工作业风险控制系统及方法。

本发明采用的技术方案是:

基于OCR和NLP的施工作业风险控制系统,包括:

工作票识别模块,对纸质工作票进行识别,提取工作票的文本内容;

信息提取模块,解析工作票文本内容形成结构化作业信息;

风险匹配模块,将结构化作业信息与预设的施工作业风险知识库进行匹配,识别出作业过程中的潜在风险点;

风险评估模块,应用风险评估模型,根据作业内容及潜在风险点,评估作业风险的大小和危害程度;

推荐模块,根据风险评估结果,匹配预设的施工作业风险防控知识库,生成作业风险防控措施建议;

反馈模块,将作业风险防控措施建议反馈展示给作业人员或监管人员,用于指导实际作业过程中的风险防范。

作为本发明的进一步技术方案为,还包括:智能优化模块,用于对识别的工作票生成样本,通过接收的用户反馈数据进行训练优化,将用户当前使用的工作票样本添加到素材库中,并使用这些数据进行模型的再训练,使得算法能够不断适应用户需求,提供智能精准的分析结果。

作为本发明的进一步技术方案为,所述工作票识别模块具体为,应用光学字符识别技术,对纸质工作票进行扫描识别,提取工作票的文本内容。

作为本发明的进一步技术方案为,所述信息提取模块,应用NLP技术,解析工作票文本内容,识别作业人员、作业场所、作业内容、业务动作、风险信息,形成结构化作业信息。

作为本发明的进一步技术方案为,所述施工作业风险库包括:

作业类型风险,高处作业、临边作业、吊装作业风险;

作业场所风险,楼层边缘、临时电源、狭窄通道场所风险;

作业对象风险,工程机械、电动工具、脚手架使用风险;

作业流程风险,物料吊装、机械作业前检流程风险;

人员行为风险,不安全的人员作业行为模式;

事故案例,展示施工作业风险的历史事故类型、发生环节和结果;

法规规章,施工作业安全的法规、标准、形成规章制度。

通过施工作业风险库形成施工作业领域的结构化风险知识图谱,用于风险识别、分析和评估。

作为本发明的进一步技术方案为,所述风险评估模型,具体包括:

分值模块,按风险因素类型和危险等级给每个识别出的风险因素一个定量的风险分值;

权重模块,根据不同风险因素的影响程度,给每个风险因素指定一个权重;

风险级别模块,将每个风险因素的风险分值与权重相乘,求出加权风险分值,根据风险分值的数量级确定风险级别;

综合风险模块,将所有识别出的风险因素经评分、加权计算综合风险值,并

与事故可能性相结合确定综合风险级别;

动态风险模块,结合作业计划、进程动态信息,评估风险变化趋势和动态风险值;

风险评估模块,分析不同风险因素间的关联性,评估联合作用下的风险。

本发明还提供一种基于OCR和NLP的施工作业风险控制方法,具体包括:

对纸质工作票进行识别,提取工作票的文本内容;

解析工作票文本内容形成结构化作业信息;

将结构化作业信息与预设的施工作业风险知识库进行匹配,识别出作业过程中的潜在风险点;

根据作业内容及潜在风险点,评估作业风险的大小和危害程度;

根据风险评估结果,匹配预设的施工作业风险防控知识库,生成作业风险防控措施建议;

将作业风险防控措施建议反馈展示给作业人员或监管人员,用于指导实际作业过程中的风险防范。

作为本发明的进一步技术方案为,所述根据作业内容及潜在风险点,评估作业风险的大小和危害程度;具体包括:

按风险因素类型和危险等级给每个识别出的风险因素一个定量的风险分值;

根据不同风险因素的影响程度,给每个风险因素指定一个权重;

将每个风险因素的风险分值与权重相乘,求出加权风险分值,根据风险分值的数量级确定风险级别;

将所有识别出的风险因素经评分、加权计算综合风险值,并与事故可能性相结合确定综合风险级别;

结合作业计划、进程动态信息,评估风险变化趋势和动态风险值;

分析不同风险因素间的关联性,评估联合作用下的风险。

作为本发明的进一步技术方案为,还包括:

用于对识别的工作票生成样本,通过接收的用户反馈数据进行训练优化,将用户当前使用的工作票样本添加到素材库中,并使用这些数据进行模型的再训练,使得算法能够不断适应用户需求,提供智能精准的分析结果。

本发明的有益效果:

1、本发明能够实现对施工作业风险的智能化识别和评估,并推荐相应的防控措施建议,有效降低作业风险,提高施工安全水平;本发明通过纸质工单扫描,利用OCR识别工单中的相关的工作内容;利用NLP能力提取工单内容的关键信息;通过训练实体对象模型、业务动作模型,将施工安全风险领域的实体对象、业务动作识别提取,行程实体对象、业务动作库,通过实体对象、业务动作库智能分析、校验其他工单的内容;并进行智能分析归类。通过NLP是被的关键信息匹配施工作业专家库,通过专家库抽取相关的安全检查辅助建议。

附图说明

图1为本发明提出的基于OCR和NLP的施工作业风险控制系统结构图;

图2为本发明提出的基于OCR和NLP的施工作业风险控制方法流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。

参见图1,本发明提供的基于OCR和NLP的施工作业风险控制系统,包括:

工作票识别模块101,对纸质工作票进行识别,提取工作票的文本内容;

信息提取模块102,解析工作票文本内容形成结构化作业信息;

风险匹配模块103,将结构化作业信息与预设的施工作业风险知识库进行匹配,识别出作业过程中的潜在风险点;

风险评估模块104,应用风险评估模型,根据作业内容及潜在风险点,评估作业风险的大小和危害程度;

推荐模块105,根据风险评估结果,匹配预设的施工作业风险防控知识库,生成作业风险防控措施建议;

反馈模块106,将作业风险防控措施建议反馈展示给作业人员或监管人员,用于指导实际作业过程中的风险防范。

本发明实施例中,还包括:智能优化模块107,用于对识别的工作票生成样本,通过接收的用户反馈数据进行训练优化,将用户当前使用的工作票样本添加到素材库中,并使用这些数据进行模型的再训练,使得算法能够不断适应用户需求,提供智能精准的分析结果。

其中,工作票识别模块具体为,应用光学字符识别技术,对纸质工作票进行扫描识别,提取工作票的文本内容。

信息提取模块,应用NLP技术,解析工作票文本内容,识别作业人员、作业场所、作业内容、业务动作、风险信息,形成结构化作业信息。

本发明实施例中,施工作业风险库包括:

作业类型风险,高处作业、临边作业、吊装作业风险;

作业场所风险,楼层边缘、临时电源、狭窄通道场所风险;

作业对象风险,工程机械、电动工具、脚手架使用风险;

作业流程风险,物料吊装、机械作业前检流程风险;

人员行为风险,不安全的人员作业行为模式;

事故案例,展示施工作业风险的历史事故类型、发生环节和结果;

法规规章,施工作业安全的法规、标准、形成规章制度。

通过施工作业风险库形成施工作业领域的结构化风险知识图谱,用于风险识别、分析和评估。

其中,风险评估模型,具体包括:

按风险因素类型和危险等级给每个识别出的风险因素一个定量的风险分值根据不同风险因素的影响程度,给每个风险因素指定一个权重;

将每个风险因素的风险分值与权重相乘,求出加权风险分值,根据风险分值的数量级确定风险级别;

将所有识别出的风险因素经评分、加权计算综合风险值,并与事故可能性相结合确定综合风险级别;

结合作业计划、进程等动态信息,评估风险变化趋势和动态风险值;

分析不同风险因素间的关联性,评估联合作用下的风险。

本发明通过风险评估模型从不同维度对施工作业风险进行定量化的计算和评估。

本发明能够实现对施工作业风险的智能化识别和评估,并推荐相应的防控措施建议,以有效降低作业风险,提高施工安全水平。

本发明通过纸质工单扫描,利用OCR识别工单中的相关的工作内容;利用NLP能力提取工单内容的关键信息(包括角色、场景、业务动作、风险信息等);通过训练实体对象模型、业务动作模型,将施工安全风险领域的实体对象、业务动作识别提取,行程实体对象、业务动作库,通过实体对象、业务动作库智能分析、校验其他工单的内容。并进行智能分析归类。通过NLP是被的关键信息匹配施工作业专家库,通过专家库抽取相关的安全检查辅助建议。

通过识别的实体模型、业务模型,与所建立的风险库进行匹配,对匹配的风险点进行展示;通过识别的风险与所建立的风险知识库进行抽取和比对,将抽取出来的风险建议提供到页面。

本发明实施例中,利用NLP能力提取工单内容的关键信息,具体为通过文本挖掘引擎是以半结构或非结构的自然语言文本为处理对象,从大规模文本数据集中发现隐藏的、潜在的、新颖的和重要的规律。从文本中提取各个维度的语法和语义特征,将文本表示成计算机能够理解的形式,采用各种文本挖掘方法发现隐藏的知识模式,以用户可以理解和接收的形式输出,成为指导人们实践有用的知识。

深度文本挖掘技术会对工作票中的内容进行有效拆分。在拆分后的内容中,深度文本挖掘技术会使用注意力机制等方法,自动识别并提取与指定场景(施工安全风险控制)相关的关键信息。通过深度学习模型对文本中的关键信息进行提取,可以快速捕捉到与风险控制相关的重要内容。深度文本挖掘技术会将从工作票中提取的关键信息与风险库中的风险和控制措施进行关联性匹配。这一步骤可以通过计算文本信息与风险、控制措施之间的相似性或距离来实现。文本信息包括文本分类、文本聚类、文本摘要、相似文本检索、信息抽取、语义关系抽取、情感分析、数据比对、高速串匹配、语义词典挖掘等。通过NLP识别的实体标签、业务标签到风险库中进行查找匹配,找出相关性最高的风险、措施。

反馈模块通过页面提供风险建议反馈按钮,在页面读取的风险项,用户可以通过反馈按钮将匹配不准或者匹配有问题的风险进行反馈,反馈后由后台运营人员对不准确风险推荐信息进行调优。

其中关键信息指风险实体、业务信息等(如施工单位、施工角色、施工动作等信息),通过NLP识别实体标签、业务标签,与风险库的风险项进行匹配,找出相关性最高的风险、措施进行关联匹配。将匹配符合的风险进行讲义提示。

参见图2,本发明还提供基于OCR和NLP的施工作业风险控制方法,具体包括:

步骤201,对纸质工作票进行识别,提取工作票的文本内容;

步骤202,解析工作票文本内容形成结构化作业信息;

步骤203,将结构化作业信息与预设的施工作业风险知识库进行匹配,识别出作业过程中的潜在风险点;

步骤204,根据作业内容及潜在风险点,评估作业风险的大小和危害程度;

步骤205,根据风险评估结果,匹配预设的施工作业风险防控知识库,生成作业风险防控措施建议;

步骤206,将作业风险防控措施建议反馈展示给作业人员或监管人员,用于指导实际作业过程中的风险防范。

本发明实施例中,基于OCR和NLP的施工作业风险控制方法,还包括:

用于对识别的工作票生成样本,通过接收的用户反馈数据进行训练优化,将用户当前使用的工作票样本添加到素材库中,并使用这些数据进行模型的再训练,使得算法能够不断适应用户需求,提供智能精准的分析结果。

本发明从用户处收集工作票样本以及用户对算法匹配风险结果的反馈;对收集到的文本数据进行预处理,包括分词、去除停用词、词干化或词形还原等。通过收集用户使用越来越多的工作票样本和反馈数据,系统会定期进行训练优化。

本发明提供通过深度学习模型用于进行文本挖掘、关联性匹配和风险识别,通过预设的风险库:包含预定义的风险和控制措施,用于与工作票内容进行关联性匹配,通过用户反馈模块收集用户对算法匹配风险结果的反馈信息,并通过素材库存储用户当前使用的工作票样本,作为训练数据,用于定期对算法进行训练优化。

上面结合附图对本发明优选实施方式作了详细说明,但是本发明不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。不脱离本发明的构思和范围可以做出许多其他改变和改型。应当理解,本发明不限于特定的实施方式,本发明的范围由所附权利要求限定。

相关技术
  • 基于OCR和NLP提取客户文档扫描件内服务条款方法
  • 基于OCR和NLP的视觉问答防诈骗方法及系统
技术分类

06120116503671