一种工业过程模型的确定方法及系统
文献发布时间:2023-06-19 19:30:30
技术领域
本发明涉及模型确定技术领域,特别是涉及一种工业过程模型的确定方法及系统。
背景技术
当前,工业软件研究的热点之一为如何发现工业软件执行过程的工业过程模型。有研究人员提出自动化提取过程模型的方法,目的是帮助过程分析师在短时间内在大量工业过程文本方法档中高效率、低成本、高准确率地发现软件执行过程中蕴含的工业过程模型。虽然从工业软件描述的文本中自动化的提取工业过程模型仍处于早期研究阶段,但是仍有大量的研究人员做出了一系列的研究并取得了一定的成果。
现有的通过神经网络建立端到端的自动化映射提取过程模型方法是一种通过深度学习方法智能化、自动化的确定过程模型,该方法比较具有代表性的是Han等人提出的通过业务过程语言建模来建立工业过程文本方法档中的潜在结构的方法(A-BPS)。该方法采用深度学习方法且不需要任何的人工标记就可以检索出文档树:方法通过树状结构表示文档中句子的层次结构,树的每一个节点蕴含一个句子。首先,作者通过双向长短词记忆模型(BiLSTM)将编码器扩展,扩展后的编码器可以对句子嵌入并获得句子的向量表示。然后将句子的向量表示作为有序神经元LSTM(ON-LSTM)的输入,无监督检索句子在文本方法档中的层次结构,句子在文本方法档中的层次结构通过树状结构表示。但是,现实工业过程文本方法档中一句话中可能存在多个活动或者不存在活动,A-BPS将文档中的一句话当作一个节点并默认一句话中只存在一个活动很难准确地契合现实需求,准确率低。
发明内容
本发明的目的是提供一种工业过程模型的确定方法及系统,提高了工业过程模型确定的准确率。
为实现上述目的,本发明提供了如下方案:
一种工业过程模型的确定方法及系统,所述方法包括:
获取待识别的工业过程文本文档;
利用BERT模型、双向长短词记忆模型和条件随机场模型,从所述待识别的工业过程文本文档中提取出活动实体集;所述活动实体集包括多个活动实体;
将所述活动实体集输入至有序神经网络中进行识别,得到层次结构树;所述层次结构树的每一个节点对应一个所述活动实体;
根据各所述节点的优先级遍历所述层次结构树,得到目标工业过程模型,所述层次结构树的每个节点对应所述目标工业过程模型中的一个业务;所述目标工业过程模型用于描述所述待识别的工业过程文本文档中所蕴含的业务过程。
可选地,所述利用BERT模型、双向长短词记忆模型和条件随机场模型,从所述待识别的工业过程文本文档中提取出活动实体集,具体包括:
将所述工业过程文本文档输入至所述BERT模型中进行编码,得到多个词向量;
将各所述词向量均输入至所述双向长短词记忆模型中得到多个词序列;
将各所述词序列均输入至所述条件随机场模型中进行解码,得到所述活动实体集。
可选地,所述将所述活动实体集输入至有序神经网络中进行识别,得到层次结构树,具体包括:
计算所述活动实体集中各个活动实体之间的距离;
利用自顶向下的贪婪算法,根据所述活动实体集和所述各个活动实体之间的距离,得到所述层次结构树。
可选地,所述根据各所述节点的优先级遍历所述层次结构树,得到目标工业过程模型,具体包括:
确定各所述节点的优先级;
按照各所述节点的优先级从根节点开始,遍历所述层次结构树,确定所述目标工业过程模型。
一种工业过程模型的确定系统,包括:
工业过程文本文档获取模块,用于获取待识别的工业过程文本文档;
活动实体提取模块,用于利用BERT模型、双向长短词记忆模型和条件随机场模型,从所述待识别的工业过程文本文档中提取出活动实体集;所述活动实体集包括多个活动实体;
层次结构树生成模块,用于将所述活动实体集输入至有序神经网络中进行识别,得到层次结构树;所述层次结构树的每一个节点对应一个所述活动实体;
目标工业过程模型生成模块,用于根据各所述节点的优先级遍历所述层次结构树,得到目标工业过程模型,所述层次结构树的每个节点对应所述目标工业过程模型中的一个业务;所述目标工业过程模型用于描述所述待识别的工业过程文本文档中所蕴含的业务过程。
可选地,所述活动实体提取模块,具体包括:
词向量生成单元,用于将所述工业过程文本文档输入至所述BERT模型中进行编码,得到多个词向量;
词序列生成单元,用于将各所述词向量均输入至所述双向长短词记忆模型中得到多个词序列;
活动实体提取单元,用于将各所述词序列均输入至所述条件随机场模型中进行解码,得到所述活动实体集。
可选地,所述层次结构树生成模块,具体包括:
距离计算单元,用于计算所述活动实体集中各个活动实体之间的距离;
层次结构树确定单元,用于利用自顶向下的贪婪算法,根据所述活动实体集和所述各个活动实体之间的距离,得到所述层次结构树。
可选地,所述目标工业过程模型生成模块,具体包括:
优先级确定单元,用于确定各所述节点的优先级;
目标工业过程模型确定单元,用于按照各所述节点的优先级从根节点开始,遍历所述层次结构树,确定所述目标工业过程模型。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开了一种工业过程模型的确定方法及系统,方法包括:获取待识别的工业过程文本文档;利用BERT模型、双向长短词记忆模型和条件随机场模型,从待识别的工业过程文本文档中提取出活动实体集;活动实体集包括多个活动实体;将活动实体集输入至有序神经网络中进行识别,得到层次结构树;层次结构树的每一个节点对应一个活动实体;根据各节点的优先级遍历层次结构树,得到目标工业过程模型,层次结构树的每个节点对应目标工业过程模型中的一个业务;目标工业过程模型用于描述待识别的工业过程文本文档中所蕴含的业务过程。本发明结合BERT模型、双向长短词记忆模型和条件随机场模型,能够精确识别待识别的工业过程文本文档中的各个活动实体,提高了工业过程模型确定的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的工业过程模型的确定方法流程图;
图2为本发明实施例提供的工业过程模型的确定系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种工业过程模型的确定方法及系统,旨在提高工业过程模型确定的准确率,可应用于模型确定技术领域。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例提供的工业过程模型的确定方法流程图。如图1所示,本实施例中的工业过程模型的确定方法,包括:
步骤101:获取待识别的工业过程文本文档。
步骤102:利用BERT模型、双向长短词记忆模型和条件随机场模型,从待识别的工业过程文本文档中提取出活动实体集;活动实体集包括多个活动实体。
步骤103:将活动实体集输入至有序神经网络中进行识别,得到层次结构树;层次结构树的每一个节点对应一个活动实体。
步骤104:根据各节点的优先级遍历层次结构树,得到目标工业过程模型,层次结构树的每个节点对应目标工业过程模型中的一个业务;目标工业过程模型用于描述待识别的工业过程文本文档中所蕴含的业务过程。
作为一种可选的实施方式,步骤102,具体包括:
将工业过程文本文档输入至BERT模型中进行编码,得到多个词向量。
将各词向量均输入至双向长短词记忆模型中得到多个词序列。
将各词序列均输入至条件随机场模型中进行解码,得到活动实体集。
作为一种可选的实施方式,步骤103,具体包括:
计算活动实体集中各个活动实体之间的距离;具体的,距离为欧氏距离。
利用自顶向下的贪婪算法,根据活动实体集和各个活动实体之间的距离,得到层次结构树。
作为一种可选的实施方式,步骤104,具体包括:
确定各节点的优先级。
按照各节点的优先级从根节点开始,遍历层次结构树,确定目标工业过程模型。
图2为本发明实施例提供的工业过程模型的确定系统框图。如图2所示,本实施例中的工业过程模型的确定系统,包括:
工业过程文本文档获取模块201,用于获取待识别的工业过程文本文档。
活动实体提取模块202,用于利用BERT模型、双向长短词记忆模型和条件随机场模型,从待识别的工业过程文本文档中提取出活动实体集;活动实体集包括多个活动实体。
层次结构树生成模块203,用于将活动实体集输入至有序神经网络中进行识别,得到层次结构树;层次结构树的每一个节点对应一个活动实体。
目标工业过程模型生成模块204,用于根据各节点的优先级遍历层次结构树,得到目标工业过程模型,层次结构树的每个节点对应目标工业过程模型中的一个业务;目标工业过程模型用于描述待识别的工业过程文本文档中所蕴含的业务过程。
作为一种可选的实施方式,活动实体提取模块202,具体包括:
词向量生成单元,用于将工业过程文本文档输入至BERT模型中进行编码,得到多个词向量。
词序列生成单元,用于将各词向量均输入至双向长短词记忆模型中得到多个词序列。
活动实体提取单元,用于将各词序列均输入至条件随机场模型中进行解码,得到活动实体集。
作为一种可选的实施方式,层次结构树生成模块203,具体包括:
距离计算单元,用于计算活动实体集中各个活动实体之间的距离。
层次结构树确定单元,用于利用自顶向下的贪婪算法,根据活动实体集和各个活动实体之间的距离,得到层次结构树。
作为一种可选的实施方式,目标工业过程模型生成模块204,具体包括:
优先级确定单元,用于确定各节点的优先级。
目标工业过程模型确定单元,用于按照各节点的优先级从根节点开始,遍历层次结构树,确定目标工业过程模型。
具体实施例
定义1:活动实体。一个工业过程描述中的一个句子可以被表示为六元组Se=(SP,O,C,A,D),包含主语、谓语、宾语、宾补、定语、状语。定义活动实体的步骤如下。
(1)S为主语。
(2)P为谓语。
(3)O为宾语。
(4)C为定语。
(5)A为补语。
(6)D为状语。
(7)Se为组成工业过程文本文档中的一句话。
(8)定义活动实体a=(P,O)或a=(P)。其中a∈A,A为工业过程模型
P=(A,F,I;S,E)的活动实体集。
如定义1所示,一个工业过程文本文档中的一句话Se=(S,P,O,C,A,D),包含主语、谓语、宾语、宾补、定语、状语。本文定义活动实体为a=(P,O)(谓语+宾语)或a=(P)(谓语)。
将标注的活动实体从工业过程文本文档中抽取出来后,本文通过深度学习方法无监督检索工业过程文本文档中活动实体之间的潜在层次结构,本文将活动实体之间的潜在层次结构称为层次结构树。层次结构树定义如定义2所示。
定义2:层次结构树。一个层次结构树可以被表示为三元组q=(A,D,I),包含
活动实体、最大深度、嵌套。
(1)q为层次结构树。
(2)活动实体a∈A组成一个层次结构树,其中A为工业过程模型P=(A,F,I;S,E)的活动实体集。
(3)D为层次结构树的最大深度。
(4)I为活动实体之间的嵌套关系。
在得到层次结构树之后,将层次结构树自动地转化为工业过程模型。定义3给出本文将层次结构树转化为工业过程模型使用的层次深度原则。
定义3:层次深度原则。一个层次结构树可以被表示为三元组=(A,D,I),
一个工业过程模型被表示为五元组P=(A,F,I;S,E),层次结构树转化为工业过程模型步骤如下。
(1)
(2)a∈A,d∈D,d为a在层次结构树所处深度,其中d越小活动实体a在工业过程模型中优先级越高,发生次序越靠前。d越大活动实体a在工业过程模型中优先级越低,发生次序越靠后。
(3)设a
(4)设a
在得到层次结构树后,按照层次深度原则将层次结构树转化为工业过程模型。
工业过程模型的定义如定义4所示。
定义4:工业过程模型。工业过程模型描述了面向智能制造领域的生产控制软件中所蕴含的业务过程。一个工业过程模型被定义为P=(A,F,I;S,E),包含活动、流、嵌套、开始和结束。
(1)(A,F;S,E)为一个网结构。
(2)A为活动实体集,
(3)F为工业过程模型上的流关系,包含从活动实体到活动实体,从开始到活动实体或从活动实体到结束。
(4)I为嵌套,I至少包含两个活动实体a且
(5)S为p的初始情态。
(6)E为p的结束情态。
工业过程模型的应用比较广泛,在实际的工业生产中,任何需要电子信息控制的过程,都有一个需要严格执行的工业过程模型流程图。通过深度学习的方法(人工智能)可以自动化的从文本中生成工业过程模型,可以大大的缩短人工阅读文本生成过程模型的时间。传统过程挖掘方法需要日志才能生成工业过程模型,而本发明工业过程模型的生成方法,在日志缺失时,过程挖掘方法无法使用的时候仍可以使用。当本发明的方法在通过扩大数据量和多领域数据来提高方法精确度和模型健壮性后,可以检测工业设备实际执行流程与设计初定义的模型之间的区别。
在工业领域,大多数核心工业制品,其产品设计、生产装备、产品研发、感知设备等多个生产控制软件都与过程控制技术紧密相关。大量的工业软件自身都蕴含工业过程。例如,荷兰著名ASML光刻机企业的光刻过程与芯片制造过程已基本全部采用工业过程(即工业生产制造中的工业过程)软件进行控制;中国北车集团过程模型库累积存储超20万个过程模型;澳洲Suncorp银行约有6000多个过程模型。还有学者从德国一家构建于上世纪80年代的大众金融汽车租赁遗产系统的两百万COBOL代码中抽取出近13.6万条业务规则。即在实际工业制造业生产过程中,通过过程模型来驱动工业控制、产品设计、生产研发、感知设备等大量应用场景。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的装置及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
- 一种基于时序特征的业务过程模型查询方法及查询系统
- 一种数据价格确定系统以及确定方法
- 一种基于不确定性优化的固体运载器总体参数确定方法及系统
- 一种机械臂运动路径的确定方法及确定系统
- 用于对工业资产的差错检测和过程模型调节的系统和方法
- 用于确定工业系统的系统设定的方法和系统