掌桥专利:专业的专利平台
掌桥专利
首页

一种基于事件关系抽取的RPA流程挖掘方法和装置

文献发布时间:2024-04-18 19:52:40


一种基于事件关系抽取的RPA流程挖掘方法和装置

技术领域

本发明涉及流程挖掘技术领域,尤其涉及一种基于事件关系抽取的RPA流程挖掘方法和装置。

背景技术

RPA(Robotic Process Automation,机器人流程自动化)是一种通过软件按照指定规则与流程进行业务自动处理的技术,以实现对人工作业的辅助或替代。简单来说,RPA就是用机器人的工作方式,自动执行一些流程的操作,它的输入一般是结构化的数据,也就是标准表结构的数据。RPA软件根据设定的流程完成计算机操作,替代或者辅助人完成规则明确的重复性劳动,是一种“数字劳动力”。虽然传统的信息系统已经在诸多企业中得到应用,但是这些系统仍然存在大量的、重复性的工作,需要花费一定的人力进行处理,降低了系统的效率,并且人工处理事务容易导致出现错误,进一步降低了这些信息系统的有效性。随着机器人流程自动化的出现,利用RPA技术提升企业信息系统的自动化,降低错误率、提高工作效率、提升工作的合规性成为可能。根据统计,采用RPA技术处理SAP(System,Applications and Products in Data Processing,数据处理的系统、应用和产品)等数据维护工作中,可以减少70%的时间成本,从而节约公司的人力资源。采用RPA等技术处理OA(Office Automation,办公自动化)系统中的各项流程时,可以提高30%的工作效率。同时,RPA能够全天候的运行,保证流程的运行符合规范要求并且无错运行。利用RPA技术能够提高企业数字化的能力,进一步提升企业的工作效率。目前RPA行业正在寻求更智能和创新的RPA,利用认知计算和嵌入式智能自动处理决策过程。此类系统智能化程度的提高意味着技术逻辑能力的提高,从而为利益相关者实现高水平的过程自动化并创造价值。

RPA几乎可以应用于所有行业的重复性规则化工作流程,提高数据准确性,优化财务组织架构,提高企业竞争力,为企业带来诸多价值。首先,使用RPA技术可以提升效率、释放人力资源。RPA机器人通过代替人工手动操作,可以有效减少大量重复性工作给员工造成的负担,从而释放人力资源,将人力投入到更有价值的领域。其次,RPA容易修改,可以快速适应环境变化。RPA不仅能够精确地在更短的时间内完成大量工作,还能更好地适应环境变化。例如:技术升级、业务需求调整,对于人工来说,学习和接受新的事物的训练是一个相对复杂和长期的过程,而RPA可以通过在编程中修改过程或引入新的过程来完成,从而更容易、更快地适应变化。最后,使用RPA技术还可以进行风险控制,增强合规性管理。RPA具有可追溯记录的属性,在合规上具有特别的优势。机器人可以保证不会偏离预定轨道去执行其他任务,从而可以提供完整的审计跟踪。

商业智能软件已经广泛应用于现代企业运行优化和管理中,对企业历史数据和当前数据进行处理,提供数据的收集、挖掘和可视化等分析功能,以帮助企业快速发现可推动战略决策制定的可行性见解。然而,这些工具通常假设企业流程是已知的,并且它们只执行与数据相关的分析操作(如分类、聚类、关联分析等),缺少对显示流程的支持。面向该类需求,形成了一个新的研究领域--流程挖掘。

流程是为了实现特定目标而采取的一系列操作。流程挖掘旨在构建起传统的模型驱动方法(如业务流程建模和模型正确性验证)和新型的数据驱动方法(如数据挖掘和机器学习)之间的桥梁。流程挖掘技术以按顺序记录的事件为基础,每个事件指代一个活动,并与特定的业务场景相关联,将事件日志中的附加信息汇总后,形成实际流程的“流程图”形式的可视信息,向业务领导人展现流程绩效以及流程的合规性,从而辅助决策。流程挖掘的过程一般分为三步:流程发现、一致性检验、流程改进。其中,流程发现旨在不利用任何先验信息的前提下基于事件日志创建模型。这里的模型大多数情况下是流程模型,但是,也可能是其他模型,比如,角色交互模型。一致性检查旨在检验流程模型与事件日志之间的合规性,其主要聚焦于事件日志与流程模型的对比,包含旧日志与新模型、旧日志与旧模型、新日志与新模型、新日志与旧模型之间的合规性检查问题。一致性检查将真实的流程执行情况和预设的标准路径规则进行对比,找出真实流程执行与理想预设标准之间的差异。流程改进则是借助实际流程记录的事件日志中得到的知识和信息来扩展或改进现有流程。

由于流程挖掘具有兼容性强、无特定行业属性等技术特点,因而应用范围非常广泛。以当前流程挖掘应用最为广泛的金融和保险领域为例,它们涉及的业务流程,例如,贷款处理、索赔管理、保险申请等都是高度结构化的,并且流程执行过程中所有事件都被系统安全地记录。因此,流程挖掘可以很好地应用在这些场景以缩短流程时间、提高效率和合规性。此外,流程挖掘也可用于改进不同组织中的流程。例如,在电信行业的呼叫中心,客户重复呼叫次数的增加,通常表明座席服务的质量存在问题,原因是客户的问题在第一次呼叫中没有得到解决。如果企业在开始阶段为了节省成本,对座席业务培训的时间不够,或者指示座席尽可能缩短通话时间,这就会导致客户不断回访,使得问题解决的流程时间变长。从长远来看,这将给企业运营成本带来巨大的压力。通过对呼叫服务日志进行流程挖掘,可以发现第一次应答的准确性,可以提高客户体验和呼叫中心的效率,并降低呼叫中心的运营成本。总体来说,流程挖掘可以极大地提高工作效率,已经广泛应用于金融、保险、电信等领域。

流程挖掘是一种从工作流日志中提取有用信息的一种技术,目前,传统RPA流程挖掘任务中使用alpha算法来处理事件日志,需要先使用事件抽取技术或人工切分来将用户行为日志处理成事件日志,再将alpha算法应用到事件日志上来获得事件间的关系。其中,人工切分事件日志的方式,面对大量繁琐复杂的重复性操作时非常耗时耗力。

发明内容

有鉴于此,本发明提出一种基于事件关系抽取的RPA流程挖掘方法,包括以下步骤:

S1、获取用户行为日志,所述用户行为日志由句子组成;

S2、将用户行为日志中的句子两两组合,拼接成M个新句子W=(W

S3、将每个实值向量序列输入到预训练好的BERT模型中进行学习,得到每个新句子的上下文语义信息;

S4、将每个新句子的上下文语义信息输入Bi-LSTM模型中,得到每个新句子长度的隐藏状态序列;

S5、将每个新句子长度的隐藏状态序列输入到一个池化层,获得每个新句子的关系向量表示,所有句子的关系向量表示构成一个关系向量表示序列R=(r

S6、将所有新句子的关系向量表示输入到自注意力层中,得到综合上下文信息的新句子关系向量表示;

S7、将综合上下文信息的新句子关系向量表示输入到全连接层,使用softmax函数获得每个新句子属于不同事件关系标签的概率,选择概率最大的事件关系标签作为该新句子事件关系类型的分类结果;

S8、根据每个新句子事件关系类型的分类结果,生成对应足迹矩阵,并构建petri网,最终将事件日志转换为相应的流程挖掘模型。

本发明还包括一种基于事件关系抽取的RPA流程挖掘装置,所述装置包括:

处理器;

存储器,其上存储有可在所述处理器上运行的计算机程序;

其中,所述计算机程序被所述处理器执行时实现一种基于事件关系抽取的RPA流程挖掘方法。

本发明提供的技术方案带来的有益效果是:

本发明通过获取用户行为日志,将用户行为日志的句子表示为一个实值向量序列输入到预训练好的BERT模型中进行学习,得到每个句子的上下文语义信息;将每个句子的上下文语义信息输入Bi-LSTM模型中,得到每个句子长度的隐藏状态序列;将隐藏状态序列输入到一个池化层,获得关系向量表示序列表示;将关系向量表示序列表示输入到自注意力层中,得到综合上下文信息的句子关系向量表示;将综合上下文信息的句子关系向量表示输入到全连接层,使用softmax函数获得每个句子属于不同事件关系标签的概率,选择概率最大的事件关系标签作为该句子事件关系类型的分类结果,根据每个句子事件关系类型的分类结果,生成对应足迹矩阵,并构建petri网,最终将事件日志转换为相应的流程挖掘模型。本发明的技术方案使用事件关系抽取模型来自动挖掘用户行为日志中的事件关系,在事件关系挖掘的基础上,提出一种根据事件间的关系构建事件关系抽取模型来反映文本事件之间的结构关系的方法,可以:

(1)能更清晰地表达文本的语义信息及事件间的关系重要程度。并可以省去alpha算法的繁琐步骤,更快速的生成流程挖掘模型,从而提高流程挖掘任务的工作效率。

(2)提高事件关系抽取的准确性:以往的方法通常只使用当前句子信息来识别句子中事件对的次序关系,并不考虑上下文信息,这种句子信息十分有限,不足以准确识别句中的事件关系。本发明通过上下文增强模块来学习句子与上下文中其他句子的联系,所以能够提高事件关系抽取的准确性。

(3)降低成本:本专利对传统的流程挖掘方法进行改进,使用事件关系抽取来替代用户行为日志的手工切分,在一定程度上减少了人力和时间成本,并且避免了手工切分日志所带来的误差。

附图说明

图1是本发明一种基于事件关系抽取的RPA流程挖掘方法的流程图;

图2是本发明实施例基于事件关系构建petri网。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。

本发明实施例中的术语解释:

事件关系抽取

通常,事件的发生不是孤立的,其发生与发展往往关联外在的其它事件。这些关联性有的是显性关系,也有隐性关系。事件关系将客观事实通过文字进行描述的一种语用形式,常常活跃于新闻报道、评论或者博文等各种媒体中。针对具有关联的事件进行抽取,称为事件关系抽取。事件关系抽取领域主要有四种事件间关系,分别是:共指关系、时序关系、因果关系和子事件关系。其中,共指关系表示两个事件描述的是同一目标事件;时序关系表示两个事件在时间上的先后顺序;因果关系指事件之间的作用关系,即某个事件是另一事件的结果;子事件关系表示一个事件是另一事件的子事件。

Bi-LSTM模型

Bi-LSTM是由前向LSTM与后向LSTM组合而成,利用LSTM对句子进行建模存在一个问题:无法编码从后到前的信息。而通过Bi-LSTM可以更好的捕捉双向的语义依赖。

LSTM的关键是单元状态,用来保存当前单元的状态信息并传递给下一时刻的单元。LSTM主要设计了三种功能不同的控制门结构,包括输入门、输出门、遗忘门。这三种门的作用是控制模型中信号的保留和传递,具体的计算公式如下:

c

h

其中,t是时间步长,i

本发明提出一种基于多模态事件抽取的RPA流程挖掘方法,参考图1,图1是本发明一种基于事件关系抽取的RPA流程挖掘方法的流程图,包括以下步骤:

S1、获取用户行为日志,所述用户行为日志由句子组成。

通过用户行为记录工具来记录用户执行业务流程中进行的操作,从而生成原始的用户行为日志。接着对原始的用户行为日志进行处理,将每个操作行为信息转换成句子形式,所以处理后的用户行为日志由多个句子组成。

S2、将用户行为日志中的句子两两组合,拼接成M个新句子W=(W

首先,输入一个句子,对输入句子中的每个单词进行映射处理,通过查找预先训练的词向量表获取每个单词的词向量。此时该句子被表示为一个实值向量序列W

S3、将每个实值向量序列输入到预训练好的BERT模型中进行学习,得到每个新句子的上下文语义信息。

BERT模型采用Transformer的编码块结构作为特征提取器,得到每个新句子的更深层次更丰富的上下文语义信息V

v

其中,V

S4、将每个新句子的上下文语义信息输入Bi-LSTM模型中,得到每个新句子长度的隐藏状态序列。

H

其中,V

S5、将每个新句子长度的隐藏状态序列输入到一个池化层,获得每个新句子的关系向量表示,所有句子的关系向量表示构成一个关系向量表示序列R=(r

将每个新句子长度的隐藏状态序列输入到一个池化层,获得每个新句子的关系向量表示用公式表示为:

r

其中,r

S6、将所有新句子的关系向量表示输入到自注意力层中,得到综合上下文信息的新句子关系向量表示。

计算公式如下:

score=exp(tanh(RW

H′

其中,score表示注意力得分,tanh代表tanh激活函数,W

S7、将综合上下文信息的新句子关系向量表示输入到全连接层,使用softmax函数获得每个新句子属于不同事件关系标签的概率,选择概率最大的事件关系标签作为该新句子事件关系类型的分类结果。

将综合上下文信息的新句子关系向量表示输入到全连接层,使用softmax函数获得每个新句子属于不同事件关系标签的概率的表达式为:

Z

其中,H

S8、根据每个新句子事件关系类型的分类结果,生成对应足迹矩阵,并构建petri网,参考图2,图2是本发明实施例基于事件关系构建petri网,x,y,z表示不同的事件,(x→y)表示x和y是因果关系;(x→y,x→z,y||z)表示x和y、x和z是因果关系,y和z是并行关系,(x→y,x→z,y#z)表示x和y、x和z是因果关系,y和z无关;(x→z,y→z,y#x)表示x和z、y和z是因果关系,y和x无关。跟据事件直接跟随关系,进行流程挖掘,构建成peri网。最终将事件日志转换为相应的流程挖掘模型。

本发明还提出一种基于事件关系抽取的RPA流程挖掘装置,包括:

处理器;

存储器,其上存储有可在所述处理器上运行的计算机程序;

其中,计算机程序被所述处理器执行时实现一种基于事件关系抽取的RPA流程挖掘方法。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术分类

06120116330909