掌桥专利:专业的专利平台
掌桥专利
首页

一种知识抽取构建方法、装置、设备及存储介质

文献发布时间:2023-06-19 10:29:05


一种知识抽取构建方法、装置、设备及存储介质

技术领域

本发明涉及文本处理技术领域,更具体地说,涉及一种知识抽取构建方法、装置、设备及存储介质。

背景技术

银行客服领域相关工作人员为面对不同客户的问题,需要及时给出正确的解答;但银行所涉及的业务广泛,相关业务文档类型复杂,文档的介绍内容过于繁多,查询起来十分困难。目前,针对银行客服工作人员涉及的知识,通常采用人工梳理、集中确认、依次录入的方式;知识管理者需要提前通过对下发的相关业务文档进行梳理,整理出不同的有关要素、知识点,再根据统一的知识类型结构进行二次梳理,与相关人员确认知识内容无误后,利用手动上传和批量导入的知识构建方式将知识录入系统,完成知识的构建流程。可见,现有技术中在实现知识获取时知识获取依赖人为感知,知识感知方面不足,且知识构建流程复杂,占用时间较长,导致知识获取成本较高。

发明内容

本发明的目的是提供一种知识抽取构建方法、装置、设备及存储介质,本申请无需人工介入,即可实现业务数据中知识的自动抽取及构建,进而有效提高知识感知,简化知识构建流程,减少占用时间,最终有效降低知识获取成本。

为了实现上述目的,本发明提供如下技术方案:

一种知识抽取构建方法,包括:

接收上传的业务数据,并将所述业务数据转换为预设的数据结构的数据;

确定预先构建的知识抽取任务,并将预设的数据结构的所述业务数据添加至所述知识抽取任务中;

执行所述知识抽取任务,得到相应的抽取结果,并将需要构建知识的所述抽取结果作为知识存储至相应的知识库中。

优选的,执行所述知识抽取任务之前,还包括:

判断预设的数据结构的所述业务数据是否满足预设的进行知识抽取的要求,如果是,则执行执行所述知识抽取任务的步骤,否则,反馈需要重新上传业务数据的信息。

优选的,确定需要构建知识的所述抽取结果,包括:

将所述抽取结果及预设的数据结构的所述业务数据进行展示;

确定外界基于展示的内容输入的选取指令,并确定与所述选取指令相应的抽取结果为需要构建知识的抽取结果。

优选的,将需要构建知识的所述抽取结果作为知识存储至相应的知识库中,包括:

获取需要构建知识的所述抽取结果相对应的知识标签,并将需要构建知识的所述抽取结果及相对应的知识标签均存储至所述知识库中。

优选的,确定需要构建知识的所述抽取结果之后,还包括:

确定除需要构建知识的抽取结果之外的抽取结果均为待反馈结果,并以列表的形式反馈所述待反馈结果。

优选的,将需要构建知识的所述抽取结果作为知识存储至相应的知识库中之后,还包括:

将已存储所述业务数据对应知识至所述知识库中的信息,推送至能够对所述知识库进行访问的全部终端。

优选的,构建知识抽取任务,包括:

接收知识抽取请求,构建响应所述知识抽取请求的任务为知识抽取任务。

一种知识抽取构建装置,包括:

转换模块,用于:接收上传的业务数据,并将所述业务数据转换为预设的数据结构的数据;

添加模块,用于:确定预先构建的知识抽取任务,并将预设的数据结构的所述业务数据添加至所述知识抽取任务中;

抽取模块,用于:执行所述知识抽取任务,得到相应的抽取结果,并将需要构建知识的所述抽取结果作为知识存储至相应的知识库中。

一种知识抽取构建设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上任一项所述知识抽取构建方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述知识抽取构建方法的步骤。

本发明提供了一种知识抽取构建方法、装置、设备及存储介质,该方法包括:接收上传的业务数据,并将所述业务数据转换为预设的数据结构的数据;确定预先构建的知识抽取任务,并将预设的数据结构的所述业务数据添加至所述知识抽取任务中;执行所述知识抽取任务,得到相应的抽取结果,并将需要构建知识的所述抽取结果作为知识存储至相应的知识库中。本申请在接收到上传的业务数据后,为了方便对业务数据的处理,将业务数据转换为预设的数据结构的数据,然后将业务数据添加至相应的知识抽取任务,通过知识抽取任务的执行抽取业务数据中的知识,并实现知识至知识数据库的存储,从而无需人工介入,即可实现业务数据中知识的自动抽取及构建,进而有效提高知识感知,简化知识构建流程,减少占用时间,最终有效降低知识获取成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种知识抽取构建方法的第一种流程图;

图2为本发明实施例提供的一种知识抽取构建方法的第二种流程图;

图3为本发明实施例提供的一种知识抽取构建装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,其示出了本发明实施例提供的一种知识抽取构建方法的流程图,可以包括:

S11:接收上传的业务数据,并将业务数据转换为预设的数据结构的数据。

本发明实施例提供的一种知识抽取构建方法的执行主体可以为对应的知识抽取构建装置;另外,本申请可以应用于银行领域下业务文档知识抽取和构建,而从中抽取得到的知识可以包括不同业务的定义、规范等内容,对应的本申请实施例中用户上传的业务数据则可以为业务文档。本申请实施例可以基于数据处理接口在接收到上传的业务数据后,对业务数据进行相应的处理,最终得到符合知识抽取及构建的需求的数据结构的数据;其中,数据处理接口用于处理不同数据类型的实现类,统一态数据结构,预设的数据结构可以根据实际需要进行设定,如文本格式,而将业务数据转换为预设的数据结构的数据,则可以为通过对业务数据进行解析,得到其中包含的全部文本信息,作为后续需要实现知识提取的信息。

S12:确定预先构建的知识抽取任务,并将预设的数据结构的业务数据添加至知识抽取任务中。

在需要进行知识抽取时可以先构建相应的知识抽取任务,如设置实现知识抽取的线程、设置实现知识抽取的其他模块等;在对上传的业务数据进行解析得到预设的数据结构的数据后,可以将预设的数据结构的数据添加至知识抽取任务中,以通过知识抽取任务的执行实现对预设的数据结构的数据中知识的抽取。

S13:执行知识抽取任务,得到相应的抽取结果,并将需要构建知识的抽取结果作为知识存储至相应的知识库中。

执行知识抽取任务则可以实现对知识抽取任务中已添加的数据的知识抽取操作,得到已添加至知识抽取任务中的数据包含的知识,进而将这些知识存储至相应的知识库中,从而实现知识自动抽取及构建。

本申请在接收到上传的业务数据后,为了方便对业务数据的处理,将业务数据转换为预设的数据结构的数据,然后将业务数据添加至相应的知识抽取任务,通过知识抽取任务的执行抽取业务数据中的知识,并实现知识至知识数据库的存储,从而无需人工介入,即可实现业务数据中知识的自动抽取及构建,进而有效提高知识感知,简化知识构建流程,减少占用时间,最终有效降低知识获取成本。

本发明实施例提供的一种知识抽取构建方法,执行知识抽取任务之前,还可以包括:

判断预设的数据结构的业务数据是否满足预设的进行知识抽取的要求,如果是,则执行执行知识抽取任务的步骤,否则,反馈需要重新上传业务数据的信息。

在将业务数据转换为预设的数据结构的数据后,在执行知识抽取任务之前,可以判断业务数据是否满足预设的进行知识抽取的要求,如业务数据中是否存在乱码情况、业务数据是否为空等,从而在判断出业务数据中存在乱码情况或者业务数据为空等情况时,确定业务数据不满足预设的进行知识抽取的要求,因此,反馈需要重新上传业务数据的信息,否则,确定业务数据满足预设的进行知识抽取的要求,因此,可以对业务数据执行知识抽取任务,从而通过这种方式,进一步保证基于业务数据实现知识抽取及构建时的有效性。其中,判断业务数据是否满足预设的进行知识抽取的要求也即分析业务数据的数据类型,从而确定业务数据的数据类型是否符合知识抽取的格式要求,基于此实现后续操作。

本发明实施例提供的一种知识抽取构建方法,确定需要构建知识的抽取结果,可以包括:

将抽取结果及预设的数据结构的业务数据进行展示;

确定外界基于展示的内容输入的选取指令,并确定与选取指令相应的抽取结果为需要构建知识的抽取结果。

本申请实施例在得到抽取结果后,可以将抽取结果进行保存;并且,将抽取结果列表展示,同时展示上传的业务数据,从而使得外界用户能够对两者进行对比,判断抽取结果是否为业务数据中需要抽取的知识,也即抽取结果是否符合称为知识的要求,如果判断的结果为是,则可以输入相应的选取指令,知识抽取构建装置则可以将选取指令对应的抽取结果均作为知识进行存储,从而能够保证存储至知识库中的知识均为业务数据中包含的需要提取的知识。其中,对抽取结果进行展示时以列表的形式展示,用户可以将其中需要作为知识的抽取结果设置标记,而不需要作为知识的抽取结果不设置标记,从而确定设置的标记即为相应的选取指令,进而基于选取指令实现作为知识的抽取结果的选取。

本发明实施例提供的一种知识抽取构建方法,将需要构建知识的抽取结果作为知识存储至相应的知识库中,可以包括:

获取需要构建知识的抽取结果相对应的知识标签,并将需要构建知识的抽取结果及相对应的知识标签均存储至知识库中。

需要说明的是,本申请实施例可以从抽取结果中提取相应的关键词作为该抽取结果的知识标签,也可以是获取外界用户输入的抽取结果的知识标签,进而将知识标签及对应的抽取结果均存储至知识库中,实现知识类型的划分,满足多场景应用的支撑,使得消费者查询时能够快速定位知识,进而满足知识的精准推送。其中,知识标签可以为表示相应知识的关键词或者与相应知识关联的关键词,如知识为“苹果的种植方法”,则相应的标签可以为“苹果培育”“植物种植”等。

本发明实施例提供的一种知识抽取构建方法,确定需要构建知识的抽取结果之后,还可以包括:

确定除需要构建知识的抽取结果之外的抽取结果均为待反馈结果,并以列表的形式反馈待反馈结果。

本申请在确定需要构建知识的抽取结果后,还可以反馈其他抽取结果列表页面,从而使得外界用户基于此可以获知无法作为知识存储至知识库的抽取结果,方便其实现手动编辑或者其他操作。

本发明实施例提供的一种知识抽取构建方法,将需要构建知识的抽取结果作为知识存储至相应的知识库中之后,还可以包括:

将已存储业务数据对应知识至知识库中的信息,推送至能够对知识库进行访问的全部终端。

为了方便不同终端的用户对于知识库中知识的获取,本申请实施例还可以将已经存储业务数据对应知识至知识库中的信息,推送给对知识库具有访问权限的全部终端,方便其获知知识库中发生的知识新增行为,进而基于此实现相应的访问等操作。

本发明实施例提供的一种知识抽取构建方法,构建知识抽取任务,可以包括:

接收知识抽取请求,构建响应知识抽取请求的任务为知识抽取任务。

本申请在实现知识抽取任务的构建时,可以是在接收到用户输入的知识抽取请求后,则构建相应的线程或者模块等知识抽取任务,从而实现对用户请求的响应,满足用户实现知识抽取及构建的需求。

在一种具体应用场景中,本申请实施例提供的一种知识抽取构建方法可以分为多个阶段,分别为添加业务数据、知识抽取及知识入库等,如图2所示,具体可以包括:

一、知识抽取:整理业务数据,对业务数据中的知识点进行抽取。

步骤101新建抽取任务:构建知识抽取任务。

步骤102上传数据:将待抽取的业务数据添加至知识抽取任务中。

步骤103数据处理接口:处理不同数据类型的实现类,统一态数据结构。

步骤104分析数据类型:如果上传的数据类型符合知识抽取的格式要求则可以进行抽取,否则,返回数据上传,需要重新上传符合格式的数据类型。

步骤105抽取知识:执行知识抽取任务。

步骤106生成知识抽取结果:在对上传的业务数据进行知识抽取操作后,将抽取结果列表展示,并且同时展示原业务数据,以做对比。

二、知识构建:梳理、编辑抽取结果,为抽取结果添加知识标签,新增知识入库。

步骤201保存抽取结果:将本次知识抽取所得的抽取结果保存。

步骤202审核抽取结果是否符合:审核本次对数据进行知识抽取的结果是否符合成为知识的要求,如果符合则可以对抽取结果进行知识的构建,否则,需要对保存的抽取结果进行编辑。

步骤203基于步骤202判断是否构建知识:判断是否需要将本次的抽取结果构建成知识(也即抽取结果是否符合成为知识的要求),如果需要则开始新增知识,否则反馈知识抽取结果列表页面。

步骤204添加知识标签:为抽取结果添加知识标签。

步骤205新增知识:抽取结果添加成为知识。

本申请借助语义理解、知识模型对业务上产生的各类文档、数据进行分析后,针对文档中可能出现的不同业务的定义、规范等内容自动抽取生成知识,并且为抽取出的知识打上标签,方便知识的快速定位和二次搜索。主要针对银行领域下,不同业务类型的文档数据的知识抽取结果可以产生较好的表现,适应不同的知识管理使用场景,因此业务针对性强;借助自然语言理解技术中的语义理解和知识模型,使得不同的业务类型数据都可以适用在抽取技术上,此外具备完整的知识管理流程,支持为知识点添加标签,因此功能覆盖面全;有利于增加知识维护效率,提高知识管理效益,加快需求响应速度,增强对外服务竞争力,提高经济效益,完善知识消费,提升业务人员工作效率,因此综合效益性高。

本发明实施例还提供了一种知识抽取构建装置,如图3所示,可以包括:

转换模块11,用于:接收上传的业务数据,并将业务数据转换为预设的数据结构的数据;

添加模块12,用于:确定预先构建的知识抽取任务,并将预设的数据结构的业务数据添加至知识抽取任务中;

抽取模块13,用于:执行知识抽取任务,得到相应的抽取结果,并将需要构建知识的抽取结果作为知识存储至相应的知识库中。

本发明实施例提供的一种知识抽取构建装置,还可以包括:

判断模块,用于:执行知识抽取任务之前,判断预设的数据结构的业务数据是否满足预设的进行知识抽取的要求,如果是,则执行执行知识抽取任务的步骤,否则,反馈需要重新上传业务数据的信息。

本发明实施例提供的一种知识抽取构建装置,抽取模块还可以包括:

确定单元,用于:将抽取结果及预设的数据结构的业务数据进行展示;确定外界基于展示的内容输入的选取指令,并确定与选取指令相应的抽取结果为需要构建知识的抽取结果。

本发明实施例提供的一种知识抽取构建装置,抽取模块可以包括:

获取单元,用于:获取需要构建知识的抽取结果相对应的知识标签,并将需要构建知识的抽取结果及相对应的知识标签均存储至知识库中。

本发明实施例提供的一种知识抽取构建装置,还可以包括:

反馈模块,用于:确定需要构建知识的抽取结果之后,确定除需要构建知识的抽取结果之外的抽取结果均为待反馈结果,并以列表的形式反馈待反馈结果。

本发明实施例提供的一种知识抽取构建装置,还可以包括:

推送模块,用于:将需要构建知识的抽取结果作为知识存储至相应的知识库中之后,将已存储业务数据对应知识至知识库中的信息,推送至能够对知识库进行访问的全部终端。

本发明实施例提供的一种知识抽取构建装置,还可以包括:

构建模块,用于:接收知识抽取请求,构建响应知识抽取请求的任务为知识抽取任务。

本发明实施例还提供了一种知识抽取构建设备,可以包括:

存储器,用于存储计算机程序;

处理器,用于执行计算机程序时实现如上任一项知识抽取构建方法的步骤。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可以实现如上任一项知识抽取构建方法的步骤。

需要说明的是,本发明实施例提供的一种知识抽取构建装置、设备及存储介质中相关部分的说明请参见本发明实施例提供的一种知识抽取构建方法中对应部分的详细说明,在此不再赘述。另外,本发明实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。

对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种知识抽取构建方法、装置、设备及存储介质
  • 医疗知识图谱的构建方法、构建装置、设备和存储介质
技术分类

06120112568464