掌桥专利:专业的专利平台
掌桥专利
首页

一种知识库管理系统的数据管理方法、装置、设备及介质

文献发布时间:2024-04-18 19:59:31


一种知识库管理系统的数据管理方法、装置、设备及介质

技术领域

本发明涉及计算机技术领域,特别涉及一种知识库管理系统的数据管理方法、装置、设备及介质。

背景技术

当前,随着社会的不断发展,商业上的业务需求也越来越大,而在各种公司的内部各部门间、公司与总分行等外部客户、公司与上下游供应商的协同过程中,提炼出的各类知识资产未能实现闭环管理、有效沉淀,且海量知识资产未能实现价值转化及复用,造成资源浪费。而市面上现有的知识库管理系统,仍存在许多短板,例如知识采集不够智能化、知识更新不及时、知识取用效率低下等,而这些现有技术的缺陷会导致效率低下,进而造成资源占用过高以及各种人力物力资源的浪费。

发明内容

有鉴于此,本发明的目的在于提供一种知识库管理系统的数据管理方法、装置、设备及介质,可以通过不断地更新数据,实现对知识数据的不断积累,为后续业务提供全面的知识赋能,进而提高处理效率。其具体方案如下:

第一方面,本申请公开了一种知识库管理系统的数据管理方法,应用于知识库管理系统,包括:

从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据;

对所述预处理后知识数据进行标签化处理,利用得到的标签数据构建知识图谱,并利用所述预处理后知识数据以及所述知识图谱构建本地知识库;

判断是否接收到数据查询请求,若是,则通过所述本地知识库对所述数据查询请求进行分析,以基于分析结果反馈相应的目标知识数据;

判断所述若干预设数据源的知识数据是否更新,若是,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以对所述本地知识库进行数据补充。

可选的,所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据,包括:

基于预设自然语言处理技术和/或机器学习技术从若干预设数据源中进行知识数据的自动提取,并对提取到的所述知识数据进行数据分类,以得到分类后数据;

对所述分类后数据进行数据清洗操作,并对得到的清洗后数据进行归一化操作,以得到预处理后知识数据。

可选的,所述对所述预处理后知识数据进行标签化处理,利用得到的标签数据构建知识图谱,并利用所述预处理后知识数据以及所述知识图谱构建本地知识库,包括:

为所述预处理后知识数据中每一种类的数据分别添加相应的数据标签,以得到若干种不同种类的标签数据;

对所述标签数据进行结构化处理,以基于得到的结构化标签数据构建知识图谱,并通过所述知识图谱以及所述预处理后知识数据构建本地知识库。

可选的,所述判断是否接收到数据查询请求,若是,则通过所述本地知识库对所述数据查询请求进行分析,以基于分析结果反馈相应的目标知识数据,包括:

判断是否接受到数据查询请求,若是,则对所述数据查询请求进行分析,以得到与所述数据查询请求对应的分析结果;所述分析结果为表征所述数据查询请求需要查询的数据类型的分析结果;

利用预设检索算法基于所述分析结果从所述本地知识库中进行数据检索,以得到于所述数据查询请求对应的若干检索数据;

分别对所述若干检索数据以及所述数据查询请求进行相似度计算,以得到目标检索数据,并对所述目标检索数据进行反馈。

可选的,所述分别对所述若干检索数据以及所述数据查询请求进行相似度计算,以得到目标检索数据,并对所述目标检索数据进行反馈,包括:

利用预设推理引擎分别对所述若干检索数据以及所述数据查询请求进行相似度计算,以得到若干相似度;

从所述若干相似度中确定相似度数值大于其他相似度数值的目标相似度,并确定与所述目标相似度对应的目标检索数据,以及对所述目标检索数据进行反馈。

可选的,所述判断所述若干预设数据源的知识数据是否更新,若是,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以对所述本地知识库进行数据补充,包括:

通过预设机器学习算法持续判断所述若干预设数据源的知识数据是否更新,若所述若干预设数据源中存在新增的更新数据,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以获取所述更新数据,并利用所述更新数据对所述本地知识库进行新一轮的数据补充。

可选的,所述知识库管理系统的数据管理方法,还包括:

若所述本地知识库的数据补充完成,则对所述本地知识库进行云安全加密操作。

第二方面,本申请公开了一种知识库管理系统的数据管理装置,应用于知识库管理系统,包括:

数据处理模块,用于从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据;

知识库构建模块,用于对所述预处理后知识数据进行标签化处理,利用得到的标签数据构建知识图谱,并利用所述预处理后知识数据以及所述知识图谱构建本地知识库;

数据反馈模块,用于判断是否接收到数据查询请求,若是,则通过所述本地知识库对所述数据查询请求进行分析,以基于分析结果反馈相应的目标知识数据;

数据更新模块,用于判断所述若干预设数据源的知识数据是否更新,若是,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以对所述本地知识库进行数据补充。

第三方面,本申请公开了一种电子设备,包括:

存储器,用于保存计算机程序;

处理器,用于执行所述计算机程序以实现如前述的知识库管理系统的数据管理方法。

第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如前述的知识库管理系统的数据管理方法。

本申请中,首先从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据,然后对所述预处理后知识数据进行标签化处理,利用得到的标签数据构建知识图谱,并利用所述预处理后知识数据以及所述知识图谱构建本地知识库,判断是否接收到数据查询请求,若是,则通过所述本地知识库对所述数据查询请求进行分析,以基于分析结果反馈相应的目标知识数据,最后判断所述若干预设数据源的知识数据是否更新,若是,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以对所述本地知识库进行数据补充。由此可见,通过本申请的知识库管理系统的数据管理方法,可以从不断更新的数据源中持续的提取知识数据,然后对提取的知识数据进行处理,以通过处理后的知识数据构建知识图谱,并通过构建的知识图谱以及处理后的知识数据不断地扩充本地知识库,以便在接收到用户的数据查询请求之后,可以准确地根据数据查询请求推送相应的数据。这样一来,可以通过不断地更新数据,实现对知识数据的不断积累,为后续业务提供全面的知识赋能,进而提高处理效率,提高用户的使用体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请公开的一种知识库管理系统的数据管理方法流程图;

图2为本申请公开的一种知识库管理系统的数据管理装置结构示意图;

图3为本申请公开的一种电子设备结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

现有的,知识库管理系统,仍存在许多短板,例如知识采集不够智能化、知识更新不及时、知识取用效率低下等,而这些现有技术的缺陷会呆滞效率低下,进而造成资源占用过高以及各种人力物力资源的浪费。

为了克服上述技术问题,本申请公开了一种知识库管理系统的数据管理方法、装置、设备及介质,可以通过不断地更新数据,实现对知识数据的不断积累,为后续业务提供全面的知识赋能,进而提高处理效率。

参见图1所示,本发明实施例公开了一种知识库管理系统的数据管理方法,应用于知识库管理系统,包括:

步骤S11、从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据。

本实施例中,为了构建本地知识库,需要先从预设的多种数据源中提取相应的知识数据,以为构建本地知识库进行数据积累,其具体过程如下:基于预设自然语言处理技术和/或机器学习技术从若干预设数据源中进行知识数据的自动提取,并对提取到的所述知识数据进行数据分类,以得到分类后数据;对所述分类后数据进行数据清洗操作,并对得到的清洗后数据进行归一化操作,以得到预处理后知识数据。也即,可以通过自然语言处理技术(Natural Language Processing,NLP)和/或机器学习技术从预设文本库、文档数据库等数据源中提取知识数据,并且由于上述数据源中的数据是不断更新的,因此可以不断地从上述数据源中获取知识数据,这样一来,可以对构建的知识库中的数据不断扩充,避免后续在接收到用户的数据查询请求之后出现数据匹配或数据推送不准确的情况。进一步的,在从预设的多种数据源中获取到知识数据后,需要对知识数据进行分类,并进行数据清洗,以对知识数据中的重复数据进行去重,并对去重后的数据进行归一化,以确保数据的质量以及一致性,并且对数据进行分类,可以在构建知识库时有效提高数据的使用效率,进而提高本申请所述知识库管理系统的数据管理方法的效率。

步骤S12、对所述预处理后知识数据进行标签化处理,利用得到的标签数据构建知识图谱,并利用所述预处理后知识数据以及所述知识图谱构建本地知识库。

本实施例中,在对知识数据进行预处理之后,可以对预处理后知识数据进行标签化,以便基于标签化数据构建知识图谱,其具体过程如下:为所述预处理后知识数据中每一种类的数据分别添加相应的数据标签,以得到若干种不同种类的标签数据;对所述标签数据进行结构化处理,以基于得到的结构化标签数据构建知识图谱,并通过所述知识图谱以及所述预处理后知识数据构建本地知识库。也即,在得到预处理后知识数据之后,由于每种知识数据均为经过分类的数据,因此可以对知识数据打上标签,以提高数据检索的效率以及可拓展性。进一步的,可以在对预处理后知识数据打上标签之后,对标签数据进行结构化处理,以便基于结构化标签数据进行知识图谱的构建,这样一来,可以通过知识图谱对各种数据间的结构以及关系进行有效映射从而实现高效的知识管理。进一步的,可以通过构建的知识图谱以及预处理后知识数据构建本地知识库,这样一来,可以通过构建的本地知识库进行数据的持久化存储。

步骤S13、判断是否接收到数据查询请求,若是,则通过所述本地知识库对所述数据查询请求进行分析,以基于分析结果反馈相应的目标知识数据。

本实施例中,当接收到用户的数据查询请求时,可以通过构建的本地知识库查询与数据查询请求相应的数据,其具体过程如下:判断是否接受到数据查询请求,若是,则对所述数据查询请求进行分析,以得到与所述数据查询请求对应的分析结果;所述分析结果为表征所述数据查询请求需要查询的数据类型的分析结果;利用预设检索算法基于所述分析结果从所述本地知识库中进行数据检索,以得到于所述数据查询请求对应的若干检索数据;分别对所述若干检索数据以及所述数据查询请求进行相似度计算,以得到目标检索数据,并对所述目标检索数据进行反馈。也即,在本地数据库构建完成后,当知识库管理系统接收到用户发送的数据查询请求,可以通过本地数据库匹配与数据查询请求对应的数据。需要进行说明的是,为了准确地对数据进行匹配,可以对数据查询请求进行分析,以确定表征所述数据查询请求需要的数据类型的分析结果,以便通过预设的检索算法在本地数据库中进行检索。

进一步的,在进行数据检索时,可以检索到与所述数据查询请求相匹配的多条数据,因此需要对每条数据与数据查询请求进行相似度计算,以得到相似度最高的数据作为反馈数据,其具体过程如下:利用预设推理引擎分别对所述若干检索数据以及所述数据查询请求进行相似度计算,以得到若干相似度;从所述若干相似度中确定相似度数值大于其他相似度数值的目标相似度,并确定与所述目标相似度对应的目标检索数据,以及对所述目标检索数据进行反馈。也即,可以通过知识库管理系统内部的推理引擎分别对检索出的若干检索数据以及数据查询请求进行相似度计算,以得到每条检索数据相应的相似度,并确定数值最大的相似度对应的检索数据,以将该数据作为目标检索数据进行推送。

步骤S14、判断所述若干预设数据源的知识数据是否更新,若是,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以对所述本地知识库进行数据补充。

本实施例中,由于数据源中的数据是不断更新的,因此需要不断地获取数据源中的数据进行本地知识库数据补充,且对本地数据库进行数据补充的具体过程如下:通过预设机器学习算法持续判断所述若干预设数据源的知识数据是否更新,若所述若干预设数据源中存在新增的更新数据,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以获取所述更新数据,并利用所述更新数据对所述本地知识库进行新一轮的数据补充。也即,可以通过预设学习算法判断预设若干数据源中是否有新的数据输入,若有新的数据输入,则可以对新输入的数据进行提取,并对新输入的数据进行预处理,保存至本地知识库,这样一来,可以实现对各流程节点下知识材料的积累,为后续业务流程提供知识赋能。进一步的,可以通过云安全加密对本地知识库进行加密,以保证知识库中的知识和数据的安全性和隐私性。

由此可见,通过本申请的知识库管理系统的数据管理方法,可以从不断更新的数据源中持续的提取知识数据,然后对提取的知识数据进行处理,以通过处理后的知识数据构建知识图谱,并通过构建的知识图谱以及处理后的知识数据不断地扩充本地知识库,以便在接收到用户的数据查询请求之后,可以准确地根据数据查询请求推送相应的数据。这样一来,一方面,可以通过自然语言处理技术,实现知识的自动化采集和分类,减少人工干预,并且可以通过对数据的标签化处理提高知识的存储效率和查询性能;另一方面,由于可以通过数据源可不断地更新数据,实现对知识数据的不断积累,因此可以对项目进行全生命周期的管理,为后续业务提供全面的知识赋能,进而提高处理效率,提高用户的使用体验。

参见图2所示,本发明实施例公开了一种知识库管理系统的数据管理装置应用于知识库管理系统,包括:

数据处理模块11,用于从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据;

知识库构建模块12,用于对所述预处理后知识数据进行标签化处理,利用得到的标签数据构建知识图谱,并利用所述预处理后知识数据以及所述知识图谱构建本地知识库;

数据反馈模块13,用于判断是否接收到数据查询请求,若是,则通过所述本地知识库对所述数据查询请求进行分析,以基于分析结果反馈相应的目标知识数据;

数据更新模块14,用于判断所述若干预设数据源的知识数据是否更新,若是,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以对所述本地知识库进行数据补充。

由此可见,本实施例中首先从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据,然后对所述预处理后知识数据进行标签化处理,利用得到的标签数据构建知识图谱,并利用所述预处理后知识数据以及所述知识图谱构建本地知识库,判断是否接收到数据查询请求,若是,则通过所述本地知识库对所述数据查询请求进行分析,以基于分析结果反馈相应的目标知识数据,最后判断所述若干预设数据源的知识数据是否更新,若是,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以对所述本地知识库进行数据补充。由此可见,通过本申请的知识库管理系统的数据管理方法,可以从不断更新的数据源中持续的提取知识数据,然后对提取的知识数据进行处理,以通过处理后的知识数据构建知识图谱,并通过构建的知识图谱以及处理后的知识数据不断地扩充本地知识库,以便在接收到用户的数据查询请求之后,可以准确地根据数据查询请求推送相应的数据。这样一来,一方面,可以通过自然语言处理技术,实现知识的自动化采集和分类,减少人工干预,并且可以通过对数据的标签化处理提高知识的存储效率和查询性能;另一方面,由于可以通过数据源可不断地更新数据,实现对知识数据的不断积累,因此可以对项目进行全生命周期的管理,为后续业务提供全面的知识赋能,进而提高处理效率,提高用户的使用体验。

在一些实施例中,所述数据处理模块11,具体可以包括:

数据分类单元,用于基于预设自然语言处理技术和/或机器学习技术从若干预设数据源中进行知识数据的自动提取,并对提取到的所述知识数据进行数据分类,以得到分类后数据;

数据处理单元,用于对所述分类后数据进行数据清洗操作,并对得到的清洗后数据进行归一化操作,以得到预处理后知识数据。

在一些实施例中,所述知识库构建模块12,具体可以包括:

数据标签添加单元,用于为所述预处理后知识数据中每一种类的数据分别添加相应的数据标签,以得到若干种不同种类的标签数据;

知识库构建单元,用于对所述标签数据进行结构化处理,以基于得到的结构化标签数据构建知识图谱,并通过所述知识图谱以及所述预处理后知识数据构建本地知识库。

在一些实施例中,所述数据反馈模块13,具体可以包括:

请求分析子模块,用于判断是否接受到数据查询请求,若是,则对所述数据查询请求进行分析,以得到与所述数据查询请求对应的分析结果;所述分析结果为表征所述数据查询请求需要查询的数据类型的分析结果;

数据检索子模块,用于利用预设检索算法基于所述分析结果从所述本地知识库中进行数据检索,以得到于所述数据查询请求对应的若干检索数据;

数据反馈子模块,用于分别对所述若干检索数据以及所述数据查询请求进行相似度计算,以得到目标检索数据,并对所述目标检索数据进行反馈。

在一些实施例中,所述数据反馈子模块,具体可以包括:

相似度计算单元,用于利用预设推理引擎分别对所述若干检索数据以及所述数据查询请求进行相似度计算,以得到若干相似度;

数据反馈单元,用于从所述若干相似度中确定相似度数值大于其他相似度数值的目标相似度,并确定与所述目标相似度对应的目标检索数据,以及对所述目标检索数据进行反馈。

在一些实施例中,所述数据更新模块14,具体可以包括:

数码据更新单元,用于通过预设机器学习算法持续判断所述若干预设数据源的知识数据是否更新,若所述若干预设数据源中存在新增的更新数据,则跳转至所述从若干预设数据源中提取知识数据,并对所述知识数据进行预处理,以得到预处理后知识数据的步骤,以获取所述更新数据,并利用所述更新数据对所述本地知识库进行新一轮的数据补充。

在一些实施例中,所述知识库管理系统的数据管理装置,还可以包括:

数据加密单元,用于若所述本地知识库的数据补充完成,则对所述本地知识库进行云安全加密操作。

进一步的,本申请实施例还公开了一种电子设备,图3是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。

图3为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的知识库管理系统的数据管理方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。

本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。

另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。

其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的知识库管理系统的数据管理方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。

进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的知识库管理系统的数据管理方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

技术分类

06120116523967