掌桥专利:专业的专利平台
掌桥专利
首页

基于知识图谱的数智化系统

文献发布时间:2024-04-18 19:58:26


基于知识图谱的数智化系统

技术领域

本发明涉及大数据管理领域,尤其涉及一种基于知识图谱的数智化系统。

背景技术

现有技术中,对于科研机构的数据及人员管理系统,具备分析报告管理和成果管理功能,但成果检索的支撑能力有限,仅支持成果标题和关键词搜索,无法通过内容检索与智能推荐;

院内专家、院外专家及外部机构作为能源院重要资源,没有进行系统性的管理,仅维护其基本信息(其中外部机构还未纳入管理范围),无法掌握各自擅长的领域与研究方向,导致人力资源、外部资源无法高效协同使用,

目前成果、专家、外部资讯等信息处于相对孤立、无管理的状态,没有科学的进行图谱关联,亟需基于知识图谱技术,为这些分散、孤立的信息建立关联关系,同时分析结果能够辅助指导能源院后续研究方向与资源应用模式。

发明内容

为了解决上述问题,本发明的目的在于提供一种基于知识图谱的数智化系统,有效提高资源数字化管理能力。

为实现上述目的,本发明采用以下技术方案:

一种基于知识图谱的数智化系统,包括:数据采集层、数据知识存储层、数据处理层和业务层;

所述数据采集层采集系统数据,所述数据包括结构化、半结构化和无结构数据;

所述数据知识存储层为知识图谱构建过程中的数据媒介;

所述数据处理层,对数据采集层采集到的数据进行清洗、汇总、持久化处理,供业务层使用;

所述业务层,包括知识图谱引擎和应用管理单元。

进一步的,所述结构化为多源异构数据通过ERP系统获取,所述半结构化数据通过资讯网站或研究机构网站获取,所述无结构数据通过科研报告和科研成果文档获取。

进一步的,所述数据知识存储层包括本体构建产生的本体库,数据迁移过程中的数据采集池、语料库、模型库,知识应用过程中的三元组库、算法库和FAQ库。

进一步的,所述知识图谱数据入图,具体如下:

从数据知识存储层中获取结构化、半结构化和无结构数据,并分别处理;

对结构化数据进行预处理,去除异常数据,然后采用数据迁移入图;

对半结构化数据进行采集入图;

对非结构化数据,进行文本标注后进行标注入图,或经过实体、关系识别后入图。

进一步的,所述知识图谱引擎包括数据迁移、知识抽取两个子单元,分别对应结构化数据源、半/非结构化数据源的知识获取;业务层包括成果检索中心、资源管理中心、外部资讯中心、知识图谱引擎和知识图谱分析应用。

进一步的,所述成果检索中心用于对知识库概要、内容元素的快速检索与模糊查询;

所述资源管理中心,用于对院内员工、院外专家、外部机构进行资源整合与系统性管理,通过分析专家团队各自属性,其中包括:姓名、所在单位、优势业务领域信息,并将结果进行可视化分析展示,完成对专家团队的实时跟踪;

所述外部资讯中心,用于自动抓取机构颁布的相关政策材料以及国内外重大新闻资讯,并进行分类展示;

所述知识图谱引擎,对人、事件、政策、研究成果、外部机构元素进行数据接入,并建立数据的内在关联,为知识图谱提供基础支撑;

所述知识图谱分析应用,基于知识图谱引擎构建知识图谱,分析并展示人、事件、政策、研究成果、外部机构元素的关联关系与对应数据,通过分析结果数据,指导能源院后续研究方向与资源应用模式。

进一步的,专家库的知识图谱构建,具体如下:

收集专家的个人信息、学术成果、研究领域,并对收集到的数据进行清洗,去除重复、错误或不完整的信息,并将不同数据源的信息进行整合,建立统一的数据模型;

根据整合后的数据模型,构建专家标准库的知识图谱模型。

进一步的,将不同数据源的信息进行整合,具体如下:

实体识别和匹配:使用自然语言处理和实体识别技术,识别和抽取数据中的实体,并利用实体匹配算法,将不同数据源中的相同实体进行匹配,找出它们之间的对应关系。

对于匹配到的实体,将它们的属性进行关联和整合;

根据数据中的关系信息,建立实体之间的连接关系;

将匹配和整合后的数据存储到数据库或图数据库中,建立起统一的数据模型。

本发明具有如下有益效果:

本发明将院内专家、院外专家、外部机构等资源的档案、成果、领域等信息建联系,并进行统一管理,提高资源数字化管理能力;基于图谱应用的分析结果,为院内研究工作提供决策依据,提高管理效率。

附图说明

图1为本发明系统架构示意图;

图2为本发明一实施例中知识图谱更新方式。

具体实施方式

以下结合附图和具体实施例对本发明做进一步详细说明:

本发明提供一种基于知识图谱的数智化系统,包括:数据采集层、数据知识存储层、数据处理层和业务层;

所述数据采集层采集系统数据,所述数据包括结构化、半结构化和无结构数据;

所述数据知识存储层为知识图谱构建过程中的数据媒介;

所述数据处理层,对数据采集层采集到的数据进行清洗、汇总、持久化处理,供业务层使用;

所述业务层,包括知识图谱引擎和应用管理单元。

在本实施例中,优选的,结构化为多源异构数据通过ERP系统获取,所述半结构化数据通过资讯网站或研究机构网站获取,所述无结构数据通过科研报告和科研成果文档获取。

在本实施例中,优选的,数据知识存储层包括本体构建产生的本体库,数据迁移过程中的数据采集池、语料库、模型库,知识应用过程中的三元组库、算法库和FAQ库。

在本实施例中,优选的,知识图谱数据入图,具体如下:

从数据知识存储层中获取结构化、半结构化和无结构数据,并分别处理;

对结构化数据进行预处理,去除异常数据,然后采用数据迁移入图;

对半结构化数据进行采集入图;

对非结构化数据,进行文本标注后进行标注入图,或经过实体、关系识别后入图。

在本实施例中,优选的,知识图谱引擎包括数据迁移、知识抽取两个子单元,分别对应结构化数据源、半/非结构化数据源的知识获取;业务层包括成果检索中心、资源管理中心、外部资讯中心、知识图谱引擎和知识图谱分析应用。

在本实施例中,优选的,成果检索中心用于对知识库概要、内容元素的快速检索与模糊查询;

所述资源管理中心,用于对院内员工、院外专家、外部机构进行资源整合与系统性管理,通过分析专家团队各自属性,其中包括:姓名、所在单位、优势业务领域信息,并将结果进行可视化分析展示,完成对专家团队的实时跟踪;

所述外部资讯中心,用于自动抓取机构颁布的相关政策材料以及国内外重大新闻资讯,并进行分类展示;

所述知识图谱引擎,对人、事件、政策、研究成果、外部机构元素进行数据接入,并建立数据的内在关联,为知识图谱提供基础支撑;

所述知识图谱分析应用,基于知识图谱引擎构建知识图谱,分析并展示人、事件、政策、研究成果、外部机构元素的关联关系与对应数据,通过分析结果数据,指导能源院后续研究方向与资源应用模式。

在本实施例中,优选的,专家库的知识图谱构建,具体如下:

收集专家的个人信息、学术成果、研究领域,并对收集到的数据进行清洗,去除重复、错误或不完整的信息,并将不同数据源的信息进行整合,建立统一的数据模型;

根据整合后的数据模型,构建专家标准库的知识图谱模型。

在本实施例中,将不同数据源的信息进行整合,具体如下:

实体识别和匹配:使用自然语言处理和实体识别技术,识别和抽取数据中的实体,如专家姓名、机构名称、学术成果等。然后,利用实体匹配算法,将不同数据源中的相同实体进行匹配,找出它们之间的对应关系。同样的,员工库及资讯库的知识图谱也采用同样的构建方法。

属性关联和整合:对于匹配到的实体,将它们的属性进行关联和整合。例如,将不同数据源中的专家的学术成果、研究领域、技能等属性进行整合,形成一个全面的专家画像。

关系建立和连接:根据数据中的关系信息,建立实体之间的连接关系。例如,通过专家与学术成果之间的合作关系,建立合作网络;通过专家与研究领域之间的关联关系,建立专家的研究兴趣。

数据整合和存储:将匹配和整合后的数据存储到数据库或图数据库中,建立起统一的数据模型。可以使用关系型数据库或图数据库来存储和管理数据,以支持高效的数据查询和检索操作。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

相关技术
  • 一种利用知识图谱数智化电力系统的方法及终端
  • 一种基于物联网的数智地下水检测图谱系统
技术分类

06120116487652