掌桥专利:专业的专利平台
掌桥专利
首页

一种相关文献获取方法、设备和储存介质

文献发布时间:2024-01-17 01:28:27


一种相关文献获取方法、设备和储存介质

技术领域

本发明涉及相关文献获取技术领域,特别涉及一种相关文献获取方法、设备和储存介质。

背景技术

相关文献查找是了解相关领域研究现状,判断文献创新性的重要途径。对于相关文献查找,现有技术一般通过相关检索工具进行直接检索,其检索内容包括作者、领域、主题、分类等内容,上述内容中一般通过关键字搜索进行查询,但是使用关键字搜索过程中,查找的文件内与关键字重合即可进行显示,但是通过关键字搜索的过程中,只提取其关键字内容,忽略文献中技术方案中不同数据及不同方法之间的联系,同时其关键字检索一般只提供方案的文字检索,不涉及附图及效果的检索,导致后期人工筛选需要浪费大量时间和精力。

发明内容

为解决上述现有技术中所存在的问题,本发明提供一种相关文献获取方法、设备和储存介质,能够从多方面有效筛选出具有技术方案内在联系的相关文献,获取文献范围更精确。

为了实现上述技术目的,本发明提供了如下技术方案:

一种相关文献获取方法,包括:获取查找信息,根据查找信息查找待筛选文献;获取补充信息,根据补充信息对待筛选文献进行筛选;对筛选后的文献分别进行排序,并通过数据架构对排序后的文献进行整合,得到整合后的相关文献。

可选的,其中所述查找信息包括:作者、机构、领域、分类号、关键字词;其中关键字词包括所使用方法、相关数据类型及参数类型。

可选的,所述待筛选文献的获取方法包括:

根据查找信息对不同数据库中的文献进行关键字搜索,将包含有关键字的文献进行提取,生成待筛选文献。

可选的,所述补充信息包括,方法或结构限定信息、附图及技术效果信息其中一种或多种。

可选的,根据所述补充信息中的方法或结构限定信息进行筛选的过程包括:

对所述方法或结构限定信息中的关系信息进行提取,其中所述关系信息包括数据类型、对应方法、结构器件、结构设备及连接方式或器件;

根据所述关系信息生成关系网络,其中所述关系网络包括特征节点及对应连接线,

根据待筛选文献生成拓扑网络;

对所述关系网络及拓扑网络进行相似判断,根据相似判断结果,获取方法结构限定相关文献。

可选的,根据所述附图进行筛选的过程包括:

对附图进行分类,得到流程图、结构图及数据图;

对所述流程图及流程网络进行信息提取,根据提取的信息,采用方法或结构限定信息进行筛选的方法进行筛选,获取流程图结构图相关文献;

对所述数据图进行文字及数值信息的提取,并根据数据图提取的信息获取所述数据图的第一数据趋势;

对待筛选文献中的表格或附图进行文字及数值信息提取,并根据待筛选文献提取的信息获取第二数据趋势;

对第一数据趋势及第二数据趋势进行匹配,根据匹配结果,获取数据图相关文献。

可选的,根据所述技术效果信息进行筛选的过程包括:

对所述技术效果信息中的效果相关信息进行提取,并对效果相关信息进行关键词提取,根据关键词提取信息在所述待筛选文献中进行查找,根据所述查找结果对所述待筛选文献进行筛选,生成技术效果信息相关文献。

可选的,通过XML数据架构对排序后的文献进行整合。

为了更好的实现上述技术目的,本发明还提供了一种相关文献获取设备,包括:

查找模块、补充模块、整合模块,其中所述查找模块、所述补充模块及所述整合模块依次连接。

通过所述查找模块获取查找信息,根据查找信息查找待筛选文献;

通过所述补充模块获取补充信息,根据补充信息对待筛选文献进行筛选;

通过所述整合模块对筛选后的文献分别进行排序,并通过数据架构对排序后的文献进行整合,得到整合后的相关文献。

一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被计算机执行时实现一种相关文献获取方法。

本发明具有如下技术效果:

通过上述技术方案,本发明通过使用查找信息限定一个较大的查找范围,并通过输入其具体的补充内容,补充内容不需要人为的进行限定,通过补充内容中不同数据之间的联系,生成表征有数据之间内在联系的关系网络,通过关系网络与查找范围之内的文献进行匹配筛选,从包含有相关联系的内容中去判定其相关性,并通过方案本身、提供相关附图及效果多方面对相关性进行筛选,能够从多方面有效筛选出具有技术方案内在联系的相关文献,减少后期人工筛选的工作量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的方法流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了解决在现有技术中存在的问题,本发明提供了如下方案:

实施例一

如图1所述,本发明提供了一种相关文献获取方法包括:

首先获取查找信息,其中查找信息包括,作者、机构、领域、分类号、关键字词,通过检索逻辑词对上述查找信息进行检索式的编写,可选择上述一种查找信息的使用或者多种查找信息的组合使用,均需要检索逻辑词对上述查找信息进行连接,检索逻辑词包括,“and”、“or”、“not”等词,关键字词包括使用方法、相关数据类型及参数类型,查找信息为一般检索式内容,此处不做赘述。

查找信息确定后,根据查找信息,通过在不同数据库中的文献中进行关键字搜索,将包含有关键字的文献进行提取,生成待筛选文献,数据库包括有知网、万方等包含有相关文献的数据库,该数据库为收录有论文、期刊或专利文献的提供有检索功能的数据库,此处不做赘述。

然后获取补充信息,补充信息包括方法或结构限定信息、附图及技术效果信息其中一种,方法限定信息为针对某种方法或某段对数据、信息或信号进行处理的具体流程信息,其中单句具体体现为通过/根据/基于/使用/采用某种方法对何种数据/信息/信号进行何种处理,生成/得到/获得何种数据/信息/信号结构限定信息为针对某个具有连接设置结构的设备/装置/器件的具体结构描述;单句体现为针对某种设备/装置/器件通过器件/线路/装置/设备与某种设备/装置/器件进行何种连接,附图为相关的流程图、结构图或效果图,技术效果信息为针对需要搜索的技术效果相关内容,单句体现为对某种方法/场景/应用/设备/装置获得某种有益效果,如减少运算、提升准确度、提升效率等效果描述,通过上述不同的补充信息分别筛选出不同的文献。

在输入补充信息后,根据补充内容对待筛选文献进行筛选,此过程中,通过不同类型的补充信息分别对文献进行筛选,不同补充信息可选择一种或多种进行使用。

针对方法或结构限定信息进行筛选过程中,首先设置标识关键词存储数据库,针对方法的标识关键词存储单句关系中的标识关键字词,如“通过/基于/根据/使用”等字词作为使用方法的标识关键字词,“对/针对”等字词作为处理数据/信息/信号的标识关键字词,“进行”等字词作为具体处理内容的标识关键字词,“得到/生成/获得”等标识关键字词作为生成数据/信息/信号的标识关键字词。在标识关键字词的指示下,对补充内容中的方法、处理数据类型、具体处理内容、生成数据进行提取,提取后,以处理数据为起始特征节点,以生成数据为指向特征节点,并根据上述内容对起始特征节点及指向特征节点赋予标签,以方法及具体处理内容为起始特征节点及指向特征节点的连接线,并根据方法及具体处理内容为连接线赋予标签,在构建后,若涉及已构建完成的起始特征节点或指向特征节点,则在已构建完成的起始特征节点或指向特征节点的基础上继续进行节点与连接线的构建。通过对方法限定信息依次提取构建特征节点及连接线,遍历所有的补充信息,生成关系网络,关系网络中包含赋予标签的特征节点及赋予标签的连接线。

针对待筛选文献通过语义识别网络,如深度学习网络进行语义识别,识别其对应的处理数据类型、生成数据类型、方法、具体处理内容等构建网络的相关内容,在上述相关内容的基础上,通过上述关系网络构建的方法,构建待筛选文献的特征拓扑网络。

对关系网络与特征拓扑网络进行匹配的过程中,首先进行连接线匹配,以关系网络中的连接线标签为基础,搜索拓扑网络中的连接线标签,搜索过程中,对关系网络中的连接线标签进行英文简写标识的添加,并以添加的英文简写标识及连接线标签中的方法、处理过程进行相似度匹配,若相似度达到一定的阈值时,则标记该关系网络中连接线与拓扑网络连接线相似,同时以该连接线为基础,对关系网络及拓扑网络连接线的起始特征节点与指向特征节点进行相似度比较,若相似度达到一定阈值时,阈值根据人工经验设置,则标记上述特征节点,相似度采用字符字数重复度判断,在标记完成后,保留标记后的关系网络,并对保留标记的关系网络标记部分占整体网络的比值,若比值大于某项阈值时,则保留该文献为相关文献。

针对结构限定信息,同样构建标识关键字的存储数据库,如“针对”等字词作为起始设备的标识关键字词,“通过/使用/采用”等字词作为使用连接器件的标识关键字词,“与/及”等字词作为终止设备的标识关键字词,“进行”等标识关键字词作为连接方式的标识关键字词。在标识关键字词的指示下,对补充内容中的起始设备、连接器件、终止设备、连接方式进行提取,提取后,以起始设备为起始特征节点,以终止设备为指向特征节点,并根据上述内容对起始特征节点及指向特征节点赋予标签,以方法及具体处理内容为起始特征节点及指向特征节点的连接线,并根据连接器件及连接方式为连接线赋予标签,在构建后,若涉及已构建完成的起始特征节点或指向特征节点,则在已构建完成的起始特征节点或指向特征节点的基础上继续进行节点与连接线的构建。通过上述方案构建设备的关系网络;

针对待筛选文献同样通过语义识别网络,如深度学习网络进行语义识别,识别不同结构网络中所涉及的相关内容,并以设备关系网络构建方式同样构建设备拓扑网络;其关系网络与拓扑网络进行匹配的过程与方法网络匹配相同,此处不做赘述。

针对附图的识别内容,附图包括流程图、结构图及实验数据图,其上述附图类型差距较大,可选择相关分类算法或网络进行分类,此处不做赘述。

针对流程图及结构图,通过相关深度学习网络进行附图中的文字信息及连接结构信息进行提取,并使用语义识别网络对提取的信息进行处理,生成能够构建关系图的相关内容,在待筛选文献中的附图同样通过深度学习网络及语义识别网络进行拓扑网络相关内容的提取,使用方法或结构限定信息进行筛选的方法进行筛选,此处不做赘述。

针对实验数据图,通过深度学习网络对附图中的文字及数值信息进行提取,文字信息包括单位及标题,数值信息包括附图中的数值内容,采用离散数据的格式对上述数值内容进行记录,记录完成后,根据文字信息中的单位及标题对数值内容的趋势进行统计,统计趋势曲线作为第一数据趋势;并对待筛选文献中的表格或附图通过深度学习网络进行文字及数值信息提取,并记录其文字内容及数值信息,同样采用离散数据进行记录,记录后,以文字信息为基础,统计对应的趋势曲线作为第二数据趋势,对第一数据趋势及第二数据趋势进行曲线相似度匹配,并根据人工经验设置一定的阈值对相似度结果进行判断作为匹配结果,符合阈值的作为相关文献。

针对技术效果信息,对技术效果同样设置标识关键词数据库,“针对/对”作为应用的标识关键字,“达到/获得/能够/可以”作为效果的标识关键字,对上述内容进行提取,在待筛选文献中对上述内容进行组合的关键字搜索,将包含有上述内容的待筛选文献进行保留,生成技术效果信息相关文献。

在生成相关文献后,对相关文献进行排序,根据相似度结果由大到小对不同的文献进行排序。并通过将排序结果编写到XML数据架构中进行整合,生成整合后的相关文献。通过XML数据架构对文献进行整合,首先构建其数据架构,数据架构中根元素为查找信息、并在查找信息根元素下构建补充信息的子元素,在补充信息子元素下构建详细描述,为相似度排序的文献名称及对应相似的内容,在数据架构构建完成后,获取不同查找信息、补充信息及对应相关文献内容,并将上述内容编写到上述数据架构的对应位置,生成整合文献;整合后方便相关人员进行查看,在生成整合文献后,将不同类型的补充信息中均存在的文献进行显示,作为强相关文献。

通过上述技术方案,本发明通过使用查找信息限定一个较大的查找范围,并通过输入其具体的补充内容,补充内容不需要人为的进行限定,通过补充内容中不同数据之间的联系,生成表征有数据之间内在联系的关系网络,通过关系网络与查找范围之内的文献进行匹配筛选,从包含有相关联系的内容中去判定其相关性,并通过方案本身、提供相关附图及效果多方面对相关性进行筛选,能够从多方面有效筛选出具有技术方案内在联系的相关文献,减少后期人工筛选的工作量。

实施例二

为了更好的实现上述技术目的,本发明还提供了一种相关文献获取设备,包括:

查找模块、补充模块、整合模块,其中所述查找模块、所述补充模块及所述整合模块依次连接。

通过所述查找模块获取查找信息,根据查找信息查找待筛选文献;

通过所述补充模块获取补充信息,根据补充信息对待筛选文献进行筛选;

通过所述整合模块对筛选后的文献分别进行排序,并通过数据架构对排序后的文献进行整合,得到整合后的相关文献。其内容与方法相对应,此处不做赘述。

实施例三

为了更好的实现上述技术目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被计算机执行时实现一种相关文献获取方法,其内容与方法相对应,此处不做赘述。。

以上,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

相关技术
  • 一种远程就诊的方法、装置、设备和储存介质
  • 一种图像拼接方法、装置、储存介质及设备
  • 一种基于IPSec的通信方法、装置、设备和储存介质
  • 一种植物的识别方法、装置、储存介质和设备
  • 一种数据获取方法、电子设备和计算机可读储存介质
  • 一种数据获取方法、电子设备和计算机可读储存介质
技术分类

06120116231970