掌桥专利:专业的专利平台
掌桥专利
首页

一种关系强度分析系统及信息推荐系统

文献发布时间:2023-06-19 11:26:00


一种关系强度分析系统及信息推荐系统

技术领域

本发明涉及数据分析技术领域,具体为一种关系强度分析系统及信息推荐系统。

背景技术

文献是指图书、期刊、典章所记录知识的总和。文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。

通过对文献作者的分析,可以了解各个作者的研究领域、技术状态、各个作者之间的关联关系等,为开展技术研发、寻找合作伙伴、引进技术人才、构建研发团队等提供有效的分析依据。

以论文和专利为例,通过对论文的分析,可以对学者的贡献度、影响力等进行评价;通过对专利的申请人、发明人的关联分析可以获知企业的核心技术人员分布、企业之间的合作关系和研发方向等,为企业的商业决策提供重要依据。目前,针对论文或专利等文献的分析,基本都是对引用关系或引用量的分析,对于作者之间关联关系的分析,基本停留在合著或合作申请的分析上,存在分析不全面、不深入,分析结果稀疏以及不准确的问题,难以为业务提供有效的数据支持。

发明内容

本发明意在提供一种关系强度分析系统,可以全面准确地分析文献作者之间的关联关系,为业务提供有效的数据支持。

本申请提供如下技术方案:

一种关系强度分析系统,包括:

文献信息获取模块,获取待分析作者的相关文献信息;

合著作者网络分析模块,根据相关文献信息构建合著作者网络,根据合著作者网络计算合著作者结构关联度;

学科领域分布关联分析模块,根据相关文献信息进行学科领域分类,根据分类结果计算作者之间的学科领域关联度;

引用关系分析模块,根据相关文献信息分析文献的引用关系,根据文献之间的引用关系计算引用关联度;

知识图谱关联分析模块,根据相关文献信息构建知识图谱,计算作者在知识图谱中的向量表示,并根据作者对应的向量表示计算作者之间的图谱关联度;

综合分析模块,根据合著作者结构关联度、学科领域关联度、引用关联度、图谱关联度计算综合关联度。

本发明技术方案中,通过合著作者网络分析模块,可以对合著作者之间的关联关系进行分析,可以得到有直接合作关系的作者;通过学科领域分布关联分析模块,对文献进行分类,计算作者在每个分类下的关联情况,通过学科领域关联度,反应作者之间研究领域的相似性,进而可以深入查找作者之间的关联性;通过应用关系分析模块计算引用关联度,通过引用关联度反应作者之间的间接联系;通过知识图谱关联分析模块,利用知识图谱的各个节点的关联关系,可以更深层次的挖掘作者之间的关系,可以解决分析不深入,分析结果较为稀疏的问题。本发明的技术方案,可以实现多层级关联关系的分析,分析的结果更加全面准确,可以为业务提供有效的数据支持。

进一步,所述合著作者网络分析模块包括:

合著作者网络构建模块,用于根据相关文献信息构建合著作者网络;

邻接矩阵构建模块,用于根据合著作者网络构建邻接矩阵:

Adj=(Adj

其中,Adj表示邻接矩阵,F表示合著作者合集;

合著作者结构关联度计算模块,用于初始化Adj的对角线元素,并根据邻接矩阵的节点的出、入度计算结构相似度作为合著作者结构关联度:

Adj

其中,I

进一步,所述学科领域分布关联分析模块包括:

学科领域分类模块,对每个作者的文献进行学科领域分类;

学科领域维度距离计算模块,根据以下公式计算作者之间学科领域维度的空间距离:

其中,s

学科领域关联度计算模块,根据以下公式计算学科领域关联度:

其中,

进一步,所述引用关系分析模块包括:

学科领域敏感度分析模块,包括学科领域排序模块和敏感度等级计算模块,学科领域排序模块用于将每个作者的各个学科领域按照学科领域对应的文献总数进行升序排序;敏感度等级计算模块用于根据以下公式计算学科领域的敏感度等级:

Level(a

其中,Level(a

引用关联度计算模块,用于计算作者a

其中,

进一步,所述知识图谱关联分析模块包括:

知识图谱构建模块,用于根据每个作者与文献、作者与学科领域、文献与文献、文献与学科领域的关系构建知识图谱;

向量表示模块,根据知识图谱得到各个作者的向量表示;

图谱关联度计算模块,通过以下公式计算作者之间的图谱关联度:

其中,

进一步,所述图谱关联度计算模块还包括归一化模块,所述归一化模块用于将图谱关联度进行归一化处理。

进一步,所述向量表示模块通过Trans H计算出作者在知识图谱中节点的向量表示。

进一步,所述综合分析模块包括:

权重获取模块,用于获取合著作者结构关联度、学科领域关联度、引用关联度以及图谱关联度的权重;

综合关联度计算模块,用于根据权重对合著作者结构关联度、学科领域关联度、引用关联度以及图谱关联度进行加权求和得到作者之间的综合关联度。

进一步,本发明还公开了一种信息推荐系统,包括上述的关系强度分析系统,还包括:

内容生成模块,用于根据作者之间的综合关联度,生成推荐内容;

推送模块,用于将推荐内容推送至目标作者。

本发明的一种信息推荐系统,通过使用上述的关系强度分析系统,能够准确全面而深入的分析出文献作者之间的关系,内容生产模块基于该分析结果来生成推荐内容,可以使得推荐的内容更加的准确,实现精准化的推送。

进一步,所述推荐内容包括推荐好友数据和推荐文献数据;所述内容生成模块包括好友推荐生成模块和文献推荐生成模块,好友推荐生成模块用于根据作者之间的综合关联度,获取与目标作者综合关联度最高的前N个作者的相关信息生成推荐好友数据,所述文献推荐生成模块用于根据与目标作者综合关联度最高的前M个作者的相关信息生成推荐文献数据。

通过推荐好友数据和推荐文献数据,可以实现学术好友、合作伙伴、技术方案、技术文献、技术人才等的精准化推送,对于学术人员来说,可以为构建学术交流圈等提供技术基础,方便学术成果交流和沟通;对企业而言,可以为商业决策提供准确的依据,准确获取技术内容和技术人才。

附图说明

图1为本申请一种关系强度分析系统实施例中的逻辑框图;

图2为本申请一种信息推荐系统实施例中的逻辑框图;

图3为本申请一种关系强度分析系统实施例中的流程示意图。

具体实施方式

下面通过具体实施方式对本申请技术方案进行进一步详细说明:

实施例一

如图1和图3所示,本实施例中的一种关系强度分析系统,包括:

文献信息获取模块,获取待分析作者的相关文献信息,相关文献信息包括文献名称、作者、发表时间、引用信息、被引用信息、关键词、文献内容等;

合著作者网络分析模块,根据相关文献信息构建合著作者网络,根据合著作者网络计算合著作者结构关联度;

学科领域分布关联分析模块,根据相关文献信息进行学科领域分类,根据分类结果计算作者之间的学科领域关联度;

引用关系分析模块,根据相关文献信息分析文献的引用关系,根据文献之间的引用关系计算引用关联度;

知识图谱关联分析模块,根据相关文献信息构建知识图谱,计算作者在知识图谱中的向量表示,并根据作者对应的向量表示计算作者之间的图谱关联度;

综合分析模块,根据合著作者结构关联度、学科领域关联度、引用关联度、图谱关联度计算综合关联度。

具体的,本实施例中合著作者网络分析模块包括:

合著作者网络构建模块,用于根据相关文献信息构建合著作者网络;

邻接矩阵构建模块,用于根据合著作者网络构建邻接矩阵:

Adj=(Adj

其中,Adj表示邻接矩阵,F表示合著作者合集;

合著作者结构关联度计算模块,用于初始化Adj的对角线元素,并根据邻接矩阵的节点的出、入度计算结构相似度作为合著作者结构关联度:

Adj

其中,I

学科领域分布关联分析模块包括:

学科领域分类模块,对每个作者的文献进行学科领域分类;对于任一作者a

学科领域维度距离计算模块,根据以下公式计算作者之间学科领域维度的空间距离:

其中,s

学科领域关联度计算模块,根据以下公式计算学科领域关联度:

其中,

引用关系分析模块包括:

学科领域敏感度分析模块,包括学科领域排序模块和敏感度等级计算模块,学科领域排序模块用于将每个作者的各个学科领域按照学科领域对应的文献总数进行升序排序;敏感度等级计算模块用于根据以下公式计算学科领域的敏感度等级:

Level(a

其中,Level(a

引用关联度计算模块,用于计算作者a

其中,

知识图谱关联分析模块包括:

知识图谱构建模块,用于根据每个作者与文献、作者与学科领域、文献与文献、文献与学科领域的关系构建知识图谱;

向量表示模块,根据知识图谱得到各个作者的向量表示;向量表示模块通过TransH计算出作者在知识图谱中节点的向量表示。在本申请的其他实施例中,还可以通过TranE,Trans D等进行向量表示,也可以通过图游走思想,如Deepwalk,Node2vec等方法进行向量表示。

图谱关联度计算模块,通过以下公式计算作者之间的图谱关联度:

其中,

图谱关联度计算模块还包括归一化模块,归一化模块用于将图谱关联度进行归一化处理,本实施例中,采用sigmoid函数将得到的结果进行归一化表示,使得得到的结果在[0,1]内。

综合分析模块包括:

权重获取模块,获取合著作者结构关联度、学科领域关联度、引用关联度以及图谱关联度的权重分别为α,β,γ和η,α,β,γ,η∈[0,1]且α+β+γ+η=1;

综合关联度计算模块,用于根据权重对合著作者结构关联度、学科领域关联度、引用关联度以及图谱关联度进行加权求和得到作者之间的综合关联度I=αI

本实施例的技术方案中,通过合著作者网络分析模块,可以对合著作者之间的关联关系进行分析,可以得到有直接合作关系的作者;通过学科领域分布关联分析模块,对文献进行分类,计算作者在每个分类下的关联情况,通过学科领域关联度,反应作者之间研究领域的相似性,进而可以深入查找作者之间的关联性;通过应用关系分析模块计算引用关联度,通过引用关联度反应作者之间的间接联系;通过知识图谱关联分析模块,利用知识图谱的各个节点的关联关系,可以更深层次的挖掘作者之间的关系,可以解决分析不深入,分析结果较为稀疏的问题。可以实现多层级关联关系的分析,分析的结果更加全面准确,可以为业务提供有效的数据支持。

如图2所示,本实施例的一种信息推荐系统,包括上述的关系强度分析系统,还包括:

内容生成模块,用于根据作者之间的综合关联度,生成推荐内容;

推送模块,用于将推荐内容推送至目标作者。

推荐内容包括推荐好友数据和推荐文献数据;内容生成模块包括好友推荐生成模块和文献推荐生成模块,好友推荐生成模块用于根据作者之间的综合关联度,获取与目标作者综合关联度最高的前N个作者的相关信息生成推荐好友数据,可以将综合关联度最高的前N个作者的社交信息来生成推荐好友数据,如将这些作者及其所关注或互动的好友共同作为推荐好友数据。文献推荐生成模块用于根据与目标作者综合关联度最高的前M个作者的相关信息生成推荐文献数据,如根据这M个作者近期发表的文献、近期阅读下载的文献、近期关注评论的文献等来生成最终的文献推荐数据。N和M可以根据具体需求设置,本实施例中,均设置为10个。

本实施例的一种信息推荐系统,通过使用上述的关系强度分析系统,能够准确全面而深入的分析出文献作者之间的关系,内容生产模块基于该分析结果来生成推荐内容,可以使得推荐的内容更加的准确,实现精准化的推送。通过推荐好友数据和推荐文献数据,可以实现学术好友、合作伙伴、技术方案、技术文献、技术人才等的精准化推送,对于学术人员来说,可以为构建学术交流圈等提供技术基础,方便学术成果交流和沟通;对企业而言,可以为商业决策提供准确的依据,准确获取技术内容和技术人才。

以上的仅是本发明的实施例,该发明不限于此实施案例涉及的领域,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

相关技术
  • 一种关系强度分析系统及信息推荐系统
  • 一种基因靶向治疗方案推荐系统及相关系统
技术分类

06120112923120