掌桥专利:专业的专利平台
掌桥专利
首页

一种专家信息的筛选方法及系统

文献发布时间:2023-06-19 10:00:31


一种专家信息的筛选方法及系统

技术领域

本发明涉及数据处理技术领域,具体涉及一种专家信息的筛选方法及系统。

背景技术

电网科技业务在选择科技项目和科技成果的评审专家时,通常由科技工作者以人工筛选的方式选择相应的评审专家。但是一方面专家库信息量庞大,另一方面人工遴选的方式主观性较强,受到前述两方面原因的影响,会导致遴选出来的专家并不能满足实际的评审需求,即人工筛选专家的方式的准确度较差和客观性较差。

发明内容

有鉴于此,本发明实施例提供一种专家信息的筛选方法及系统,以解决目前人工筛选评审专家的方式存在的准确度较差和客观性较差等问题。

为实现上述目的,本发明实施例提供如下技术方案:

本发明实施例第一方面公开一种专家信息的筛选方法,所述方法包括:

获取专家信息筛选条件;

分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;

根据所述科技项目关键词集、所述科技成果关键词集和所述专家关键词集,构建相应的物元知识表示模型;

利用所述物元知识表示模型,构建包含专家信息的索引库;

根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,每个所述专家信息索引文件对应一个专家;

确定每个所述专家信息索引文件与所述专家信息筛选条件的匹配度;

按照所述匹配度由高至低的顺序,对所述专家信息索引文件进行排序并展示。

优选的,所述分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集,包括:

利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。

优选的,所述利用所述物元知识表示模型,构建包含专家信息的索引库,包括:

利用ApacheLucene对所述物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,所述索引库所包含的信息为支持快速检索的格式。

优选的,所述根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,包括:

根据所述专家信息筛选条件在所述索引库进行索引,在指定的目录文件夹中生成与所述专家信息筛选条件对应的专家信息索引文件,其中,每个所述专家信息索引文件以文件夹的形式保存在所述指定的目录文件夹中,每个所述专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。

优选的,所述生成与所述专家信息筛选条件对应的专家信息索引文件之后,还包括:

在指定的检索系统界面中展示每个所述专家信息索引文件。

优选的,所述在指定的检索系统界面中展示每个所述专家信息索引文件之后,还包括:

接收查看所述专家信息索引文件对应的专家信息的指令,在所述检索系统界面中展示被查看的所述专家信息索引文件对应的专家信息,被查看的所述专家信息索引文件对应的专家信息至少包括:论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果。

本发明实施例第二方面公开一种专家信息的筛选系统,所述系统包括:

获取单元,用于获取专家信息筛选条件;

提取单元,用于分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;

第一构建单元,用于根据所述科技项目关键词集、所述科技成果关键词集和所述专家关键词集,构建相应的物元知识表示模型;

第二构建单元,用于利用所述物元知识表示模型,构建包含专家信息的索引库;

索引单元,用于根据所述专家信息筛选条件在所述索引库进行索引,生成与所述专家信息筛选条件对应的专家信息索引文件,每个所述专家信息索引文件对应一个专家;

确定单元,用于确定每个所述专家信息索引文件与所述专家信息筛选条件的匹配度;

处理单元,用于按照所述匹配度由高至低的顺序,对所述专家信息索引文件进行排序并展示。

优选的,所述提取单元具体用于:利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。

优选的,所述第二构建单元具体用于:利用ApacheLucene对所述物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,所述索引库所包含的信息为支持快速检索的格式。

优选的,所述索引单元具体用于:根据所述专家信息筛选条件在所述索引库进行索引,在指定的目录文件夹中生成与所述专家信息筛选条件对应的专家信息索引文件,其中,每个所述专家信息索引文件以文件夹的形式保存在所述指定的目录文件夹中,每个所述专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。

基于上述本发明实施例提供的一种专家信息的筛选方法及系统,该方法为:获取专家信息筛选条件;分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集;根据科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型;利用物元知识表示模型,构建包含专家信息的索引库;根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件;确定每个专家信息索引文件与专家信息筛选条件的匹配度;按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工筛选的方式选择评审专家,提高评审专家的筛选准确度和提高筛选客观性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种专家信息的筛选方法的流程图;

图2为本发明实施例提供的获取专家信息筛选条件的示意图;

图3为本发明实施例提供的展示专家信息索引文件的示意图;

图4为本发明实施例提供的展示专家信息索引文件排序结果的示意图;

图5为本发明实施例提供的一种专家信息的筛选系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

由背景技术可知,目前电网科技业务在选择评审专家时,通常是由科技人员以人工筛选的方式选择相应的评审专家。但是人工筛选评审专家的主观性较强,且专家信息库的信息量庞大,人工无法准确的从专家信息库中筛选出符合实际需求的评审需求,即人工筛选专家的方式的准确度较差和客观性较差。

因此,本发明实施例提供一种专家信息的筛选方法及系统,获取专家信息筛选条件。根据关键词提取得到的科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型,并利用物元知识表示模型构建包含专家信息的索引库。根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。确定每个专家信息索引文件与专家信息筛选条件的匹配度,并按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工遴选的方式选择评审专家,以提高评审专家的筛选准确度和提高筛选客观性。

参见图1,示出了本发明实施例提供的一种专家信息的筛选方法的流程图,该筛选方法包括:

步骤S101:获取专家信息筛选条件。

在具体实现步骤S101的过程中,获取用户设置的专家信息筛选条件,该专家信息筛选条件为多条。

可以理解的是,可在设置以检索输入框,提示用户在检索输入框中输入相应的信息,响应用户所输入的信息生成对应的专家信息筛选条件。

比如:参见图2示出的获取专家信息筛选条件的示意图,设置一“专家遴选”按钮,响应于用户点击该“专家遴选”按钮,提示用户设定“回避专家姓名”、“回避单位”、“专家年龄(段)”、“系统内外”、“研究领域”和“专家领域”等信息,当用户点击“确定”按钮后,获取相应的专家信息筛选条件(“回避专家姓名”、“回避单位”、“专家年龄(段)”、“系统内外”、“研究领域”和“专家领域”等对应的专家信息筛选条件)。

步骤S102:分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集。

在具体实现步骤S102的过程中,利用IKAnalyzer进行关键词提取,并结合电力专业词库进行分词,分别对科技项目信息(科技项目的建议书、项目可研报告信息和项目过程材料信息等)、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。

也就是说,对科技项目信息进行关键词提取和分词得到科技项目关键词集,对科技成果信息进行关键词提取和分词得到科技成果关键词集,对专家信息进行关键词提取和分词得到专家关键词集。

需要说明的是,IKAnalyzer是基于java语言开发的中文分词工具包,关键词是指停用词过滤后和信息提取后保留下的有用信息词。

步骤S103:根据科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型。

在具体实现步骤S103的过程中,在提取得到科技项目关键词集、科技成果关键词集和专家关键词集之后,根据该科技项目关键词集、科技成果关键词集和专家关键词集所包含的关键词,结合组织知识表示方法和可拓学模型,构建相应的物元知识表示模型。

需要说明的是,知识载体可以将事物的多种特征项属性种类囊括在其中,只需要考虑相关的特征项属性,与研究属性不相关的特征项属性不加入知识载体,故在本发明实施例中使用可拓学物元模型和向量空间模型相结合的方式改善领域信息的知识表示。

步骤S104:利用物元知识表示模型,构建包含专家信息的索引库。

在具体实现步骤S104的过程中,利用ApacheLucene对上述构建得到的物元知识表示模型进行索引库构建,得到包含专家信息的索引库,该索引库作为进行专家信息检索(或推荐)的样本库,其中,索引库所包含的信息(文本信息)为支持快速检索的格式。

需要说明的是,ApacheLucene是一全文检索引擎工具包,索引库所包含的信息即为前述提及的物元知识表示模型中文档内容的文本信息。

步骤S105:根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。

需要说明的是,每个专家信息索引文件对应一个专家。

在具体实现步骤S105的过程中,根据专家信息筛选条件在索引库进行索引,在指定的目录文件夹中生成与专家信息筛选条件对应的专家信息索引文件(一个及以上),其中,每个专家信息索引文件以文件夹的形式保存在该指定的目录文件夹中,每个专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计(对分词后的字或词的出现情况进行权重统计)且被停用词过滤后的分词结果。

需要说明的是,停用词过滤是指:为提高检索效率和节约存储空间,在处理数据之前需过滤掉的字或词。

优选的,在执行步骤S105得到多个专家信息索引文件之后,可将每个专家信息索引文件以专家信息条目(与专家信息索引文件对应)的方式在指定的检索系统界面中展示,并且,可在该指定的检索系统界面中展示每个专家信息条目对应的专家信息索引文件是否被创建。

优选的,在指定的检索系统界面中展示每个专家信息索引文件之后,用户可在该指定的检索系统界面中点击需要查看的专家信息索引文件对应的专家信息条目,此时接收到查看专家信息索引文件对应的专家信息的指令,在检索系统界面中展示被查看的专家信息索引文件对应的专家信息,被查看的专家信息索引文件对应的专家信息至少包括:论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果。

可以理解的是,专家信息索引文件还包括对应的专家姓名、工作单位、年龄和学历等基础信息。

需要说明的是,对于专家信息中的字段,若字段未被输入信息,则相应的信息为空且不在检索系统界面中展示该字段。

为更好解释说明上述关于查看专家信息索引文件对应的专家信息的内容,通过图3示出的展示专家信息索引文件的示意图进行举例说明。

在图3中示出的检索系统界面示意图中,专家1至专家10按序号排列,勾选需要查看专家信息索引文件对应的专家选项(序号左边的矩形),并点击“查看专家特征索引结果”按钮,从上述构建的索引库中读取所勾选的专家对应的专家信息索引文件,展示所勾选的专家对应的专家信息索引文件中的论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果等信息。

步骤S106:确定每个专家信息索引文件与专家信息筛选条件的匹配度。

在具体实现步骤S106的过程中,计算每个专家信息索引文件与专家信息筛选条件的匹配度,得到各个专家信息索引文件对应的匹配度。

步骤S107:按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。

在具体实现步骤S107的过程中,按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示排序后的专家信息索引文件对应的专家信息,展示专家信息索引文件的同时也展示相应的匹配度。

为更好解释说明上述对专家信息索引文件进行排序并展示,通过图4示出的展示专家信息索引文件排序结果的示意图进行举例说明,需要说明的是,图4是以匹配度降序的方式展示专家信息索引文件排序结果。

在图4示出的专家信息索引文件排序结果中,专家1至专家10按照各自对应的专家信息索引文件与专家信息筛选条件的匹配度进行降序排序,其中专家1对应的专家信息索引文件与专家信息筛选条件的匹配度最高,其次为专家2,以此类推,匹配度最低的为专家10。

在图4中,“操作”一栏中的内容包括:向对应的专家发送短信和发送邮件两个选项。

在本发明实施例中,获取专家信息筛选条件。根据关键词提取得到的科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型,并利用物元知识表示模型构建包含专家信息的索引库。根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。确定每个专家信息索引文件与专家信息筛选条件的匹配度,并按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工筛选的方式选择评审专家,提高评审专家的筛选准确度和提高筛选客观性。

与上述本发明实施例提供的一种专家信息的筛选方法相对应,参见图5,本发明实施例还提供了一种专家信息的筛选系统的结构框图,该筛选系统包括:获取单元501、提取单元502、第一构建单元503、第二构建单元504、索引单元505、确定单元506和处理单元507;

获取单元501,用于获取专家信息筛选条件。

提取单元502,用于分别对科技项目信息、科技成果信息和专家信息进行关键词提取,得到科技项目关键词集、科技成果关键词集和专家关键词集。

在具体实现中,提取单元502具体用于:利用IKAnalyzer进行关键词提取,结合电力专业词库进行分词,分别对科技项目信息、科技成果信息和专家信息进行关键词提取和分词,得到科技项目关键词集、科技成果关键词集和专家关键词集。

第一构建单元503,用于根据科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型。

第二构建单元504,用于利用物元知识表示模型,构建包含专家信息的索引库。

在具体实现中,第二构建单元505具体用于:利用ApacheLucene对物元知识表示模型进行索引库构建,得到包含专家信息的索引库,其中,索引库所包含的信息为支持快速检索的格式。

索引单元505,用于根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件,每个专家信息索引文件对应一个专家。

在具体实现中,索引单元505具体用于:根据专家信息筛选条件在索引库进行索引,在指定的目录文件夹中生成与专家信息筛选条件对应的专家信息索引文件,其中,每个专家信息索引文件以文件夹的形式保存在指定的目录文件夹中,每个专家信息索引文件包括:专家信息被停用词过滤后的分词结果、专家信息未被停用词过滤后的分词结果、及专家信息经过分词权重统计且被停用词过滤后的分词结果。

确定单元506,用于确定每个专家信息索引文件与专家信息筛选条件的匹配度。

处理单元507,用于按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。

优选的,结合图5示出的内容,该筛选系统还包括:

第一展示单元,用于在指定的检索系统界面中展示每个专家信息索引文件。

优选的,结合图5示出的内容,该筛选系统还包括:

第二展示单元,用于接收查看专家信息索引文件对应的专家信息的指令,在检索系统界面中展示被查看的专家信息索引文件对应的专家信息,被查看的专家信息索引文件对应的专家信息至少包括:论文发表情况信息、研究方向信息、获奖信息、发明专利获取信息、课题项目信息、专家信息分词结果和专家信息分词权重结果。

综上所述,本发明实施例提供一种专家信息的筛选方法及系统,获取专家信息筛选条件。根据关键词提取得到的科技项目关键词集、科技成果关键词集和专家关键词集,构建相应的物元知识表示模型,并利用物元知识表示模型构建包含专家信息的索引库。根据专家信息筛选条件在索引库进行索引,生成与专家信息筛选条件对应的专家信息索引文件。确定每个专家信息索引文件与专家信息筛选条件的匹配度,并按照匹配度由高至低的顺序,对专家信息索引文件进行排序并展示。避免以人工遴选的方式选择评审专家,以提高评审专家的筛选准确度和提高筛选客观性。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种专家信息的筛选方法及系统
  • 一种基于信息融合专家系统的电动助力转向系统控制方法
技术分类

06120112388570