掌桥专利:专业的专利平台
掌桥专利
首页

项目评价模型训练方法及项目评价方法

文献发布时间:2024-04-18 19:58:26


项目评价模型训练方法及项目评价方法

技术领域

本发明涉及项目评价技术领域,尤其涉及一种项目评价模型训练方法及项目评价方法。

背景技术

目前,在项目评审时,针对某个申报项目,往往会由评审委员会凭借经验从专家组中指定相关领域权威专家,对项目进行评审。然后,评审委员会综合各位专家的评审意见后给出该项目的最终评审结果。

由于参与评审的项目众多,为了节省专家人力以及避免专家由于认知局限得到片面的分析判断,越来越多的尝试使用评价模型来实现机器对项目进行评价,辅助专家做出最终合理评审结果。

现有针对项目的评价模型,通常是通过提取项目中容易量化的特征,比如项目完成情况、提交专利/论文数、经济收益等特征,然后采用熵权法确定各特征的权重,即根据各特征值的变异程度来确定特征权重系数,从而构建评价模型。

然而,这种评价模型只考虑了项目的部分属性类特征,这将导致得到的评价结果可能会存在偏差,而且采用熵权法无法考虑各特征之间的相互影响和作用,也会对评价结果产生影响。

发明内容

本发明提供一种项目评价模型训练方法及项目评价方法,用以解决现有技术中存在的缺陷。

本发明提供一种项目评价模型训练方法,包括:

获取各样本项目的项目信息及其评价结果;

从每个样本项目的项目信息中提取每个样本项目的项目特征,每个样本项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型;

其中,每个样本项目的全局特征均包括历史全局特征和同期全局特征,对于任一样本项目,所述任一样本项目的历史全局特征基于所述任一样本项目与在所述任一样本项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述任一样本项目的同期全局特征基于所述任一样本项目与在所述任一样本项目所处时期内的同期样本项目之间的语义特征相似度确定。

根据本发明提供的一种项目评价模型训练方法,每个样本项目的全局特征基于如下步骤确定:

对于任一样本项目,确定所述任一样本项目所处时期的之前时期内的各历史样本项目,以及所述任一样本项目所处时期内的各同期样本项目;

从每个历史样本项目的项目信息中提取每个历史样本项目的语义特征,计算各历史样本项目的第一语义特征平均值,并从每个同期样本项目的项目信息中提取每个同期样本项目的语义特征,计算各同期样本项目的第二语义特征平均值;

计算所述第一语义特征平均值与所述任一样本项目的语义特征之间的语义特征相似度,得到所述任一样本项目的历史全局特征;

计算所述第二语义特征平均值与所述任一样本项目的语义特征之间的语义特征相似度,得到所述任一样本项目的同期全局特征。

根据本发明提供的一种项目评价模型训练方法,每个样本项目的项目信息包括项目文档信息;

每个样本项目的语义特征基于如下步骤确定:

将每个样本项目的项目文档信息输入至预训练语言模型,得到所述预训练语言模型输出的每个样本项目的语义特征。

根据本发明提供的一种项目评价模型训练方法,基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型,包括:

将每个样本项目的项目特征输入至所述初始评价模型,得到所述初始评价模型的输出结果;

基于所述输出结果与每个样本项目的评价结果,计算损失值,并基于所述损失值,迭代更新所述初始评价模型的结构参数,直至所述损失值收敛或达到预设迭代次数,得到所述项目评价模型。

根据本发明提供的一种项目评价模型训练方法,每个样本项目的项目信息包括项目属性信息;每个样本项目的属性特征基于如下步骤确定:

基于特征工程,对每个样本项目的项目属性信息进行处理,得到每个样本项目的属性特征。

本发明还提供一种项目评价方法,包括:

获取待评价项目的项目信息;

从所述待评价项目的项目信息中提取所述待评价项目的项目特征,所述待评价项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

将所述待评价项目的项目特征输入至项目评价模型,得到所述项目评价模型的评价结果;

其中,所述项目评价模型基于上述的项目评价模型训练方法训练得到,所述待评价项目的全局特征包括历史全局特征和同期全局特征,所述待评价项目的历史全局特征基于所述待评价项目与在所述待评价项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述待评价项目的同期全局特征基于所述待评价项目与在所述待评价项目所处时期内的同期样本项目之间的语义特征相似度确定。

本发明还提供一种项目评价模型训练装置,包括:

第一获取模块,用于获取各样本项目的项目信息及其评价结果;

第一特征提取模块,用于从每个样本项目的项目信息中提取每个样本项目的项目特征,每个样本项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

训练模块,用于基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型;

其中,每个样本项目的全局特征均包括历史全局特征和同期全局特征,对于任一样本项目,所述任一样本项目的历史全局特征基于所述任一样本项目与在所述任一样本项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述任一样本项目的同期全局特征基于所述任一样本项目与在所述任一样本项目所处时期内的同期样本项目之间的语义特征相似度确定。

本发明还提供一种项目评价系统,包括:

第二获取模块,用于获取待评价项目的项目信息;

第二特征提取模块,用于从所述待评价项目的项目信息中提取所述待评价项目的项目特征,所述待评价项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

评价模块,用于将所述待评价项目的项目特征输入至项目评价模型,得到所述项目评价模型的评价结果;

其中,所述项目评价模型基于上述的项目评价模型训练方法训练得到,所述待评价项目的全局特征包括历史全局特征和同期全局特征,所述待评价项目的历史全局特征基于所述待评价项目与在所述待评价项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述待评价项目的同期全局特征基于所述待评价项目与在所述待评价项目所处时期内的同期样本项目之间的语义特征相似度确定。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种项目评价模型训练方法或项目评价方法。

本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种项目评价模型训练方法或项目评价方法。

本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种项目评价模型训练方法或项目评价方法。

本发明提供的项目评价模型训练方法及项目评价方法,该训练方法首先获取各样本项目的项目信息及其评价结果;然后从每个样本项目的项目信息中提取每个样本项目的项目特征,每个样本项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;最后基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型。该训练方法通过提取各样本项目的语义特征,可以提升项目评价模型对项目内容的学习能力,通过提取各样本项目的全局特征,可以提升项目评价模型对项目创新性和差异化的学习能力,避免由于认知局限得到片面的分析判断,可以辅助专家做出最终合理评审结果,极大程度减少了评审人力的投入成本。而且,通过融合各样本项目的语义特征以及全局特征等多维度特征,可以更加全面地对各样本项目进行表征,进一步提升项目评价模型的性能。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的项目评价模型训练方法的流程示意图之一;

图2是本发明提供的项目评价模型训练方法的流程示意图之二;

图3是本发明提供的项目评价方法的流程示意图;

图4是本发明提供的项目评价模型训练装置的结构示意图;

图5是本发明提供的项目评价系统的结构示意图;

图6是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书中的术语“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。

由于项目的评审,通常会从多方面考量,如项目的体量、经济效应、创新性等多个维度去进行衡量,项目在申报时会提交许多材料,如申请表(包括项目申报信息,如申报类型、申报单位、申报领域、参与人数、应用情况、收益情况、创新情况等)、申报书(包括项目产品方案、技术方案等文档)等,这些信息里富含了大量的有用信息,尽最大可能地从材料中提取有效特征去表征项目,对于提升模型预测准确率是至关重要的。

而现有的评价模型只考虑了项目的部分属性类特征,并未从项目的实际内容去考量项目的价值,也并未与历史项目或者同期项目进行全局对比,从而导致得到的评价结果可能会存在偏差,而且采用熵权法无法考虑各特征之间的相互影响和作用,也会对评价结果产生影响。

基于此,本发明实施例中提供了一种项目评价模型训练方法,使训练得到的项目评价模型可以解决上述技术问题。

图1为本发明实施例中提供的一种项目评价模型训练方法的流程示意图,如图1所示,该训练方法包括:

S11,获取各样本项目的项目信息及其评价结果;

S12,从每个样本项目的项目信息中提取每个样本项目的项目特征,每个样本项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

S13,基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型;

其中,每个样本项目的全局特征均包括历史全局特征和同期全局特征,对于任一样本项目,所述任一样本项目的历史全局特征基于所述任一样本项目与在所述任一样本项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述任一样本项目的同期全局特征基于所述任一样本项目与在所述任一样本项目所处时期内的同期样本项目之间的语义特征相似度确定。

具体地,本发明实施例中提供的项目评价模型训练方法,其执行主体为项目评价模型训练装置,该装置可以配置于计算机内,该计算机可以为本地计算机或云计算机,本地计算机可以是电脑、平板等,此处不作具体限定。

首先执行步骤S11,获取各样本项目的项目信息及其评价结果。各样本项目是指已经提交并且给出了评价结果的项目,各样本项目可以是科技项目,也可以是其他的非科技项目。

各样本项目的项目信息可以包括项目申报信息和项目文档信息,项目申报信息即项目属性信息,可以包括申报类型、申报机构、申报奖项、参与人数、应用情况、收益情况、相关专利项等信息。

项目文档信息即项目文本信息,可以包括项目名称、项目概述、项目关键词等信息。

可以理解的是,各样本项目均处于同一评价体系内,评价标准均相同。各样本项目的评价结果可以是奖项类评价结果,也可以是分档类评价结果,奖项类评价结果可以是特等奖、一等奖、二等奖、三等奖、未获奖等,分档类评价结果可以是不同类别的奖项。

为便于后续处理,各样本项目的评价结果可以映射为数值,并保存映射文件。例如对于奖项类评价结果中的特等奖、一等奖、二等奖、三等奖、未获奖,可以分别映射为0,1,2,3,4。

然后执行步骤S12,从每个样本项目的项目信息中提取每个样本项目的项目特征,该项目特征既可以只包括语义特征和全局特征,也可以包括属性特征、语义特征以及全局特征。进而,该项目特征可以通过将语义特征和全局特征进行拼接得到,也可以通过将属性特征、语义特征以及全局特征进行拼接得到。此处,可以通过对每个样本项目的项目信息中项目属性信息进行特征编码,得到属性特征。属性特征可以在一定程度上反映对应样本项目的规模、质量和创新性。

可以通过对每个样本项目的项目信息中项目文档信息进行语义特征提取,得到语义特征。语义特征可以在一定程度上反映对应样本项目的领域方向和内容信息。

每个样本项目的全局特征可以在一定程度上反映对应样本项目在所有样本项目中的差异化和创新性。

对于任一样本项目,其全局特征均可以包括历史全局特征和同期全局特征。任一样本项目的历史全局特征可以通过任一样本项目与在任一样本项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定。任一样本项目的同期全局特征可以通过任一样本项目与在任一样本项目所处时期内的同期样本项目之间的语义特征相似度确定。

任一样本项目所处时期的长度可以根据需要进行设置,例如可以是一年,可以是自然年,也可以是从任一样本项目的开始时刻算一年的时长作为所处时期。

任一样本项目可以具有一个或多个历史样本项目以及一个或多个同期样本项目。处于同一时期的各样本项目对应的历史样本项目均相同。处于不同时期的各样本项目对应的历史样本项目部分相同。处于同一时期的各样本项目均互为同期样本项目,处于不同时期的各样本项目的同期样本项目均不相同。

任一样本项目与其历史样本项目之间的语义特征相似度可以通过计算任一样本项目与每个历史样本项目之间的语义特征相似度后取均值得到。任一样本项目与其同期样本项目之间的语义特征相似度可以通过计算任一样本项目与每个同期样本项目之间的语义特征相似度后取均值得到。

最后执行步骤S13,利用每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型。该初始评价模型可以神经网络模型,例如可以是梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型,也可以是自适应增强(AdaptiveBoosting,AdaBoost)模型,还可以是深度学习模型,此处不作具体限定。

在对初始评价模型进行训练时,可以将每个样本项目的项目特征作为初始评价模型的输入,将每个样本项目的评价结果作为标签,对初始评价模型进行训练,最终得到项目评价模型。特别地,通过GBDT模型作为初始评价模型,可以快速发现有区分性的特征,并加以特征组合,经过残差学习从而获得项目评价模型。

本发明实施例中提供的项目评价模型训练方法,首先获取各样本项目的项目信息及其评价结果;然后从每个样本项目的项目信息中提取每个样本项目的项目特征,每个样本项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;最后基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型。该训练方法通过提取各样本项目的语义特征,可以提升项目评价模型对项目内容的学习能力,通过提取各样本项目的全局特征,可以提升项目评价模型对项目创新性和差异化的学习能力,避免由于认知局限得到片面的分析判断,可以辅助专家做出最终合理评审结果,极大程度减少了评审人力的投入成本。而且,通过融合各样本项目的语义特征以及全局特征等多维度特征,可以更加全面地对各样本项目进行表征,进一步提升项目评价模型的性能。

在上述实施例的基础上,每个样本项目的全局特征基于如下步骤确定:

对于任一样本项目,确定所述任一样本项目所处时期的之前时期内的各历史样本项目,以及所述任一样本项目所处时期内的各同期样本项目;

从每个历史样本项目的项目信息中提取每个历史样本项目的语义特征,计算各历史样本项目的第一语义特征平均值,并从每个同期样本项目的项目信息中提取每个同期样本项目的语义特征,计算各同期样本项目的第二语义特征平均值;

计算所述第一语义特征平均值与所述任一样本项目的语义特征之间的语义特征相似度,得到所述任一样本项目的历史全局特征;

计算所述第二语义特征平均值与所述任一样本项目的语义特征之间的语义特征相似度,得到所述任一样本项目的同期全局特征。

具体地,每个样本项目的全局特征的确定步骤均相同。对于任一样本项目x,可以先确定样本项目x所处时期的之前时期内的各历史样本项目,以及样本项目x所处时期内的各同期样本项目。各历史样本项目可以构成历史集合

然后,可以从每个历史样本项目h的项目信息中提取每个历史样本项目h的语义特征e(h),计算各历史样本项目的第一语义特征平均值e1,并从每个同期样本项目s的项目信息中提取每个同期样本项目s的语义特征e(s),计算各同期样本项目的第二语义特征平均值e2。

第一语义特征平均值e1的计算公式可以为:

第二语义特征平均值e2的计算公式可以为:

其中,n为各历史样本项目的数量,m为各同期样本项目的数量。

此后,计算第一语义特征平均值e1与样本项目x的语义特征e(x)之间的语义特征相似度score1,得到样本项目x的历史全局特征。计算第二语义特征平均值e2与样本项目x的语义特征e(x)之间的语义特征相似度score2,得到样本项目x的同期全局特征。

本发明实施例中,语义特征相似度可以通过语义特征之间的余弦距离确定,由此e1与e(x)之间的语义特征相似度score1可以通过如下公式计算:

e2与e(x)之间的语义特征相似度score2可以通过如下公式计算:

对于第一向量

其中,k为第一向量a和第二向量b的维度。

本发明实施例中,通过计算各历史样本项目的第一语义特征平均值以及各同期样本项目的第二语义特征平均值,最终确定各样本项目的历史全局特征和同期全局特征,可以降低异常历史样本项目以及异常同期样本项目对相应的样本项目的影响,可以使得到的历史全局特征和同期全局特征更加准确。

在上述实施例的基础上,每个样本项目的项目信息包括项目文档信息;每个样本项目的语义特征基于如下步骤确定:

将每个样本项目的项目文档信息输入至预训练语言模型,得到所述预训练语言模型输出的每个样本项目的语义特征。

具体地,在确定每个样本项目的语义特征时,可以引入预训练语言模型,该预训练语言模型可以是大型语言模型(Large Language Models,LLMs),也可以是BERT模型,还可以是其他语言模型,此处不作具体限定。

将每个样本项目的项目文档信息输入至预训练语言模型,即可得到预训练语言模型输出的每个样本项目的语义特征。

以预训练语言模型是BERT模型为例,可以使用每个样本项目的项目名称、项目概述、项目关键词等项目文档信息经过BERT模型进行编码后,[CLS]位置输出的特征即为对应样本项目的语义特征。

本发明实施例中,利用预训练语言模型,可以使得到的各样本项目的语义特征更加准确。而且,可以提高语义特征的提取效率。

在上述实施例的基础上,基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型,包括:

将每个样本项目的项目特征输入至所述初始评价模型,得到所述初始评价模型的输出结果;

基于所述输出结果与每个样本项目的评价结果,计算损失值,并基于所述损失值,迭代更新所述初始评价模型的结构参数,直至所述损失值收敛或达到预设迭代次数,得到所述项目评价模型。

具体地,在对初始评价模型进行训练时,可以将每个样本项目的项目特征输入至初始评价模型,由初始评价模型得到输出结果。

此后,利用每个样本项目对应的输出结果与每个样本项目的评价结果,计算损失值。该损失值可以通过交叉熵损失函数计算得到,也可以通过其他损失函数计算得到,此处不作具体限定。

最后,利用计算得到的损失值,迭代更新初始评价模型的结构参数,直至损失值收敛或达到预设迭代次数,即得到项目评价模型。可以理解的是,预设迭代次数可以根据需要进行设定,只要能够保证项目评价模型的性能即可。

如图2所示,以初始评价模型是GBDT模型为例,每个样本项目的项目特征及其评价结果构成一个训练样本,各训练样本构成训练集,用以对GBDT模型进行训练,最终得到项目评价模型。

在上述实施例的基础上,每个样本项目的项目信息包括项目属性信息;每个样本项目的属性特征基于如下步骤确定:

基于特征工程,对每个样本项目的项目属性信息进行处理,得到每个样本项目的属性特征。

具体地,每个样本项目的属性特征可以借助于特征工程对每个样本项目的项目属性信息进行处理得到。特征工程可以包括特征清洗、特征编码等步骤。可以理解的是,特征编码时可以采用onehot编码实现。

如图3所示,在上述实施例的基础上,本发明实施例中还提供了一种项目评价方法,该方法包括:

S21,获取待评价项目的项目信息;

S22,从所述待评价项目的项目信息中提取所述待评价项目的项目特征,所述待评价项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

S23,将所述待评价项目的项目特征输入至项目评价模型,得到所述项目评价模型的评价结果;

其中,所述项目评价模型基于上述各实施例中提供的项目评价模型训练方法训练得到,所述待评价项目的全局特征包括历史全局特征和同期全局特征,所述待评价项目的历史全局特征基于所述待评价项目与在所述待评价项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述待评价项目的同期全局特征基于所述待评价项目与在所述待评价项目所处时期内的同期样本项目之间的语义特征相似度确定。

具体地,本发明实施例中提供的项目评价方法,其执行主体为项目评价系统,该系统可以配置于计算机内,该计算机可以为本地计算机或云计算机,本地计算机可以是电脑、平板等,此处不作具体限定。

首先执行步骤S21,获取待评价项目的项目信息。该待评价项目是指需要确定其评价结果的项目,需要与各样本项目处于同一评价体系,具有相同的评价标准。

该待评价项目的项目信息可以包括项目申报信息和项目文档信息,项目申报信息即项目属性信息,可以包括申报类型、申报机构、申报奖项、参与人数、应用情况、收益情况、相关专利项等信息。

项目文档信息即项目文本信息,可以包括项目名称、项目概述、项目关键词等信息。

然后执行步骤S22,从待评价项目的项目信息中提取待评价项目的项目特征,待评价项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征。待评价项目的项目特征的提取方法与上述项目评价模型训练方法实施例中对样本项目的项目特征的提取方法相同,此处不再赘述。

最后执行步骤S23,将待评价项目的项目特征输入至通过上述各实施例中提供的项目评价模型训练方法训练得到的项目评价模型,得到项目评价模型的评价结果。

本发明实施例中提供的项目评价方法,首先获取待评价项目的项目信息;然后从待评价项目的项目信息中提取待评价项目的项目特征,待评价项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;最后将待评价项目的项目特征输入至项目评价模型,得到项目评价模型的评价结果。该评价方法采用了项目评价模型,可以使得到的评价结果更加准确,进而辅助专家做出最终合理评审结果,极大程度减少了评审人力的投入成本。而且,通过融合待评价项目的语义特征以及全局特征等多维度特征,可以更加全面地对待评价项目进行表征,进一步提升评价结果的准确性。

如图4所示,在上述实施例的基础上,本发明实施例中提供了一种项目评价模型训练装置,包括:

第一获取模块41,用于获取各样本项目的项目信息及其评价结果;

第一特征提取模块42,用于从每个样本项目的项目信息中提取每个样本项目的项目特征,每个样本项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

训练模块43,用于基于每个样本项目的项目特征及其评价结果,对初始评价模型进行训练,得到项目评价模型;

其中,每个样本项目的全局特征均包括历史全局特征和同期全局特征,对于任一样本项目,所述任一样本项目的历史全局特征基于所述任一样本项目与在所述任一样本项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述任一样本项目的同期全局特征基于所述任一样本项目与在所述任一样本项目所处时期内的同期样本项目之间的语义特征相似度确定。

在上述实施例的基础上,本发明实施例中提供的项目评价模型训练装置,第一特征提取模块具体用于:

对于任一样本项目,确定所述任一样本项目所处时期的之前时期内的各历史样本项目,以及所述任一样本项目所处时期内的各同期样本项目;

从每个历史样本项目的项目信息中提取每个历史样本项目的语义特征,计算各历史样本项目的第一语义特征平均值,并从每个同期样本项目的项目信息中提取每个同期样本项目的语义特征,计算各同期样本项目的第二语义特征平均值;

计算所述第一语义特征平均值与所述任一样本项目的语义特征之间的语义特征相似度,得到所述任一样本项目的历史全局特征;

计算所述第二语义特征平均值与所述任一样本项目的语义特征之间的语义特征相似度,得到所述任一样本项目的同期全局特征。

在上述实施例的基础上,本发明实施例中提供的项目评价模型训练装置,第一特征提取模块还具体用于:

将每个样本项目的项目信息输入至预训练语言模型,得到所述预训练语言模型输出的每个样本项目的语义特征。

在上述实施例的基础上,本发明实施例中提供的项目评价模型训练装置,训练模块具体用于:

将每个样本项目的项目特征输入至所述初始评价模型,得到所述初始评价模型的输出结果;

基于所述输出结果与每个样本项目的评价结果,计算损失值,并基于所述损失值,迭代更新所述初始评价模型的结构参数,直至所述损失值收敛或达到预设迭代次数,得到所述项目评价模型。

在上述实施例的基础上,本发明实施例中提供的项目评价模型训练装置,第一特征提取模块还具体用于:

基于特征工程,对每个样本项目的项目属性信息进行处理,得到每个样本项目的属性特征。

具体地,本发明实施例中提供的项目评价模型训练装置中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,具体参见上述实施例,本发明实施例中对此不再赘述。

如图5所示,在上述实施例的基础上,本发明实施例中提供了一种项目评价系统,包括:

第二获取模块51,用于获取待评价项目的项目信息;

第二特征提取模块52,用于从所述待评价项目的项目信息中提取所述待评价项目的项目特征,所述待评价项目的项目特征均包括语义特征以及全局特征,或者均包括属性信息、语义特征以及全局特征;

评价模块53,用于将所述待评价项目的项目特征输入至项目评价模型,得到所述项目评价模型的评价结果;

其中,所述项目评价模型基于上述各实施例中提供的项目评价模型训练方法训练得到,所述待评价项目的全局特征包括历史全局特征和同期全局特征,所述待评价项目的历史全局特征基于所述待评价项目与在所述待评价项目所处时期的之前时期内的历史样本项目之间的语义特征相似度确定,所述待评价项目的同期全局特征基于所述待评价项目与在所述待评价项目所处时期内的同期样本项目之间的语义特征相似度确定。

图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(Processor)610、通信接口(Communications Interface)620、存储器(Memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行上述各实施例中提供的项目评价模型训练方法或项目评价方法。

此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各实施例中提供的项目评价模型训练方法或项目评价方法。

又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例中提供的项目评价模型训练方法或项目评价方法。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 电力系统项目评价模型的建立方法及评价方法
  • 基于多级模糊综合评价模型的电力项目网络后评价系统
技术分类

06120116487980