一种对象评分方法和装置
文献发布时间:2023-06-19 13:45:04
技术领域
本发明涉及计算机技术领域,具体涉及一种对象评分方法和装置。
背景技术
为了衡量对象在某一方面的竞争力,通常会基于对象多个维度的数据,为对象评分。其中,对象可以是企业、学校等机构。例如,为了衡量企业规模的竞争力,基于企业的注册资本、社保人数等维度数据对企业进行评分。
现有方法基于预先设置的专家规则为对象评分。例如,由专家根据各个维度对企业规模的贡献度,确定评分规则,基于该评分规则计算企业评分。
但是,该方法人力成本较高。另外,当评分项目发生变化,例如,由企业规模评分变更为企业招聘评分,专家需要重新调整各个维度的贡献度及评分规则,该过程需要花费较长时间。
发明内容
本发明实施例提供一种对象评分方法和装置,能够提高评分效率、降低成本。
本发明实施例的第一方面,提供了一种对象评分方法,其包括:确定若干样本对象的空间向量;其中,所述样本对象的空间向量由所述样本对象的数据确定;确定所述若干样本对象的评分信息;根据所述评分信息和各个所述样本对象的空间向量,确定评分方向向量;根据所述评分方向向量,确定当前对象的评分。
优选地,所述确定若干样本对象的空间向量,包括:针对各个所述样本对象:从所述样本对象的多维数据中选取第一维数的数据;拼接所述第一维数的数据,得到由所述第一维数的元素构成的所述样本对象的空间向量;
优选地,所述确定若干样本对象的空间向量,包括:针对各个所述样本对象:从所述样本对象的多维数据中获取第二维数的数据;根据预设的变换模型,将所述第二维数的数据转换成所述样本对象的空间向量;其中,所述样本对象的空间向量由第一维数的元素构成。
优选地,所述根据所述评分信息和各个所述样本对象的空间向量,包括:根据预设的argmax函数、所述评分信息和和各个所述样本对象的空间向量,确定所述评分方向向量;所述评分方向向量为目标函数取最大值时的变量值。
优选地,所述argmax函数为
优选地,所述argmax函数为
优选地,所述根据预设的argmax函数、所述评分信息和各个所述样本对象的空间向量,确定所述评分方向向量,包括:根据所述argmax函数、所述评分信息和各个所述样本对象的空间向量,通过梯度下降算法计算所述评分方向向量。
优选地,所述评分信息,包括:所述样本对象的标识及位次;所述根据预设的argmax函数、所述评分信息和各个所述样本对象的空间向量,确定所述评分方向向量,包括:根据每两个位次相邻的样本对象的空间向量,计算得到若干候选方向向量;计算各个所述候选方向向量对应的所述目标函数的值;根据各个所述候选方向向量对应的所述目标函数的值,计算所述评分方向向量。
优选地,该方法还包括:确定所述当前对象的空间向量;所述根据所述评分方向向量,确定当前对象的评分,包括:确定所述当前对象的评分为所述当前对象的空间向量在所述评分方向向量方向上的投影。
优选地,所述根据所述评分方向向量,确定当前对象的评分,包括:根据所述评分方向向量,确定若干对象的第一评分;其中,所述若干对象中包括所述当前对象;确定所述若干对象的第一评分中的最大值和最小值;根据所述最大值、所述最小值、所述当前对象的第一评分和预设的评分区间,确定所述当前对象的第二评分。
本发明实施例的第二方面,提供了一种对象评分装置,包括:第一确定模块,配置为确定若干样本对象的空间向量;其中,所述样本对象的空间向量由所述样本对象的数据确定;第二确定模块,配置为确定所述若干样本对象的评分信息;第三确定模块,配置为根据所述评分信息和各个所述样本对象的空间向量,确定评分方向向量;评分模块,配置为根据所述评分方向向量,确定当前对象的评分。
本发明实施例的第三方面,提供了一种计算机存储介质,所述计算机存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施本发明任一实施例所述对象评分方法。
本发明实施例的第四方面,提供了一种电子设备,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施本发明任一实施例所述对象评分方法。
本发明实施例,通过样本对象的数据确定其对应的空间向量,基于样本对象的空间向量及评分信息,学习样本对象的数据与评分信息的关联关系,得到评分方向向量,该评分方向向量能够表征评分规则,可以用于为不同的对象评分。该方法不需要专家确定评分规则,当评分项目发生变更时,该方法可以通过调整样本对象的数据,调整评分方向向量,得到与评分项目对应的评分。与现有方法相比,该方法能够提高评分效率。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
图1为本发明的一个实施例提供的应用场景示意图;
图2为本发明的一个实施例提供的对象评分方法的流程示意图;
图3为本发明的一个实施例提供的企业评分方法的流程示意图;
图4为本发明的一个实施例提供的企业评分方法的流程示意图;
图5为本发明的一个实施例提供的对象评分装置的结构示意图;
图6为本发明的一个实施例提供的电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
如图1所示,图1为本发明实施例一中的应用场景示意图;该应用场景针对一对象评分系统,该对象评分系统包括终端设备101、对象评分服务器102,该对象评分服务器102上设置有对象评分装置,对象评分服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端设备101以及上述对象评分服务器可以通过无线通信方式(如网络)进行直接或间接地连接,本发明在此不做限制。
以下实施例以企业为例,详细阐述对象评分方法的具体实现过程。
企业数据具有数据量大、数据维度多、专业性强等特点。现有方法由专家确定评分规则,在此过程中,专家需要具备较强的专业性,能够确定各个维度数据对企业评分的贡献度,并据此确定最终的评分规则。如果评分过程涉及的数据维度较多,那么专家将花费较长的时间确定评分规则。另外,随着评分项目发生变更,评分规则涉及的数据维度可能发生变更,现有方法需要由专家重新确定各个维度数据对企业评分的贡献度。因此,现有评分过程耗时较长,成本较高。
鉴于此,如图2所示,本发明实施例提供了一种对象评分方法,包括如下步骤:
步骤201:确定若干样本对象的空间向量;其中,样本对象的空间向量由样本对象的数据确定。
以对象是企业为例,企业的数据包括但不限于:注册资本、实缴资本、成立时间、上市时间、上市状态、社保人数、参股控股、分支机构、融资状况、客户数量、供应商数量等。样本企业的空间向量可以由样本企业一个或多个维度的数据确定,例如,样本企业的空间向量由社保人数确定,或者,样本企业的空间向量由注册资本、分支机构和上市时间确定。对象的空间向量的一个元素可以对应一个维度的数据,还可以是多个维度的数据的融合。
步骤202:确定若干样本对象的评分信息。
评分信息可以是样本对象的标识及位次,该位次由样本对象的评分确定。评分信息还可以是样本对象的标识及评分。
评分信息可以为与评分项目相关的各类榜单,例如,如果对企业的知名度进行评分,则可以使用“百大企业知名度排名”榜单。
评分信息可以为通过分析网站数据获得的排序信息,例如,站内企业点击率排名。
评分信息可以为专家根据评分规则得出的排序信息。
评分信息能够反应样本对象在评分项目下的得分情况。
在实际应用场景中,可以先获取评分信息,然后确定评分信息中涉及的样本对象,再确定样本对象的空间向量。具体地,可以预先确定多个对象的空间向量,并将其存储到数据库中。针对每一个评分项目,可以从数据库中获取该评分项目对应的样本对象的空间向量。例如,数据库中存储有1000个对象的空间向量,当对目标对象的规模进行评分时,采用其中的200个对象的空间向量作为样本对象的空间向量。当对目标对象的发展潜力进行评分时,将其中采用的100个对象的空间向量作为样本对象的空间向量。
步骤203:根据评分信息和各个样本对象的空间向量,确定评分方向向量。
本发明实施例采用多个样本对象的空间向量来确定评分方向向量,足够的样本量能够保证评分方向向量的准确性。评分方向向量能够表征样本对象的数据与评分之间的关联关系,即评分规则。当确定评分方向向量的样本对象或者数据维度发生变化,可能导致评分方向向量发生变化,即评分规则发生变化。如果需要调整评分规则,可以调整用于确定样本对象的空间向量的数据维度,或者调整使用的样本对象。
步骤204:根据评分方向向量,确定当前对象的评分。
本发明实施例基于样本对象的空间向量及评分信息,学习样本对象的数据与评分信息的关联关系,得到评分方向向量,该评分方向向量能够表征评分规则,可以用于为不同的对象评分。该方法不需要专家确定评分规则,当评分项目发生变更时,该方法可以通过调整样本对象的数据,调整评分方向向量,得到与评分项目对应的评分。与现有方法相比,该方法能够提高评分效率。
进一步地,该方法还包括:根据多个对象的评分,为多个对象排序。由对象的评分可以进一步得到对象在评分项目中的排序,能够更加直观地确定各个对象在评分项目上的竞争力。
在本发明的一个实施例中,确定若干样本对象的空间向量,包括:
针对各个样本对象:从样本对象的多维数据中选取第一维数的数据;拼接第一维数的数据,得到由第一维数的元素构成的样本对象的空间向量。
在本发明实施例中,可以预设空间向量维数,该方法根据预设的空间向量维数,获取对应维数的数据,通过拼接得到样本对象的空间向量。例如,预设的第一维数是5,则构成样本对象的空间向量存在5个元素,每个元素对应样本对象的一维数据,样本企业的空间向量可以为(注册资本,实缴资本,成立时间,上市时间,社保人数)。如果预设的第一维数是3,则样本企业的空间向量可以为(注册资本,成立时间,社保人数)。
考虑到样本对象一般存在多个维度的数据,在实际应用场景中,还可以预设空间向量维数、以及数据维度。例如,预设的空间向量维数是2,预设的数据维度包括注册资本和社保人数,此时,该方法根据预设信息,从样本企业的多维数据中获取注册资本和社保人数的数值,并拼接得到样本企业的空间向量。例如注册资本为20万,社保人数为10人,得到的样本企业的空间向量可以为(20,10),也可以为(10,20)。样本对象不同维度的数据的拼接顺序可以预先设定。本发明实施例可以根据设定的空间向量维数,通过拼接的方式得到样本对象的空间向量,该方式能够将样本对象的数据迅速转换成样本对象的空间向量,提高对象评分的效率。
在本发明的一个实施例中,确定若干样本对象的空间向量,包括:
针对各个样本对象:从样本对象的多维数据中获取第二维数的数据;根据预设的变换模型,将第二维数的数据转换成样本对象的空间向量;其中,样本对象的空间向量由第一维数的元素构成。
在本发明实施例中,可以随机获取第二维数的样本对象的数据,第二维数与设定的第一维数不同,第一维数即样本对象的空间向量的维数。当第二维数与第一维数不同时,该方法可以通过预设的变换模型将第二维数的数据转换成样本对象的空间向量。具体地,该变换模型可以先将第二维数的数据拼接成目标向量,然后将目标向量转换为样本对象的空间向量。或者,先通过其他方式将第二维数的数据拼接成目标向量,然后通过变换模型将目标向量转换成样本对象的空间向量。变换模型可以是线性模型、指数模型、对数模型等。
在本发明的一个实施例中,根据评分信息和各个样本对象的空间向量,确定评分方向向量,包括:
根据预设的argmax函数、评分信息和各个样本对象的空间向量,确定评分方向向量;评分方向向量为目标函数取最大值时的变量值。
其中,本发明实施例根据评分信息得到各个样本对象在评分排序中的位次,根据argmax函数,各个样本对象的位次和空间向量,确定评分方向向量。在本发明实施例中,样本对象的空间向量的数量为m,每个样本对象的空间向量的维数为n,样本对象i的空间向量为
argmax是一种对函数求参数(或参数集合)的函数。
本发明实施例采用的argmax函数为
其中,
其中,
本发明实施例通过argmax函数,该方法计算量小,能够高效地确定评分方向向量。需要说明的是,在实际应用场景中,还可以使用argmin函数等其他方式实现,如
求解argmax函数中
在本发明的一个实施例中,根据预设的argmax函数、评分信息和各个样本对象的空间向量,确定评分方向向量,包括:
根据argmax函数、评分信息和各个样本对象的空间向量,通过梯度下降算法计算评分方向向量。
本发明实施例根据评分信息得到各个样本对象在评分排序中的位次,根据argmax函数、样本对象的空间向量及位次,通过梯度下降算法计算评分方向向量。
本发明实施例通过预设的损失函数实现梯度下降方法,损失函数如式(3)所示。
其中,
本发明实施例采用的梯度下降算法的步长
梯度下降算法具体实现过程如下:
A1:通过式(4),计算初始化的
A2:根据式(5)和式(6),计算损失函数梯度。
A3:更新
A4:重复执行A2和A3,直到
在本发明的一个实施例中,评分信息,包括:样本对象的标识及位次;
根据预设的argmax函数、评分信息和各个样本对象的空间向量,确定评分方向向量,包括:
B1:根据每两个位次相邻的样本对象的空间向量,计算得到若干候选方向向量。
采用式(7)计算候选方向向量。
其中,
B2:计算各个候选方向向量对应的目标函数的值。
根据式(1)和式(7)计算
B3:根据各个候选方向向量对应的目标函数的值,计算评分方向向量。
遍历
例如,通过B2可以得到
k=1时,确定
k=2时,确定
k=3时,确定
……
以此类推,得到
确定
在本发明的一个实施例,该方法还包括:确定当前对象的空间向量;
根据评分方向向量,确定当前对象的评分,包括:
确定当前对象的评分为当前对象的空间向量在评分方向向量方向上的投影。
确定当前对象的空间向量与确定样本对象的空间向量的方法相同,此处不再赘述。
根据式(8)计算当前对象的空间向量在评分方向向量方向上的投影,得到当前对象的空间向量。
本发明实施例通过向量投影实现评分计算,考虑了不同维度数据对评分的贡献,保证与样本对象评分规则的一致性。特别是当对象包括多个维度的数据时,通过向量之间的运算能够加快计算过程,提高评分效率。
在实际应用场景中,还可以采用其他的方式计算当前对象的评分,例如,将当前对象的空间向量与评分方向向量的点积作为当前对象的评分。
在本发明的一个实施例中,根据评分方向向量,确定当前对象的评分,包括:
根据评分方向向量,确定若干对象的第一评分;其中,若干对象中包括当前对象;
确定若干对象的第一评分中的最大值和最小值;
根据最大值、最小值、当前对象的第一评分和预设的评分区间,确定当前对象的第二评分。
在本发明实施例中,可以对多个当前对象进行评分,为了更加直观地衡量各个当前对象的评分高低,可以将当前对象的评分映射到指定的评分区间。
具体地,可以按照式(9)确定当前对象的第二评分。
其中,
如图3所示,本发明实施例提供了一种企业评分方法,包括:
步骤301:针对各个样本企业:从样本企业的多维数据中选取第一维数的数据。
本发明实施例的目的在于对企业规模进行评分。获取100个样本企业的数据,每个样本企业包括50维数据,步骤301将根据预设的维度从50维数据中选取与企业规模相关的5个维度的数据,如,注册资本、实缴资本、社保人数、客户数量、分支机构数量。
步骤302:拼接第一维数的数据,得到由第一维数的元素构成的样本企业的空间向量。
依次拼接注册资本、实缴资本、社保人数、客户数量、分支机构数量,得到样本企业的空间向量。
步骤303:确定若干样本企业的评分信息。
获取榜单“百大企业规模排名”,确定100个样本企业在榜单中的位次。
步骤304:根据argmax函数、评分信息和各个样本企业的空间向量,通过梯度下降算法计算评分方向向量。
其中,评分方向向量为目标函数取最大值时的变量值。
步骤305:确定当前企业的空间向量。
获取当前企业的注册资本、实缴资本、社保人数、客户数量、分支机构数量的数据,依次拼接得到当前企业的空间向量。
步骤306:确定当前企业的评分为当前企业的空间向量在评分方向向量方向上的投影。
当前企业的评分可以衡量当前企业在企业规模上的竞争力,通过对企业进行规模评分,可以区分各个企业的规模排名。
在通常的情况下,如果要计算企业规模排名,需要专家评估各个维度数据,比如注册资本、社保人数等企业数据维度对规模的贡献度,然后制定评分规则进行计算。而在本发明实施例中,只需要给出一个企业规模排名样例,比如企业g,企业h,企业j,g>h>j,该方案就能自动学习出评分方向向量,从而计算出得分。此外,当再遇到新的评分项目,比如计算企业招聘竞争力排名,原来的方法需要专家再度评估数据维度,但本方案只需给出招聘竞争力排名名单即可再次快速确定评分方向向量。
如图4所示,本发明实施例提供了一种企业评分方法,包括:
步骤401:针对各个样本企业:从样本企业的多维数据中获取第二维数的数据。
本发明实施例的目的在于对企业招聘竞争力进行评分。获取50个样本企业的数据,每个样本企业包括20维数据。
步骤402:根据预设的变换模型,将第二维数的数据转换成样本企业的空间向量。
根据预设的维度,从20维数据中选取8维数据,例如,选取的8维数据为注册资本、实缴资本、成立时间、上市时间、社保人数、分支机构数量、客户数量、供应商数量。
根据变换模型,将8维数据转换成4维的样本企业的空间向量。例如,通过变换模型,计算注册资本+实缴资本、成立时间+上市时间、社保人数+分支机构数量、客户数量+供应商数量,得到样本企业的空间向量的4个元素。
步骤403:确定若干样本企业的评分信息;其中,所述评分信息中包括样本企业的标识及位次。
确定在指定网站内若干样本企业的点击率排名。
步骤404:根据每两个位次相邻的样本企业的空间向量,计算得到若干候选方向向量。
步骤405:计算各个候选方向向量对应的目标函数的值。
步骤406:根据各个候选方向向量对应的目标函数的值,计算评分方向向量。
步骤407:确定若干企业的空间向量。
步骤408:根据评分方向向量,确定各个企业的第一评分;其中,企业的第一评分为企业的空间向量在评分方向向量方向上的投影。
步骤409:确定若干企业的第一评分中的最大值和最小值。
步骤410:根据最大值、最小值、企业的第一评分和预设的评分区间,确定企业的第二评分。
本发明实施例通过样本企业的多维数据和评分信息,确定评分方向向量,该评分方向向量可以表征企业招聘竞争力的评分规则。基于评分方向向量可以对企业进行招聘竞争力评分,并可以将评分映射到指定的评分区间。
如图5所示,本发明实施例提供了一种对象评分装置,包括:
第一确定模块501,配置为确定若干样本对象的空间向量;其中,样本对象的空间向量由样本对象的数据确定;
第二确定模块502,配置为确定若干样本对象的评分信息;
第三确定模块503,配置为根据评分信息和各个样本对象的空间向量,确定评分方向向量;
评分模块504,配置为根据评分方向向量,确定当前对象的评分。
在本发明的一个实施例中,第一确定模块501,配置为针对各个样本对象:从样本对象的多维数据中选取第一维数的数据;拼接第一维数的数据,得到由第一维数的元素构成的样本对象的空间向量。
在本发明的一个实施例中,第一确定模块501,配置为针对各个样本对象:从样本对象的多维数据中获取第二维数的数据;根据预设的变换模型,将第二维数的数据转换成样本对象的空间向量;其中,样本对象的空间向量由第一维数的元素构成。
在本发明的一个实施例中,第三确定模块503,配置为根据预设的argmax函数、评分信息和各个样本对象的空间向量,确定评分方向向量;评分方向向量为目标函数取最大值时的变量值。
在本发明的一个实施例中,argmax函数为
在本发明的一个实施例中,argmax函数为
在本发明的一个实施例中,第三确定模块503,配置为根据argmax函数、评分信息和各个样本对象的空间向量,通过梯度下降算法计算评分方向向量。
在本发明的一个实施例中,评分信息,包括:样本对象的标识及位次;第三确定模块503,配置为根据每两个位次相邻的样本对象的空间向量,计算得到若干候选方向向量;计算各个候选方向向量对应的目标函数的值;根据各个候选方向向量对应的目标函数的值,计算评分方向向量。
在本发明的一个实施例中,第一确定模块501,配置为确定当前对象的空间向量;
第三确定模块503,配置为确定当前对象的评分为当前对象的空间向量在评分方向向量方向上的投影。
在本发明的一个实施例中,评分模块504,配置为根据评分方向向量,确定若干对象的第一评分;其中,若干对象中包括当前对象;确定若干对象的第一评分中的最大值和最小值;根据最大值、最小值、当前对象的第一评分和预设的评分区间,确定当前对象的第二评分。
本发明实施例还提供了一种计算机存储介质,计算机存储介质上存储有计算机可执行程序,计算机可执行程序被运行以实施本发明任一实施例对象评分方法。
如图6所示,图6为本发明实施例六中电子设备的结构示意图;所述电子设备包括存储器601以及处理器602,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施本发明任一实施例所述对象评分方法。
上述对象评分服务器可以为图6所示的电子设备。
以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。