掌桥专利:专业的专利平台
掌桥专利
首页

一种基于对比学习的估值方法、装置、设备及介质

文献发布时间:2024-04-18 19:58:30


一种基于对比学习的估值方法、装置、设备及介质

技术领域

本发明涉及计算机处理技术领域,尤其涉及一种基于对比学习的估值方法、装置、设备及介质。

背景技术

企业估值是指着眼于企业本身,对企业的内在价值进行评估。对于企业的准确估值有利于对企业价值进行正确评价,并在估值后,一般会将对企业的估值信息展示给用户,使得用户获知企业的具体情况。

目前的企业估值方法主要采用的是通过人工依据企业数据进行判断的方式,进而将基于人工计算的估值信息提供给用户。这种方式基于人工计算的估值方法,对其专业知识要求较高,存在估值准确性差的问题,从而导致对企业的具体情况不清楚的问题。

发明内容

本发明提供了一种基于对比学习的估值方法、装置、设备及介质,以实现提高估值准确性的同时,达到提高对企业在行业中的定位精度的技术效果。

根据本发明的一方面,提供了一种基于对比学习的估值方法,该方法包括:

获取待使用的企业关联数据;其中,所述企业关联数据中包括待估值企业的第一关联数据以及至少一个对比企业的第二关联数据;

基于企业估值模型中的特征提取模型分别对每个所述企业关联数据进行特征提取处理,得到与所述第一关联数据相对应的第一特征向量以及与所述第二关联数据相对应的第二特征向量;其中,所述特征提取模型是通过对比学习训练得到的;

基于每个所述第二特征向量与所述第一特征向量之间的相似度,从所述对比企业中确定对标企业;

将所述待估值企业与所述对标企业的指标数据进行对比显示;其中,所述指标数据包含对企业的估值属性;所述估值属性是基于所述企业估值模型中的估值输出模型确定的。

根据本发明的另一方面,提供了一种基于对比学习的估值装置,该装置包括:

数据获取模块,用于获取待使用的企业关联数据;其中,所述企业关联数据中包括待估值企业的第一关联数据以及至少一个对比企业的第二关联数据;

特征提取模块,用于基于企业估值模型中的特征提取模型分别对每个所述企业关联数据进行特征提取处理,得到与所述第一关联数据相对应的第一特征向量以及与所述第二关联数据相对应的第二特征向量;其中,所述特征提取模型是通过对比学习训练得到的;

对标企业确定模块,用于基于每个所述第二特征向量与所述第一特征向量之间的相似度,从所述对比企业中确定对标企业;

显示模块,用于将所述待估值企业与所述对标企业的指标数据进行对比显示;其中,所述指标数据包含对企业的估值属性;所述估值属性是基于所述企业估值模型中的估值输出模型确定的。

根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的基于对比学习的估值方法。

根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的基于对比学习的估值方法。

本发明实施例的技术方案,通过基于企业估值模型中的特征提取模型分别对每个企业关联数据进行处理,得到与第一关联数据相对应的第一特征向量以及与第二关联数据相对应的第二特征向量;特征提取模型是通过对比学习训练得到的;基于每个第二特征向量与第一特征向量之间的相似度,从对比企业中确定对标企业;将待估值企业与对标企业的指标数据进行对比显示,解决了现有技术中基于人工计算的估值方法,存在估值准确性差,从而导致对企业的具体情况不清楚的问题,实现了通过基于对比学习训练得到的特征提取模型对企业关联数据进行特征提取,得到包含重要特征信息的特征向量,进而基于每个第二特征向量与第一特征向量之间的相似度,从对比企业中选取出与待估值企业具有高关联性的对标企业。进一步的,基于估值输出模型对特征提取模型输出的特征向量进行处理,得到对企业的估值属性进行对比展示,不仅提高了估值准确性,还提高了对待估值企业在行业中的定位精度,使得更清楚的了解到待估值企业的整体情况。

应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例一提供的一种基于对比学习的估值方法的流程图;

图2是根据本发明实施例一所提供的表征确定企业估值模型的方法流程图;

图3是根据本发明实施例二提供的一种基于对比学习的估值装置的结构示意图;

图4是实现本发明实施例的基于对比学习的估值方法的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

图1是根据本发明实施例一提供的一种基于对比学习的估值方法的流程图,本实施例可适用于企业对比评估的情况,该方法可以由基于对比学习的估值装置来执行,该基于对比学习的估值装置可以采用硬件和/或软件的形式实现,该基于对比学习的估值装置可配置于计算设备中。如图1所示,该方法包括:

S110、获取待使用的企业关联数据;其中,企业关联数据中包括待估值企业的第一关联数据以及至少一个对比企业的第二关联数据。

本实施例中,待估值企业可以为需要被估值的企业。

在实际应用中,为了体现待估值企业在行业间的情况,可以选取一些与待估值企业同行业的其他企业作为对比企业,或者,选择与企业发展历史、规模、所处发展阶段等相近的企业作为对比企业。获取待估值企业以及对比企业在多个评估维度(如,包括但不限于行业环境、竞争能力、资产负债、盈利能力、抗风险度,行业费率和行业比率等)下的数据,相应的,得到每个企业的企业关联数据。与待估值企业相对应的企业关联数据即为第一关联数据,与对比企业相对应的企业关联数据即为第二关联数据。为了提高企业估值准确性,还可以对企业关联数据进行预处理,例如,对待处理评估数据进行清洗处理,将其中的异常值、错误值、空白信息等数据清洗掉,以基于预处理后的企业关联数据进行企业对比评估。

S120、基于企业估值模型中的特征提取模型分别对每个企业关联数据进行特征提取处理,得到与第一关联数据相对应的第一特征向量以及与第二关联数据相对应的第二特征向量。

其中,特征提取模型是通过对比学习训练得到的,用于进行特征提取。

具体的,可以将所有企业的企业关联数据输入至企业估值模型中,通过企业估值模型中的特征提取模型对企业关联数据进行特征提取,得到每个企业关联数据所对应的特征向量,该特征向量即为企业关联数据的特征表示。与第一关联数据相对应的特征向量称为第一特征向量,与第二关联数据相对应的特征向量称为第二特征向量。

在本实施例中,训练得到特征提取模型的实现方式可以是:获取多个参考企业的企业样本数据;对于每个企业样本数据,基于预设数据增强方式对企业样本数据进行至少两次的增强处理,确定与企业样本数据相对应的增强样本组;基于增强样本数据对企业估值模型中的特征提取模型进行预训练。

其中,增强样本组中的增强样本数据的数量与至少两次相对应,例如,如果对数据1进行两次数据增强,则得到两个与数据1相对应的增强样本数据分别为1-1和1-2。参考企业可以为向市场主体、市场运营和公众公开提供数据和信息的企业。需要说明的是,确定与每个企业样本数据相对应的增强样本组的实现方式相同,可以以确定其中任一企业样本数据的增强样本组为例进行介绍。

在实际应用中,可以从预设数据增强方式中随机选取一种或多种方式对企业样本数据进行至少两次的增强处理,每次增强处理后,均可得到一个对企业样本数据增强处理后的增强样本数据,增强次数与增强样本数据的数量相同。可将同一企业样本数据对应的各增强样本数据作为一个增强样本组。

可选的,预设数据增强方式包含但不限于数据遮掩、数据随机抖动以及数据插值等方式。数据增强是指将企业样本数据中的部分评估维度上的数据进行随机遮掩。例如,进行数据遮掩时,可以随机选择一个或多个维度进行遮掩,如随机选择遮掩第1和第4个维度,从而使后续模型在处理不完整信息时变得更加鲁棒。数据随机抖动是指在企业样本数据中引入随机扰动,以增加数据的多样性。例如,在财务数据中引入随机噪声,或对某些指标下的数据进行随机增减,模拟企业经营中的不确定性和波动性,同时在引入随机抖动时要保证财务勾稽正确。数据插值是指对缺失的数据进行插值处理,以填补数据的空缺。可以使用插值方法,如线性插值、多项式插值或基于邻近样本的插值方法,根据已有的数据推测出缺失值。需要说明的是,预设数据增强方式可以根据具体的需求和特征进行选择和组合使用,以生成每个企业样本数据增强后的一个增强样本组。此种设置的好处在于:通过对不同样本之间进行增强变换,可以扩展样本空间,提高模型的鲁棒性和泛化能力。

进一步的,可以通过增强样本组中的增强样本数据对企业估值模型中的特征提取模型进行训练,以得到训练好的特征提取模型。具体来说,基于增强样本数据对企业估值模型中的特征提取模型进行预训练,包括:将增强样本数据输入至特征提取模型中,得到与增强样本数据相对应的目标数据向量;基于预设的对比损失函数以及目标数据向量,确定损失值;基于损失值对特征提取模型中的模型参数进行修正,以得到预训练的特征提取模型。

参见图2,可以将每个增强样本数据输入至特征提取模型中,对增强样本数据进行特征提取,得到每个增强样本数据对应的目标数据向量。基于对比损失函数解算目标数据向量,得到损失值,例如,可以利用对比损失函数计算目标数据向量之间的相似性(如使用余弦相似度进行表示),基于相似性确定损失值。例如,对比损失函数可以为孪生网络中的对比损失,该损失函数可用于衡量目标数据向量之间的相似性,对比损失函数可以表示为:L_contrastive=1/N*ΣL_ij,其中,N表示增强样本组的数量,L_ij表示一组增强样本数据的目标数据向量z_i和z_j的对比损失。进一步的,可以通过损失值对特征提取模型中的模型参数进行修正,以得到预训练的特征提取模型。

需要说明的是,可以利用相似度来衡量两个增强样本数据的目标数据向量间之间的相似性程度。相似度越高,表示两个增强样本数据在特征空间中越接近,具有相似的特征表示;相似度越低,表示两个增强样本数据在特征空间中越远离,具有不相似的特征表示。在本实施例中,可以分别计算同一组中的增强样本数据的目标数据向量之间的损失,以及不同组中的增强样本数据的目标数据向量之间损失,进而通过总损失修正特征提取模型的模型参数。可选的,对比损失函数包括正样本损失函数和负样本损失函数;基于预设的对比损失函数以及目标数据向量,确定损失值,包括:依据正样本损失函数,基于同一增强样本组下的增强样本数据的目标数据向量,确定正样本损失;依据负样本损失函数,基于不同增强样本组下的增强样本数据的目标数据向量,确定负样本损失;基于正样本损失、负样本损失以及增强样本组的数量,确定损失值。

具体的,可以利用正样本损失函数计算同一增强样本组下的增强样本数据的目标数据向量之间的损失,称为正样本损失。使用负样本损失函数计算不同增强样本组下的增强样本数据的目标数据向量之间的损失,称为负样本损失。将所有的正样本损失和负样本损失求和,结合增强样本组的数量,确定最终的损失值,基于损失值对特征提取模型中的模型参数进行修正,以最大化同一组中增强样本数据的目标数据向量的相似性,最大化不同组中增强样本数据的目标数据向量的不相似性,作为训练特征提取模型的目标,得到特征提取模型。

示例性的,对比损失函数表示为:L_contrastive=1/N*ΣL_ij,其中,L_ij由正样本损失函数L1_ij和负样本损失函数L2_ij组成。

L1_ij=||z_i-z_j||^2,L1_ij表示同一组增强样本数据的目标数据向量z_i和z_j的正样本损失,||z_i-z_j||表示z_i和z_j之间的距离,如欧氏距离。L2_ij=max(0,m-||z_i-z_j||^2),L1_ij表示不同组增强样本数据的目标数据向量z_i和z_j的负样本损失,m是一个边界值,用于确保负样本(即不同组)的目标数据向量之间具有足够的差异。

本实施例中,通过最小化对比损失函数,使同一组增强样本数据的目标数据向量更加接近,不同组增强样本数据的目标数据向量更加远离,从而使得特征提取模型学习到更准确、区分度更高的企业特征表达。需要注意的是,对比损失函数还可以根据具体的对比学习方法和模型网络结构进行调整和优化,以达到更好的特征学习效果。

为了使得能够提取更有效和有表达力的特征信息,可以选用注意力机制进行特征提取,通过选择和聚焦在数据中的重要特征,来提高模型的性能和准确性。可选的,特征提取模型中包括输入层、自注意力层和前馈神经网络层;将增强样本数据输入至特征提取模型中,得到与增强样本数据相对应的目标数据向量,包括:基于特征提取模型中输入层对增强样本数据进行处理,得到第一数据向量;基于特征提取模型中自注意力层对第一数据向量进行处理,得到第二数据向量;基于特征提取模型中前馈神经网络层对第二数据向量进行处理,得到目标数据向量。

继续参见图2,将增强样本数据输入至特征提取模型中,输入层是与增强样本数据交互的第一层,可通过输入层将增强样本数据转换为向量形式,得到第一数据向量,第一数据向量的形式可以为一个向量或一个向量矩阵。进一步的,将第一数据向量输入至自注意力层,应用自注意力机制对第一数据向量进行加权处理,捕捉特征之间的依赖关系,通过计算注意力权重,对第一数据向量进行加权求和,得到自注意力层的输出,即为第二数据向量。将第二数据向量输入至前馈神经网络层,经由前馈神经网络层对第二数据向量进行非线性变换处理,得到输出结果即为目标数据向量。此种设置的好处在于:通过自注意力和前馈神经网络的处理,使得到的目标数据向量可以包含增强样本数据的重要特征,提高后续的对比学习和估值的效果。

可选的,前馈神经网络层可以由多个全连接层组成,其中包括激活函数和权重参数,相应的,可通过对第二数据向量进行多层的非线性变换,提取更高级别的特征表示,提高特征提取效果。

为了提高企业估值的准确性,在确定增强样本数据的目标数据向量之后,可以基于增强样本数据的目标数据向量和预先确定的估值标签,确定训练样本;基于训练样本对企业估值模型中估值输出模型进行预训练,以更新企业估值模型。

其中,估值输出模型可用于预测企业的估值属性。估值输出模型包括多层感知机。

继续参见图2,将同一增强样本数据的目标数据向量和其估值标签作为一个第一训练样本,相应的,得到多个第一训练样本。将第一训练样本输入至估值输出模型中,经估值输出模型通过全连接层将第一训练样本中的目标数据向量映射到估值结果空间,输出估值结果。可以利用预设的损失函数计算第一训练样本中的估值标签和估值结果之间的误差值,损失函数的目标可以是最小化估值结果和估值标签之间的差异。进一步的,可通过误差值修正估值输出模型的模型参数,得到训练好的估值输出模型。以将训练好的特征提取模型和训练好的估值输出模型进行拼接,得到最终的企业估值模型,使得基于企业估值模型确定企业关联数据的估值属性。

示例性的,第一训练样本包含目标数据向量z_i和估值标签y,将z_i输入估值输出模型,通过估值输出模型使用y_hat=MLP(z_i)将特征表示z_i映射到估值结果空间,MLP表示多层感知机操作,输出y_hat即为估值结果。可以采用均方误差(Mean Squared Error,MSE)作为损失函数,用于衡量估值结果和估值标签之间的差异,通过优化损失函数,调整估值输出模型的参数,使企业估值模型能够更好地学习到企业样本数据的特征表示,并能够产生准确的估值结果。损失函数的计算公式可以为:L=∑(|y-y_hat|/y),其中,|y-y_hat|为估值标签y和y_hat之间的误差值。

为了进一步的提高企业估值的准确性,还可以在基于所述增强样本数据对所述企业估值模型中的特征提取模型进行预训练之后,将估值输出模型连接到训练好的特征提取模型上,并冻结特征提取模型,得到初始的企业估值模型,进行训练。获取多个第二训练样本;在固定企业估值模型中特征提取模型中模型参数的条件下,基于第二训练样本对企业估值模型中估值输出模型进行训练,以更新企业估值模型。

其中,第二训练样本中包括企业数据和估值标识。

具体的,可以使用带有估值标识的企业数据作为第二训练样本,将第二训练样本输入至企业估值模型中,通过特征提取模型对第二训练样本中的企业数据进行特征提取,得到特征表示。进一步的,估值输出模型通过全连接层将特征表示映射到估值结果空间,输出估值结果。可以利用预设的损失函数计算第二训练样本中的估值标识和估值结果之间的误差值。在固定企业估值模型中特征提取模型中模型参数的条件下,通过误差值修正企业估值模型中的估值输出模型的模型参数,更新企业估值模型。

示例性的,第二训练样本包含企业数据x_i和估值标识y,通过特征提取模型输出x_i的特征表示z_i。将z_i输入估值输出模型,通过估值输出模型使用y_hat=MLP(z_i)将特征表示z_i映射到估值结果空间,得到估值结果y_hat。利用损失函数L=∑(|y-y_hat|/y)衡量估值结果和估值标识之间的差异,通过优化损失函数,调整企业估值模型的参数,以得到最终的企业估值模型。

S130、基于每个第二特征向量与第一特征向量之间的相似度,从对比企业中确定对标企业。

在本实施例中,可以利用余弦相似度算法分别计算各个第二特征向量与第一特征向量之间的相似度,该相似度表征待估值企业与相应的对比企业之间的相似程度。可以基于各相似度,从中对比企业中选取出具有代表性的对标企业,使得确定出的对标企业与待估值企业具有高关联性,提高后续对待估值企业在行业中的定位精度。例如,将相似度大于预设阈值,或相似度在预设范围内的对比企业作为对标企业。或者,还可以基于特征提取模型确定出的第二特征向量与第一特征向量进行聚类分析,聚类可以基于特征向量的相似性度量,将相似的特征向量分为一组,从而得到不同的类别或簇。这些类别或簇代表了不同的企业类型或特征,可以选取与第一特征向量相同类别或簇的第二特征向量所属对比企业作为对标企业。

S140、将待估值企业与对标企业的指标数据进行对比显示;其中,指标数据包含对企业的估值属性;估值属性是基于企业估值模型中的估值输出模型确定的。

在本实施例中,可以将待估值企业对应的第一特征向量以及对标企业对应的第二特征向量输入至估值输出模型中,得到对待估值企业的估值属性,以及对标企业的估值属性,可以将估值属性作为指标数据,进而将待估值企业与对标企业的估值指标进行对比显示。指标数据中还可以包括企业相关的代表性估值指标,如,市值、收入增长率、市场份额等。为了便于对企业进行更深入的分析和解释,还可以在选取出对标企业之后,将待估值企业与对标企业的指标数据在估值报告中显示,提供更全面和客观的企业估值信息,对待估值企业在行业中进行精准定位。

本实施例的技术方案,通过基于企业估值模型中的特征提取模型分别对每个企业关联数据进行处理,得到与第一关联数据相对应的第一特征向量以及与第二关联数据相对应的第二特征向量;特征提取模型是通过对比学习训练得到的;基于每个第二特征向量与第一特征向量之间的相似度,从对比企业中确定对标企业;将待估值企业与对标企业的指标数据进行对比显示,解决了现有技术中基于人工估值的方法,存在估值准确性差,从而导致对企业的具体情况不清楚的问题,实现了通过基于对比学习训练得到的特征提取模型对企业关联数据进行特征提取,得到包含重要特征信息的特征向量,进而基于每个第二特征向量与第一特征向量之间的相似度,从对比企业中选取出与待估值企业具有高关联性的对标企业。进一步的,基于估值输出模型对特征提取模型输出的特征向量进行处理,得到对企业的估值属性进行对比展示,不仅提高了估值准确性,还提高了对待估值企业在行业中的定位精度,使得更清楚的了解到待估值企业的整体情况。

实施例二

图3是根据本发明实施例二提供的一种基于对比学习的估值装置的结构示意图。如图3所示,该装置包括:数据获取模块210、特征提取模块220、对标企业确定模块230和显示模块240。

其中,数据获取模块210,用于获取待使用的企业关联数据;其中,所述企业关联数据中包括待估值企业的第一关联数据以及至少一个对比企业的第二关联数据;特征提取模块220,用于基于企业估值模型中的特征提取模型分别对每个所述企业关联数据进行特征提取处理,得到与所述第一关联数据相对应的第一特征向量以及与所述第二关联数据相对应的第二特征向量;其中,所述特征提取模型是通过对比学习训练得到的;对标企业确定模块230,用于基于每个所述第二特征向量与所述第一特征向量之间的相似度,从所述对比企业中确定对标企业;显示模块240,用于将所述待估值企业与所述对标企业的指标数据进行对比显示;其中,所述指标数据包含对企业的估值属性;所述估值属性是基于所述企业估值模型中的估值输出模型确定的。

本实施例的技术方案,通过基于企业估值模型中的特征提取模型分别对每个企业关联数据进行处理,得到与第一关联数据相对应的第一特征向量以及与第二关联数据相对应的第二特征向量;特征提取模型是通过对比学习训练得到的;基于每个第二特征向量与第一特征向量之间的相似度,从对比企业中确定对标企业;将待估值企业与对标企业的指标数据进行对比显示,解决了现有技术中基于人工估值的方法,存在估值准确性差,从而导致对企业的具体情况不清楚的问题,实现了通过基于对比学习训练得到的特征提取模型对企业关联数据进行特征提取,得到包含重要特征信息的特征向量,进而基于每个第二特征向量与第一特征向量之间的相似度,从对比企业中选取出与待估值企业具有高关联性的对标企业。进一步的,基于估值输出模型对特征提取模型输出的特征向量进行处理,得到对企业的估值属性进行对比展示,不仅提高了估值准确性,还提高了对待估值企业在行业中的定位精度,使得更清楚的了解到待估值企业的整体情况。

在上述装置的基础上,可选的,所述装置还包括特征提取模型确定模块,所述特征提取模型确定模块包括企业样本数据获取单元、数据增强单元和模型训练单元。

企业样本数据获取单元,用于获取多个参考企业的企业样本数据;

数据增强单元,用于对于每个所述企业样本数据,基于预设数据增强方式对所述企业样本数据进行至少两次的增强处理,确定与所述企业样本数据相对应的增强样本组;其中,所述增强样本组中的增强样本数据的数量与所述至少两次相对应;

模型训练单元,用于基于所述增强样本数据对所述企业估值模型中的特征提取模型进行预训练。

在上述装置的基础上,可选的,模型训练单元包括目标数据向量确定单元、损失值确定单元和参数修正单元。

目标数据向量确定单元,用于将所述增强样本数据输入至所述特征提取模型中,得到与所述增强样本数据相对应的目标数据向量;

损失值确定单元,用于基于预设的对比损失函数以及所述目标数据向量,确定损失值;

参数修正单元,用于基于所述损失值对所述特征提取模型中的模型参数进行修正,以得到预训练的特征提取模型。

在上述装置的基础上,可选的,所述特征提取模型中包括输入层、自注意力层和前馈神经网络层,所述目标数据向量确定单元包括第一数据向量确定子单元、第二数据向量确定子单元和目标数据向量确定子单元。

第一数据向量确定子单元,用于基于所述特征提取模型中输入层对所述增强样本数据进行处理,得到第一数据向量;

第二数据向量确定子单元,用于基于所述特征提取模型中自注意力层对所述第一数据向量进行处理,得到第二数据向量;

目标数据向量确定子单元,用于基于所述特征提取模型中前馈神经网络层对所述第二数据向量进行处理,得到目标数据向量。

在上述装置的基础上,可选的,所述对比损失函数包括正样本损失函数和负样本损失函数,所述损失值确定单元包括正样本损失确定子单元、负样本损失确定子单和损失值确定子单元。

正样本损失确定子单元,用于依据所述正样本损失函数,基于同一增强样本组下的增强样本数据的目标数据向量,确定正样本损失;

负样本损失确定子单元,用于依据所述负样本损失函数,基于不同增强样本组下的增强样本数据的目标数据向量,确定负样本损失;

损失值确定子单元,用于基于所述正样本损失、所述负样本损失以及所述增强样本组的数量,确定损失值。

在上述装置的基础上,可选的,所述装置还包括估值输出模型确定第一模块。估值输出模型确定第一模块包括第一训练样本确定单元和估值输出模型训练第一单元。

第一训练样本确定单元,用于基于所述增强样本数据的目标数据向量和预先确定的估值标签,确定第一训练样本;

估值输出模型训练第一单元,用于基于所述第一训练样本对所述企业估值模型中估值输出模型进行预训练,以更新企业估值模型。

在上述装置的基础上,可选的,所述装置还包括估值输出模型确定第二模块。估值输出模型确定第二模块包括第二训练样本确定单元和估值输出模型训练第二单元。

第二训练样本确定单元,用于获取多个第二训练样本;其中,所述第二训练样本中包括企业数据和估值标识;

估值输出模型训练第二单元,用于在固定所述企业估值模型中特征提取模型中模型参数的条件下,基于所述第二训练样本对所述企业估值模型中估值输出模型进行训练,以更新企业估值模型。

本发明实施例所提供的基于对比学习的估值装置可执行本发明任意实施例所提供的基于对比学习的估值方法,具备执行方法相应的功能模块和有益效果。

实施例三

图4是实现本发明实施例的基于对比学习的估值方法的电子设备的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如基于对比学习的估值方法。

在一些实施例中,基于对比学习的估值方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的基于对比学习的估值方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于对比学习的估值方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

相关技术
  • 一种语音学习方法、装置、语音设备及存储介质
  • 一种浴室加热装置和用于控制浴室加热装置的方法、设备、电子设备及计算机可读存储介质
  • 一种基于区块链的链货币兑换方法、装置、设备和介质
  • 一种基于直播的人脸处理方法、装置、设备和存储介质
  • 一种基于区块链的人才评定方法、装置、设备及介质
  • 基于迁移学习的艺术品估值方法、装置、电子设备和介质
  • 基于对比学习的单细胞数据聚类方法、装置、设备及介质
技术分类

06120116503475