导航：首页> 计算；推算；计数>产品推荐模型训练及产品推荐方法、装置以及存储介质

产品推荐模型训练及产品推荐方法、装置以及存储介质

文献发布时间：2024-04-18 20:01:23

技术领域

本说明书实施例涉及互联网金融技术领域，尤其涉及一种产品推荐模型训练及产品推荐方法、装置以及存储介质。

背景技术

随着互联网金融行业的发展，基于人工智能算法为用户定制化提供金融产品管理服务已经是各金融机构的线上服务重点。而在服务用户时，为了提高用户收益、提升用户对服务的满意度，还会为用户推荐金融产品，以实现在专业领域中对用户的定向服务引导，因此需要一种从专业知识、个性化等多方面来为用户推荐产品的方法。

发明内容

本说明书实施例提供一种产品推荐模型训练及产品推荐方法、装置以及存储介质，可以解决相关技术中产品推荐不准确、无法帮助用户实现预计收益的技术问题。

第一方面，本说明书实施例提供一种产品推荐模型训练方法，该方法包括：

获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

获取所述用户在预设历史时间段内基于所述推荐产品获得的实际收益数据，基于所述推荐产品对应的预估收益数据与所述实际收益数据计算模型损失，基于所述模型损失调整所述目标产品推荐模型，以及将所述用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。

第二方面，本说明书实施例提供一种产品推荐方法，该方法包括：

获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

其中，所述目标产品推荐模型为上述任一项说明书实施例中的产品推荐模型训练方法训练并收敛的目标产品推荐模型。

第三方面，本说明书实施例提供一种产品推荐模型训练装置，该装置包括：

输入模块，用于获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

输出模块，用于基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

训练模块，用于获取所述用户在预设历史时间段内基于所述推荐产品获得的实际收益数据，基于所述推荐产品对应的预估收益数据与所述实际收益数据计算模型损失，基于所述模型损失调整所述目标产品推荐模型，以及将所述用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。

第四方面，本说明书实施例提供一种产品推荐装置，该装置包括：

数据获取模块，用于获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

产品推荐模块，用于基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

其中，所述目标产品推荐模型为上述任一项说明书实施例中的产品推荐模型训练方法训练并收敛的目标产品推荐模型。

第五方面，本说明书实施例提供一种包含指令的计算机程序产品，当所述计算机程序产品在计算机或处理器上运行时，使得所述计算机或所述处理器执行上述的方法的步骤。

第六方面，本说明书实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法的步骤。

第七方面，本说明书实施例提供一种终端，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述计算机程序适于由处理器加载并执行上述的方法的步骤。

本说明书一些实施例提供的技术方案带来的有益效果至少包括：

本说明书实施例提供一种产品推荐模型训练方法，获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。由于产品参数包含了从专业角度对各产品的研判信息，因此基于产品参数计算候选产品对应的推荐得分时，能够基于专业知识针对产品的收益情况来选择向用户推荐更符合用户期望的产品，基于各用户获得的准确推荐结果训练用户对应的目标产品推荐模型，使得不同用户能得到定制化产品推荐模型，最终帮助用户实现期望收益，提升用户使用体验。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书实施例提供的一种产品推荐模型训练方法的示例性系统架构图；

图2为本说明书实施例提供的一种产品推荐模型训练方法的流程示意图；

图3为本说明书另一实施例提供的一种产品推荐模型训练方法的流程示意图；

图4为本说明书实施例提供的一种产品推荐模型中准备输入数据的示意图；

图5为本说明书实施例提供的一种产品推荐方法的流程示意图；

图6为本说明书实施例提供的一种产品推荐模型训练装置的结构框图；

图7为本说明书实施例提供的一种产品推荐装置的结构框图；

图8为本说明书实施例提供的一种终端的结构示意图。

具体实施方式

为使得本说明书实施例的特征和优点能够更加的明显和易懂，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而非全部实施例。基于本说明书中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书实施例保护的范围。

下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书实施例相一致的所有实施方式。相反，它们仅是如所附权利要求书中所详述的、本说明书实施例的一些方面相一致的装置和方法的例子。

随着互联网金融行业的发展，基于人工智能算法为用户定制化提供金融产品管理服务已经是各金融机构的线上服务重点。而在服务用户时，为了提高用户收益、提升用户对服务的满意度，还会为用户推荐金融产品，以实现在专业领域中对用户的定向服务引导。通常对用户推荐产品时，多是从用户本身情况出发，考虑用户当前持仓、用户行为等的用户数据之间的相关性，选择符合用户选择习惯的产品。

例如，常见的方案主要有两种，一种是基于协同过滤的推荐方案，即通过用户的历史点击、购买等行为，找到和该用户相似的其他用户，推荐相似用户爱买、爱看的产品；另一种是基于点击率或购买率预估的推荐方案，即通过模型(如deepFM)将用户画像(如理财经验、历史投资业绩)等信息和产品画像(如收益率、风险、波动)等信息输入模型，通过模型寻找用户和产品之间的匹配规律。两种方法都主要考虑的是用户持仓、行为与产品、及其他用户的相关性，通常并未考虑到产品本身在未来可能的收益情况、风险情况，难以改善用户买入持有后的收益。

通常大多数用户都是基于个人经验或简单易获取的专业知识进行金融活动，因此用户的金融行为数据常与用户偏好、习惯等相关，与产品的收益没有强相关性，然而，用户持有或卖出金融产品的最终目的是获取收益，在只基于用户个人数据进行推荐时，由于用户个人数据的不稳定性、与产品本身收益属性的低相关性，导致推荐产品的过程中没有考虑到产品为用户带来的收益，没有照顾到用户的收益需求，因此为了提升用户所购买产品的收益，就需要基于产品本身属性来为用户推荐合适的目标产品。

因此本说明书实施例提供一种产品推荐模型训练方法，通过获取候选产品对应的至少两种推荐产品参数的子推荐得分；目标产品推荐模型基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；根据用户在预设历史时间段内基于推荐产品获得的实际收益数据和预估收益数据计算模型损失，训练目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型，以解决上述产品推荐不准确、无法帮助用户实现预计收益的技术问题。

请参阅图1，图1为本说明书实施例提供的一种产品推荐模型训练方法的示例性系统架构图。

如图1所示，系统架构可以包括终端101、网络102和服务器103。网络102用于在终端101和服务器103之间提供通信链路的介质。网络102可以包括各种类型的有线通信链路或无线通信链路，例如：有线通信链路包括光纤、双绞线或同轴电缆的，无线通信链路包括蓝牙通信链路、无线保真(Wireless-Fidelity，Wi-Fi)通信链路或微波通信链路等。

终端101可以通过网络102与服务器103交互，以接收来自服务器103的消息或向服务器103发送消息，或者终端101可以通过网络102与服务器103交互，进而接收其他用户向服务器103发送的消息或者数据。终端101可以是硬件，也可以是软件。当终端101为硬件时，可以是各种电子设备，包括但不限于智能手表、智能手机、平板电脑、膝上型便携式计算机和台式计算机等。当终端101为软件时，可以是安装在上述所列举的电子设备中，其可以实现呈多个软件或软件模块(例如：用来提供分布式服务)，也可以实现成单个软件或软件模块，在此不作具体限定。

在本说明书实施例中，首先终端101获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；然后终端101基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；最终，终端101获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。

服务器103可以是提供各种服务的业务服务器。需要说明的是，服务器103可以是硬件，也可以是软件。当服务器103为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器103为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块，在此不做具体限定。

或者，该系统架构还可以不包括服务器103，换言之，服务器103可以为本说明书实施例中可选的设备，即本说明书实施例提供的方法可以应用于仅包括终端101的系统结构中，本说明书实施例对此不做限定。

应理解，图1中的终端、网络以及服务器的数目仅是示意性的，根据实现需要，可以是任意数量的终端、网络以及服务器。

请参阅图2，图2为本说明书实施例提供的一种产品推荐模型训练方法的流程示意图。本说明书实施例的执行主体可以是执行产品推荐模型训练的终端，也可以是执行产品推荐模型训练方法的终端中的处理器，还可以是执行产品推荐模型训练方法的终端中的产品推荐模型训练服务。为方便描述，下面以执行主体是终端中的处理器为例，介绍产品推荐模型训练方法的具体执行过程。

如图2所示，产品推荐模型训练方法至少可以包括：

S202、获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型。

可选地，在向用户推荐产品时，用户除了偏好需求之外还有收益需求，那么各类产品的收益是与其自身产品参数、属性息息相关的，而产品的行业情况、正负收益情况、未来发展预期等，都是需要基于专业的金融研判知识才能分析得到，这些强专业性要求的数据与用户自身的选择偏好、购买习惯等的相关性较低，也就是说根据用户个人数据无法从产品的收益角度来分析、推荐符合收益需求的目标产品，因此为了提升用户所购买产品的收益，就需要基于产品本身的专业属性来为用户推荐合适的目标产品。

可选地，由于金融产品的专业性要求较高，因此存在一些金融机构、代理人来凭借所掌握的专业领域知识，对各产品进行专业角度的分析，这些来自市面上专业的机构或个人对产品的情况研究判断，即为金融研判知识。研判知识是基于行业专业知识分析得到的产品参数，同时再考虑上用户个人行为的个性化参数，作为向用户推荐产品时考虑的至少两种推荐产品参数，能够在分析用户个性行为的基础上，还基于产品的客观专业角度，为用户找到即符合用户偏好、有符合用户收益期望的产品，那么当这类产品被推荐给用户时，将会得到更好的用户反馈，提升用户对平台的信任度，也有利于平台长期发展。

可选地，推荐产品时可以基于所考虑的产品参数的推荐得分来判断其与用户的匹配度，而当推荐时考虑的产品参数有多个时，也就说明存在多个产品参数各自对应的子推荐得分，那么需要将各自推荐得分融合计算，最终才能得到一个产品对应的综合推荐得分。因此需要产品推荐模型来进行融合计算，也即在本说明书实施例中，首先获取候选产品对应的至少两种推荐产品参数的子推荐得分，然后将各子推荐得分输入用户对应的目标产品推荐模型，通过目标产品推荐模型来融合计算各产品参数对应的各子推荐得分。

S204、基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品。

可选地，各个候选产品的产品参数对应的子推荐得分不同，产品推荐模型在选择推荐产品时，可以预设推荐条件，基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品。其中预设推荐条件可以是综合得分最高，也可以是综合得分满足综合阈值要求且指定项子得分满足单独阈值要求等，预设推荐条件也即模型确定推荐产品的筛选条件，那么就可以根据用户的具体需求来定制。具体的，还可以根据不同用户的个性化需求，制定多种预设推荐条件，模型在实际场景中被对应用户使用时，能够根据用户的个性化需求确定输出推荐产品的预设推荐条件。

S206、获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。

可选地，通常模型使用离线训练模式，将基于样本数据离线训练好的模型提供给线上场景中的所有用户使用，然而在金融产品对应的场景中，不同用户偏好、感兴趣的产品领域可能相差较大，例如有的用户对计算机行业感兴趣，倾向于了解购买计算机行业的金融产品；而有的用户对新能源行业感兴趣，就倾向于了解购买新能源行业的金融产品。当推荐产品与其喜好、兴趣等具有较大差异时，会降低用户点击率，这样即时该产品具有较好的预期收益，在用户不想了解的情况下，也无法做到有效推荐。

进一步地，为了适应不同用户对应的不同产品偏好，对于产品推荐模型可以采用在线训练的方式，通过用户使用产品推荐模型之后的真实数据，调整产品推荐模型中的各项模型参数，训练后得到的模型就迭代原模型，继续为用户提供产品图鉴服务，这样可以产品图鉴模型可以基于用户的需求变化而训练，对于不同偏好、不同收益预期的用户能够使用自身最合适的模型，并且当用户的喜好、发生变化时，模型也能做出适应性调整，实现对各用户的定制化产品推荐模型。

可选地，在线训练时，用户使用产品推荐模型之后的实际收益情况，就代表了模型输出推荐产品给用户之后的真实数据，而模型在输出推荐产品之前对于该推荐产品有一定的预估收益，即模型认为当前模型状态下所推荐的产品能够实现的标准数据。当用户长期使用模型后，所积累的收益数据太多，而模型每次训练实际上不需要太多的累计收益数据，太长时间之前的收益数据对当时的模型时没有太大意义的，例如一年之内的累计收益数据、半年之内的累计收益数据，反而可能干扰模型当下的训练准度，基于此，可以使得模型每次训练时只收集预设历史时间段内的数据，例如一周内、半个月内的，这样使用较少的有效数据就可以提升模型的性能，也减少了模型的计算资源浪费。

可选地，在模型训练过程中，通常使用损失函数来计算模型每一轮训练的输出值与样本对应的标准值之间的损失值，模型利用损失值对参数进行调整，趋向于损失值减小的方向拟合，当损失值满足预设目标值时，则说明模型的训练成果已经达到预设目标。那么在本说明书实施例中，在训练产品推荐模型时，就可以获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。实现对各用户对应的目标产品推荐模型的定制化训练，为不同用户提供不同模型参数的模型，针对性的满足用户需求，最终帮助用户实现期望收益，提升用户使用体验。

在本说明书实施例中，提供一种产品推荐模型训练方法，获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。由于产品参数包含了从专业角度对各产品的研判信息，因此基于产品参数计算候选产品对应的推荐得分时，能够基于专业知识针对产品的收益情况来选择向用户推荐更符合用户期望的产品，基于各用户获得的准确推荐结果训练用户对应的目标产品推荐模型，使得不同用户能得到定制化产品推荐模型，最终帮助用户实现期望收益，提升用户使用体验。

请参阅图3，图3为本说明书另一实施例提供的一种产品推荐模型训练方法的流程示意图。

如图3所示，产品推荐模型训练方法至少可以包括：

S302、基于用户群体的用户特征数据，确定用户群体中的至少两种用户类型，以及确定各用户类型对应的预设计算系数组合，计算系数组合为各计算系数分别对应一个固定系数值的组合。

可选地，在实际部署产品推荐模型的最初，用户使用的都是经过离线训练的初始化产品推荐模型，初始化模型是基于预先收集的样本数据训练出的，初始化产品推荐模型部署给每个用户后，才基于各用户的实际使用情况进行对应的在线训练，进而各用户可以拥有自身定制化的产品推荐模型。

可选地，在产品推荐模型中，候选产品的产品参数有多个，不同产品参数对应不同的计算系数，作为其在最终得分中所占的权重，那么模型中涉及的计算系数也存在多个，参数量太大时，参数的调整空间也非常大，模型的调参空间也更大，导致模型收敛会非常困难，并且传统的公式调参方式不仅计算量大，也会限制模型的优化上限。因此面对多参数的同时调参，为了提高模型的调参效率和准确性，需要减少参数空间，同时提高优化上限。

可选地，在实际场景中，根据用户的行为活动数据，可以基于用户的不同特征将所有用户按类别分为不同类别的用户群体，如果用户在使用模型的过程中行为特征发生变化，也会转为对应其他另外类型的用户群体，考虑到按照用户特征将单一的用户个体划分到固定类型的用户群体中时，可以根据各固定用户类型的特征，来确定当前用户类型对应的各计算系数的某一个优选值，各计算系数对应的固定优选值组合起来就得到当前用户类型对应的优选计算系数组合。

进一步地，这样可以对各用户类型都确定出一个对应优选的预设计算系数组合，根据用户的初始特征确定用户的用户类型，将该用户类型对应的计算系数组合中的各计算系数值作为该用户的初始化产品推荐模型中的各计算系数对应的值，而后续基于用户的行为、需求，再确定用户当下最适合的新的用户类型，进而找到新的用户类型对应的计算系数组合，来调整用户对应的目标产品推荐模型，在本说明书实施例中，最初基于用户群体的用户特征数据，确定用户群体中的至少两种用户类型，以及确定各用户类型对应的预设计算系数组合，计算系数组合为各计算系数分别对应一个固定系数值的组合，这样就能够减小实际场景中调整计算系数的计算系数空间。

例如，面对金融场景，将用户从投资金额特征、投资年限特征、风险偏好特征，分别各自都划分为低、中、高三档，得到3×3×3＝27类用户群体(注：仅举例，实际上可以对用户按照任意维度进行切分，只要最后能够得到多类的样本即可)：基于预采集的样本历史数据和模型离线损失函数进行梯度下降的模型训练，就可以分别对上述不同用户群体进行预测，得到27类用户群体分别对应的27组优选的计算系数值，也即27组预设计算系数组合。离线的产品推荐模型中的预设计算系数组合也可以按天/周级别更新，以使得模型的优选计算系数组合也不断进步。

S304、推荐产品参数为专业研判推荐参数和用户个性推荐参数时，对候选产品领域中的专业行业数据进行专业分析研判，计算候选产品对应的专业研判推荐参数的子推荐得分。

可选地，当产品推荐模型经过离线训练之后，在实际场景中部署时，需要获取候选产品对应的至少两种推荐产品参数的子推荐得分，优选的，推荐产品参数可以为专业研判推荐参数和用户个性推荐参数，其中专业研判推荐参数是基于候选产品领域中的专业行业数据生成的产品维度的产品参数。

例如对于金融产品的评价正负参数、确信度参数、观点有效性参数、供给相关性参数，其中评价正负参数含义为某分析师/机构最近一次对于产品行业的研判评价，如看好、中性、看跌；确信度参数含义为该分析师/机构对于这一观点的确信度，如该机构在一定区间(如6个月)表达评价的次数，最后归一化(Z-score standardization)后得到确定度；观点有效性参数含义为该分析师/机构历史上做出的研判的正确率，基于该分析师/机构历史判断得到；供给相关性参数体现出基于金融产品具体披露的持仓决定。

在本说明书实施例中，对候选产品领域中的专业行业数据进行专业分析研判，计算候选产品对应的专业研判推荐参数的子推荐得分，以上述评价正负参数、确信度参数、观点有效性参数、供给相关性参数作为专业研判推荐参数为例，那么(1)计算评价正负参数时，评价看好、中性、看跌分别对应得分1、0、-1，用S

进一步地，将所有观点加总并进行一些计算，我们就可以得到基于专业性研判的所有分析师/机构对某个候选产品的态度：

也即得到候选产品对应的专业研判推荐参数的子推荐得分。其中，x

S306、以及获取行为预估模型基于用户个性数据输出的候选产品对应的用户个性推荐参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型。

可选地，当推荐产品参数为专业研判推荐参数和用户个性推荐参数时，用户个性推荐参数为基于用户个人行为数据生成的用户维度的产品参数，也即基于用户偏好的点击率参数(CTR)、成交率参数(CVR)等，其中点击率包含一跳点击、二跳点击，成交率代表了用户收到推荐产品的推送后的购买率。可选地，请参阅图4，图4为本说明书实施例提供的一种产品推荐模型中准备输入数据的示意图。如图4所示，通过专业研判推荐参数中，评价正负参数、确信度参数、观点有效性参数、供给相关性参数分别对应的各子推荐得分，以及用户个性推荐参数中，点击率参数、成交率参数分别对应的各子推荐得分，输入用户对应的目标产品推荐模型，由目标产品推荐模型得到最终总推荐得分，判断出对应的推荐产品。

S308、基于各候选产品的各子推荐得分以及目标产品推荐模型中各子推荐得分分别对应的各计算系数，计算各候选产品的总推荐得分。

可选地，基于各候选产品的各子推荐得分以及目标产品推荐模型中各子推荐得分分别对应的各计算系数，在产品推荐模型中融合计算得到，各候选产品的总推荐得分。沿用上述专业研判推荐参数中包含评价正负参数、确信度参数、观点有效性参数、供给相关性参数，用户个性推荐参数中包含点击率参数、成交率参数为例，融合计算总推荐得分的公式为：

其中，x

S3010、确定总推荐得分满足预设推荐条件的目标候选产品为推荐产品。

可选地，进一步就可以根据各候选产品的总推荐得分，确定总推荐得分满足预设推荐条件的目标候选产品为推荐产品。预设推荐条件可以是综合得分最高，也可以是综合得分满足综合阈值要求且指定项子得分满足单独阈值要求等，预设推荐条件也即模型确定推荐产品的筛选条件，那么就可以根据用户的具体需求来定制。

S3012、获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失。

可选地，模型在线训练时，基于用户在预设历史时间段内基于推荐产品获得的实际收益数据，和基于当前模型状态预估得到的预估收益数据，计算模型损失。也即计算y_true(真实样本)和Score(预测打分)的cross entropy(交叉熵)，作为模型损失，如下：

Loss=∑

其中，求和表示对所有用户i求和，y表示如果用户购买且收益为正(按近N日收益计算,N＝7)，则为1；否则为0。

S3014、基于模型损失确定目标产品推荐模型在各预设计算系数组合中对应的目标计算系数组合，按照目标计算系数组合调整各子推荐得分分别对应的各计算系数。

可选地，得到模型损失值之后，基于模型损失确定目标产品推荐模型在各预设计算系数组合中对应的目标计算系数组合。首先用户此时使用的产品推荐模型中的计算系数值，是按照用户离线训练时的切分维度对应的用户群体类型，确定出的各子推荐得分的计算系数组合中的系数值，也即按照用户离线训练时的切分维度，对于每一个群体，该群体用户的优选预设计算系数组合以概率p＝1初始化设定为该群体的计算系数组合。

可选地，在在线训练时，需要基于模型损失值调整用户对应的目标产品推荐模型中使用的计算系数组合，具体的，基于线上表现，实际观察不同分群的用户表现，例如有27类用户在过去七天的实际收益数据，则可以计算出每一类的实际损失值，和离线优选参数的预设损失值相比，计算对每个分群i对应的error(用μ

S3016、将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。

可选地，将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型，实现对各用户对应的目标产品推荐模型的定制化训练，为不同用户提供不同模型参数的模型，针对性的满足用户需求，最终帮助用户实现期望收益，提升用户使用体验。

在本说明书实施例中，提供一种产品推荐模型训练方法，通过对专业研判推荐参数中的评价正负参数、确信度参数、观点有效性参数、供给相关性参数计算具体子推荐得分，以及对用户个性推荐参数中的成交率参数、点击率参数计算具体子推荐得分，最终能够详细计算候选产品的多维度产品参数的子推荐得分，能够基于专业知识针对产品的收益情况来选择向用户推荐更符合用户期望的产品；同时，对模型进行离在线分步建模，基于用户的不同特征将所有用户按类别分为不同类别的用户群体，对不同类用户群体分别确定优选计算系数组合，并且在线调整时也在预先确定的多组优选计算系数组合中确定模型对应的目标计算系数组合，缩小了计算系数的调参空间，提高产品推荐模型的优化上限，实现对各用户对应的目标产品推荐模型的定制化训练，最终帮助用户实现期望收益，提升用户使用体验。

请参阅图5，图5为本说明书实施例提供的一种产品推荐方法的流程示意图。

如图5所示，产品推荐方法至少可以包括：

S502、获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型。

可选地，目标产品推荐模型经由上述任一项说明书实施例中的产品推荐模型训练方法中的离线训练后，可以部署在实际场景中，用于推荐产品。具体的，使用目标产品推荐模型推荐产品时，获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型。其过程与上述任一项说明书实施例中目标产品推荐模型训练过程中的流程相同，此处不再赘述。

S504、基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品。

可选地，实际场景中，在产品推荐模型中基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品，具体流程为上述任一说明书实施例中的产品推荐模型训练方法训练并收敛的产品推荐模型得到推荐产品的流程，此处不再赘述。

在本说明书实施例中，提供一种产品推荐方法，获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品，其中，目标产品推荐模型为上述任一项说明书实施例中的产品推荐模型训练方法训练并收敛的目标产品推荐模型。产品参数包含了从专业角度对各产品的研判信息，因此基于产品参数计算候选产品对应的推荐得分时，能够基于专业知识针对产品的收益情况来选择向用户推荐更符合用户期望的产品，不同用户对应的定制化产品推荐模型，帮助用户实现期望收益，提升用户使用体验。

请参阅图6，图6为本说明书实施例提供的一种产品推荐模型训练装置的结构框图。如图6所示，产品推荐模型训练装置600包括：

输入模块610，用于获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

输出模块620，用于基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

训练模块630，用于获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。

可选地，推荐产品参数包括但不限于专业研判推荐参数和用户个性推荐参数；其中，专业研判推荐参数为基于候选产品领域中的专业行业数据生成的产品维度的产品参数，用户个性推荐参数为基于用户个人行为数据生成的用户维度的产品参数。

可选地，输出模块620，还用于基于各候选产品的各子推荐得分以及目标产品推荐模型中各子推荐得分分别对应的各计算系数，计算各候选产品的总推荐得分；确定总推荐得分满足预设推荐条件的目标候选产品为推荐产品。

可选地，产品推荐模型训练装置600还包括：离线训练模块，用于基于用户群体的用户特征数据，确定用户群体中的至少两种用户类型，以及确定各用户类型对应的预设计算系数组合，计算系数组合为各计算系数分别对应一个固定系数值的组合；训练模块630，还用于基于模型损失确定目标产品推荐模型在各预设计算系数组合中对应的目标计算系数组合，按照目标计算系数组合调整各子推荐得分分别对应的各计算系数。

可选地，推荐产品参数为专业研判推荐参数和用户个性推荐参数，输入模块610，还用于对候选产品领域中的专业行业数据进行专业分析研判，计算候选产品对应的专业研判推荐参数的子推荐得分；以及获取行为预估模型基于用户个性数据输出的候选产品对应的用户个性推荐参数的子推荐得分。

在本说明书实施例中，提供一种产品推荐模型训练装置，其中，输入模块，用于获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；输出模块，用于基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；训练模块，用于获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。由于产品参数包含了从专业角度对各产品的研判信息，因此基于产品参数计算候选产品对应的推荐得分时，能够基于专业知识针对产品的收益情况来选择向用户推荐更符合用户期望的产品，基于各用户获得的准确推荐结果训练用户对应的目标产品推荐模型，使得不同用户能得到定制化产品推荐模型，最终帮助用户实现期望收益，提升用户使用体验。

请参阅图7，图7为本说明书实施例提供的一种产品推荐装置的结构框图。如图7所示，产品推荐装置700包括：

数据获取模块710，用于获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

产品推荐模块720，用于基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

其中，目标产品推荐模型为上述任一项说明书实施例中的产品推荐模型训练方法训练并收敛的目标产品推荐模型。

在本说明书实施例中，提供一种产品推荐装置，其中，数据获取模块，用于获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；产品推荐模块，用于基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；其中，目标产品推荐模型为上述任一项说明书实施例中的产品推荐模型训练方法训练并收敛的目标产品推荐模型。产品参数包含了从专业角度对各产品的研判信息，因此基于产品参数计算候选产品对应的推荐得分时，能够基于专业知识针对产品的收益情况来选择向用户推荐更符合用户期望的产品，不同用户对应的定制化产品推荐模型，帮助用户实现期望收益，提升用户使用体验。

本说明书实施例提供一种包含指令的计算机程序产品，当计算机程序产品在计算机或处理器上运行时，使得计算机或处理器执行上述实施例中任一项的方法的步骤。

本说明书实施例还提供了一种计算机存储介质，计算机存储介质可以存储有多条指令，指令适于由处理器加载并执行如上述实施例中的任一项的方法的步骤。

请参见图8，图8为本说明书实施例提供的一种终端的结构示意图。如图8所示，终端800可以包括：至少一个终端处理器801，至少一个网络接口804，用户接口803，存储器805，至少一个通信总线802。

其中，通信总线802用于实现这些组件之间的连接通信。

其中，用户接口803可以包括显示屏(Display)、摄像头(Camera)，可选用户接口803还可以包括标准的有线接口、无线接口。

其中，网络接口804可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。

其中，终端处理器801可以包括一个或者多个处理核心。终端处理器801利用各种接口和线路连接整个终端800内的各个部分，通过运行或执行存储在存储器805内的指令、程序、代码集或指令集，以及调用存储在存储器805内的数据，执行终端800的各种功能和处理数据。可选的，终端处理器801可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。终端处理器801可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示屏所需要显示的内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到终端处理器801中，单独通过一块芯片进行实现。

其中，存储器805可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory，ROM)。可选的，该存储器805包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器805可用于存储指令、程序、代码、代码集或指令集。存储器805可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等；存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器805可选的还可以是至少一个位于远离前述终端处理器801的存储装置。如图8所示，作为一种计算机存储介质的存储器805中可以包括操作系统、网络通信模块、用户接口模块以及产品推荐模型训练及产品推荐程序。

在图8所示的终端800中，用户接口803主要用于为用户提供输入的接口，获取用户输入的数据；而终端处理器801可以用于调用存储器805中存储的产品推荐模型训练程序，并具体执行以下操作：

获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

获取用户在预设历史时间段内基于推荐产品获得的实际收益数据，基于推荐产品对应的预估收益数据与实际收益数据计算模型损失，基于模型损失调整目标产品推荐模型，以及将用户对应的目标产品推荐模型更新为调整后的目标产品推荐模型。

在一些实施例中，推荐产品参数包括但不限于专业研判推荐参数和用户个性推荐参数；其中，专业研判推荐参数为基于候选产品领域中的专业行业数据生成的产品维度的产品参数，用户个性推荐参数为基于用户个人行为数据生成的用户维度的产品参数。

在一些实施例中，终端处理器801在执行基于各候选产品的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品时，具体执行以下步骤：基于各候选产品的各子推荐得分以及目标产品推荐模型中各子推荐得分分别对应的各计算系数，计算各候选产品的总推荐得分；确定总推荐得分满足预设推荐条件的目标候选产品为推荐产品。

在一些实施例中，终端处理器801在执行获取候选产品对应的至少两种推荐产品参数的子推荐得分之前，还具体执行以下步骤：基于用户群体的用户特征数据，确定用户群体中的至少两种用户类型，以及确定各用户类型对应的预设计算系数组合，计算系数组合为各计算系数分别对应一个固定系数值的组合；终端处理器801在执行基于模型损失调整目标产品推荐模型时，具体执行以下步骤：基于模型损失确定目标产品推荐模型在各预设计算系数组合中对应的目标计算系数组合，按照目标计算系数组合调整各子推荐得分分别对应的各计算系数。

在一些实施例中，推荐产品参数为专业研判推荐参数和用户个性推荐参数，终端处理器801在执行获取候选产品对应的至少两种推荐产品参数的子推荐得分时，具体执行以下步骤：对候选产品领域中的专业行业数据进行专业分析研判，计算候选产品对应的专业研判推荐参数的子推荐得分；以及获取行为预估模型基于用户个性数据输出的候选产品对应的用户个性推荐参数的子推荐得分。

在图8所示的终端800中，用户接口803主要用于为用户提供输入的接口，获取用户输入的数据；而终端处理器801还可以用于调用存储器805中存储的产品推荐程序，并具体执行以下操作：

获取候选产品对应的至少两种推荐产品参数的子推荐得分，将各子推荐得分输入用户对应的目标产品推荐模型；

基于各候选产品对应的各子推荐得分确定满足预设推荐条件的目标候选产品作为推荐产品；

其中，目标产品推荐模型为上述任一项说明书实施例中的产品推荐模型训练方法训练并收敛的目标产品推荐模型。

在本说明书所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时，全部或部分地产生按照本说明书实施例上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中，或者通过上述计算机可读存储介质进行传输。上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DigitalSubscriber Line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，数字多功能光盘(DigitalVersatile Disc，DVD))、或者半导体介质(例如，固态硬盘(Solid State Disk，SSD))等。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

另外，还需要说明的是，本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本说明书中涉及的用户行为数据、专业行业数据等都是在充分授权的情况下获取的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上为对本说明书实施例所提供的一种产品推荐模型训练及产品推荐方法、装置以及存储介质的描述，对于本领域的技术人员，依据本说明书实施例的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本说明书实施例的限制。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：蚂蚁财富(上海)金融信息服务有限公司;

上一篇：基于冷链oms灯塔系统转单实现方法、装置、设备及存储介质
下一篇：用于传输具有安全加扰的有效载荷的帧的技术