导航：首页> 医学或兽医学；卫生学>行为预测模型的训练方法、行为预测方法及装置、设备

行为预测模型的训练方法、行为预测方法及装置、设备

文献发布时间：2023-06-19 10:57:17

技术领域

本公开的实施方式涉及计算机技术领域，更具体地，本公开的实施方式涉及一种行为预测模型的训练方法及装置、行为预测方法及装置、电子设备以及计算机可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着大数据的发展，了解用户的阅读偏好对推荐结果是否准确至关重要。因此，需要准确地确定所有用户对于某一个目标信息的用户行为的倾向性。

相关技术中，对针对于目标信息的用户行为的用户群体进行分析时，一般通过启发式算法和监督学习算法来计算。其中启发式算法通过人为阅读和调研大量数据，并从大量数据当中总结出规律，进而设计对应的规则引擎去完成用户群体的分析。而基于监督学习的算法，则是通过大量人工标注好的数据去学习目标信息到用户群体之间的映射关系。

发明内容

但是，相关技术中，总结出来的规则引擎难以覆盖到全部的情况，具有一定的局限性且难以复用，通过人工标注的数据学习的映射关系的准确性较低。

为此，非常需要一种改进的行为预测模型的训练方法，以便于根据训练好的行为预测模型来准确地对各个用户群体的用户行为进行预测。

在本上下文中，本公开的实施方式期望提供一种行为预测模型的训练方法、行为预测模型的训练装置、行为预测方法、行为预测装置、电子设备及计算机可读存储介质。

根据本公开的一个方面，提供一种行为预测模型的训练方法，包括：获取多个用户群体对目标信息的行为数据，并根据所述行为数据生成所述目标信息的标签组，所述标签组包括各用户群体对应的标签；将所述目标信息的特征信息输入待训练的行为预测模型，得到所述目标信息的用户行为预测数据组，所述用户行为预测数据组包括各用户群体对应的用户行为预测数据；根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态，确定所述行为预测模型的损失函数；根据所述损失函数对所述行为预测模型的模型参数进行调整，以训练所述行为预测模型。

在本公开的一种示例性实施例中，所述根据所述行为数据生成所述目标信息的标签组，包括：将所述多个用户群体对所述目标信息的行为数据进行归一化处理，得到归一化行为数据；根据所述归一化行为数据生成所述目标信息的标签组。

在本公开的一种示例性实施例中，所述将所述多个用户群体对所述目标信息的行为数据进行归一化处理，得到归一化行为数据，包括：在每个用户群体对每个样本信息的行为数据中，确定全局行为数据最大值与全局行为数据最小值；根据所述全局行为数据最大值与全局行为数据最小值，将每个用户群体对所述目标信息的行为数据进行归一化处理，得到所述归一化行为数据。

在本公开的一种示例性实施例中，在根据所述全局行为数据最大值与全局行为数据最小值，将每个用户群体对所述目标信息的行为数据进行归一化处理，得到所述归一化行为数据后，所述方法还包括：在每个用户群体对所述目标信息的行为数据中，确定局部行为数据最大值与局部行为数据最小值；根据所述局部行为数据最大值与局部行为数据最小值，对所述归一化行为数据进行再次归一化处理，以更新所述归一化行为数据。

在本公开的一种示例性实施例中，所述根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态，确定所述行为预测模型的损失函数，包括：根据所述标签组以及所述用户行为预测数据组确定期望损失项；根据所述用户行为预测数据组中多个用户群体的数据分布状态确定正则项；对所述期望损失项和所述正则项进行逻辑组合，确定所述损失函数。

在本公开的一种示例性实施例中，所述正则项包括第一正则项与第二正则项；所述根据所述用户行为预测数据组中多个用户群体的数据分布状态确定正则项，包括：根据所述多个用户群体中相邻用户群体的预测数据的分布状态确定第一正则项；根据所述多个用户群体中目标用户群体的预测数据确定第二正则项；所述目标用户群体为所述标签组中数值最大的标签所对应的用户群体。

在本公开的一种示例性实施例中，所述根据所述多个用户群体中相邻用户群体的预测数据的分布状态确定第一正则项，包括：计算所述相邻用户群体的预测数据之间的差值，并根据所述差值确定所述第一正则项。

根据本公开的一个方面，提供一种行为预测方法，包括：获取待处理信息，并获取所述待处理信息的多个特征信息；将所述多个特征信息输入至行为预测模型，对多个用户群体针对所述待处理信息的用户行为进行预测，得到所述多个用户群体对应的预测数据；其中，所述行为预测模型为根据上述任意一项所述的行为预测模型的训练方法训练得到的模型。

根据本公开的一个方面，提供一种行为预测模型的训练装置，包括：标签生成模块，用于获取多个用户群体对目标信息的行为数据，并根据所述行为数据生成所述目标信息的标签组，所述标签组包括各用户群体对应的标签；预测数据确定模块，用于将所述目标信息的特征信息输入待训练的行为预测模型，得到所述目标信息的用户行为预测数据组，所述用户行为预测数据组包括各用户群体对应的用户行为预测数据；损失函数确定模块，用于根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态，确定所述行为预测模型的损失函数；模型训练模块，用于根据所述损失函数对所述行为预测模型的模型参数进行调整，以训练所述行为预测模型。

在本公开的一种示例性实施例中，所述标签生成模块包括：归一化模块，用于将所述多个用户群体对所述目标信息的行为数据进行归一化处理，得到归一化行为数据；生成控制模块，用于根据所述归一化行为数据生成所述目标信息的标签组。

在本公开的一种示例性实施例中，所述归一化模块包括：全局数据确定模块，用于在每个用户群体对每个样本信息的行为数据中，确定全局行为数据最大值与全局行为数据最小值；归一化控制模块，用于根据所述全局行为数据最大值与全局行为数据最小值，将每个用户群体对所述目标信息的行为数据进行归一化处理，得到所述归一化行为数据。

在本公开的一种示例性实施例中，在根据所述全局行为数据最大值与全局行为数据最小值，将每个用户群体对所述目标信息的行为数据进行归一化处理，得到所述归一化行为数据后，所述装置还包括：局部数据确定模块，用于每个用户群体对所述目标信息的行为数据中，确定局部行为数据最大值与局部行为数据最小值；归一化更新模块，用于根据所述局部行为数据最大值与所述局部行为数据最小值，对所述归一化行为数据进行再次归一化处理，以更新所述归一化行为数据。

在本公开的一种示例性实施例中，所述损失函数确定模块，包括：期望损失项确定模块，用于根据所述标签组以及所述用户行为预测数据组确定期望损失项；正则项确定模块，用于根据所述预测数据组中多个用户群体的数据分布状态确定正则项；逻辑组合模块，用于对所述期望损失项和所述正则项进行逻辑组合，确定所述损失函数。

在本公开的一种示例性实施例中，所述正则项包括第一正则项与第二正则项；所述正则项确定模块包括：第一确定模块，用于根据所述多个用户群体中相邻用户群体的预测数据的分布状态确定第一正则项；第二确定模块，用于根据所述多个用户群体中目标用户群体的预测数据确定第二正则项；所述目标用户群体为所述标签组中数值最大的标签所对应的用户群体。

在本公开的一种示例性实施例中，所述第一确定模块包括：差值计算模块，用于计算所述相邻用户群体的预测数据之间的差值，并根据所述差值确定所述第一正则项。

根据本公开的一个方面，提供一种行为预测装置，包括：特征信息获取模块，用于获取待处理信息，并获取所述待处理信息的多个特征信息；预测模块，用于将所述多个特征信息输入至行为预测模型，对多个用户群体针对所述待处理信息的用户行为进行预测，得到所述多个用户群体对应的预测数据；其中，所述行为预测模型为根据上述任意一项所述的行为预测模型的训练方法训练得到的模型。

根据本公开的一个方面，提供一种电子设备，包括：处理器；以及存储器，用于存储可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的行为预测模型的训练方法或上述任意一项所述的行为预测方法。

根据本公开的一个方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任意一项所述的行为预测模型的训练方法或上述任意一项所述的行为预测方法。

根据本公开实施方式的行为预测模型的训练方法及装置、行为预测方法及装置、电子设备和计算机可读存储介质，根据用户群体对目标信息的行为数据能够生成准确的标签组，通过目标信息的特征信息以及用户行为预测数据组来完成目标信息和用户群体之间的建模，并且根据标签组、用户行为预测数据组和用户行为预测数据组中的数据分布状态来确定行为预测模型的损失函数，能够使得行为预测模型覆盖到全部情况，避免了局限性且能够进行复用，能够从多个维度使得建立的行为预测模型更符合实际应用，提高了行为预测模型的准确性和可靠性。

附图说明

通过参考附图阅读下文的详细描述，本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：

图1示意性示出了本公开实施例的应用场景的系统架构示意图。

图2示意性示出了本公开实施例中行为预测模型的训练方法的流程示意图。

图3示意性示出了本公开实施例中确定标签组的流程示意图。

图4示意性示出了本公开实施例中行为预测模型的架构示意图。

图5示意性示出了本公开实施例中确定损失函数的流程图。

图6示意性示出了本公开实施例行为预测方法的流程图。

图7示意性示出了本公开实施例的行为预测模型的训练装置的示意框图。

图8示意性示出了本公开实施例的行为预测装置的示意框图。

图9示意性示出了本公开实施例的电子设备的一种方框图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本公开的实施方式，提出了一种行为预测模型的训练方法、行为预测模型的训练装置、行为预测方法、行为预测装置、电子设备和计算机可读存储介质。

此外，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本公开的若干代表性实施方式，详细阐释本公开的原理和精神。

本发明人发现，对于启发式算法而言，总结出来的规则引擎往往难以覆盖到全部的情况，因此这类算法往往不具备很好的泛化性能，基于启发式的算法流程难以复用且会消耗大量人力。而基于监督学习的算法，难以获得高质量的标注数据，因此准确性较差。

基于上述内容，本公开的基本思想在于：以用户在系统里的行为数据替换人工设计的标签作为建模和预测用户行为的基础。

更具体地，在本公开中，获取多个用户群体对目标信息的行为数据，并根据所述行为数据生成所述目标信息的标签组，所述标签组包括各用户群体对应的标签；将所述目标信息的特征信息输入待训练的行为预测模型，得到所述目标信息的用户行为预测数据组，所述用户行为预测数据组包括各用户群体对应的用户行为预测数据；根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态，确定所述行为预测模型的损失函数；根据所述损失函数对所述行为预测模型的模型参数进行调整，以训练所述行为预测模型。因此，根据本公开的实施方式，能够提高行为预测模型的训练的精准性和可靠性。

在介绍了本公开的基本原理之后，下面具体介绍本公开的各种非限制性实施方式。

需要注意的是，下述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施方式在此方面不受任何限制。相反，本公开的实施方式可以应用于适用的任何场景。

首先参考图1，图1示出了本公开的实施方式的一个示例性应用场景的系统架构示意图。该行为预测模型的训练方法可以用于浏览商品、浏览文章、浏览视频等应用场景。如图1所示，该系统架构100包括终端101网络102和服务器103。通过服务器103对从终端101提取的多个用户群体在目标信息的平均点击率进行分析，以使得服务器对每个用户群体在目标信息的用户行为的倾向性进行预测，进而根据倾向性来为每个用户群体推荐合适的内容。本领域技术人员应该理解，图1所示的示意框架仅是本公开的实施方式可以在其中得以实现的一个示例。本公开实施方式的适用范围不受到该框架任何方面的限制。

需要说明的是，服务器103均可以是本地服务器或远程服务器，此外，服务器103还可以是其他能够提供存储功能或者处理功能的产品例如云服务器，本公开的实施方式在此不做特殊限定。服务器也可以为具有快速计算能力的终端设备或者是车载设备等组成，此处不做限定。终端101可以为智能手机、平板电脑以及电脑等任何能够产生用户行为数据的设备。

应该理解的是，本公开的应用场景中，本公开实施方式的动作可以由服务器103执行，也可以由具有计算能力的终端执行，本公开在执行主体方面不受任何限制，只要执行了本公开实施方式所公开的动作即可。此处以执行主体为服务器为例进行具体说明。

下面结合图1的应用场景，参考图2来描述根据本公开示例性实施例的行为预测模型的训练方法。需要注意的是，上述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施方式在此方面不受任何限制。相反，本公开的实施方式可以应用于适用的任何场景。

图2示出了根据本公开实施例的行为预测模型的训练方法的流程图。参照图2所示，该行为预测模型的训练方法可以包括以下步骤：

在步骤S210中，获取多个用户群体对目标信息的行为数据，并根据所述行为数据生成所述目标信息的标签组，所述标签组包括各用户群体对应的标签；

在步骤S220中，将所述目标信息的特征信息输入待训练的行为预测模型，得到所述目标信息的用户行为预测数据组，所述用户行为预测数据组包括各用户群体对应的用户行为预测数据；

在步骤S230中，根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态，确定所述行为预测模型的损失函数；

在步骤S240中，根据所述损失函数对所述行为预测模型的模型参数进行调整，以训练所述行为预测模型。

本公开实施例中的技术方案，通过目标信息的特征信息以及用户行为预测数据组来完成目标信息和用户群体之间的建模，并且根据标签组、用户行为预测数据组和用户行为预测数据组中的数据分布状态来确定行为预测模型的损失函数，能够使得行为预测模型覆盖到全部情况，避免了局限性且能够在多个场景下进行复用，使得行为预测模型更符合实际应用，提高了行为预测模型的准确性和可靠性。

接下来，结合附图对本公开实施例中的行为预测模型的训练方法进行详细地解释说明。

在步骤S210中，获取多个用户群体对目标信息的行为数据，并根据所述行为数据生成所述目标信息的标签组，所述标签组包括各用户群体对应的标签。

本公开实施例中，目标信息可以为目标平台上的任意类型的信息。目标平台可以为新闻类平台、交互类平台或者是购物类平台等等，此处以新闻类平台为例进行说明。目标信息可以为文本信息或者是图片信息等等，此处以文本信息为例进行说明。当目标平台为新闻类平台时，目标信息例如可以为新闻类平台上的任意一篇文章，例如文章1。多个用户群体指的是按照年龄分布对所有用户进行划分而确定的群体，具体划分用户群体的数量可以根据实际需求而确定。

举例而言，选取某个新闻平台上面一批有年龄信息的种子用户，根据这批种子用户的年龄分布将这批用户按照年龄分n个用户群体。其中，任意用户可以用u来表示，且

行为数据指的是各用户群体对目标信息的用户行为所产生的数据，此处的用户行为可以为阅读行为，可以表现为点击、浏览、收藏、转发、评论等操作行为，此处以点击操作实现用户行为进行说明。行为数据可用于描述各用户群体对目标信息的行为特征，且各用户群体的行为数据可以相同或不同。本公开实施例中，对于每一条目标信息，均可以获取各个用户群体针对于该目标信息的行为数据，该行为数据可以用平均点击率来表示。平均点击率指的是各用户群体对目标信息的点击率的平均值。本公开实施例中，多个用户群体对目标信息的平均点击率可以表示为如下形式：

本公开实施例中，对于目标信息而言，可以确定其多个特征信息以及行为数据。多个特征信息可以用于描述目标信息的内容，多个特征信息例如可以包括但不限于标题、关键词以及类别等。进一步可以将特征信息和行为数据按照固定的格式进行组合。

举例而言，对目标信息doc

在获取到多个用户群体对目标信息的行为数据后，可以根据多个用户群体的行为数据来生成一个标签组，该标签组中可以包括每个用户群体对应的标签，此处的标签可以用于表示行为预测模型的拟合对象，即希望输出的目标。由于未进行人工标注，因此可以将生成的标签组作为伪标注数据，从而提高标注的准确性，以便于对模型进行处理。

图3中示意性示出了确定标签组的流程图，参考图3中所示，主要包括以下步骤：

在步骤S310中，将所述多个用户群体对所述目标信息的行为数据进行归一化处理，得到归一化行为数据。

本步骤中，有些年龄段的用户群体在目标信息上的点击率数据偏高，而另一些年龄段的用户群体在目标信息上的点击率数据偏低。为了避免不同年龄段的用户群体的行为数据基准不一致的因素影响，可以对行为数据进行多次归一化处理来得到归一化行为数据。具体地，可以对同一年龄段的用户群体在多个样本信息(不同文章)上的行为数据进行归一化，实现年龄段上的归一化，从而使得在同一样本信息上不同年龄段的用户群体的行为数据是可比的，能够更加接近不同年龄段用户群体的阅读倾向情况，提高行为数据的准确性和真实性。

对多个用户群体对目标信息的行为数据进行归一化处理的具体步骤包括：在每个用户群体对每个样本信息的行为数据中，确定全局行为数据最大值与全局行为数据最小值；根据所述全局行为数据最大值与全局行为数据最小值，将每个用户群体对所述目标信息的行为数据进行归一化处理，得到所述归一化行为数据。其中，每个样本信息指的是目标平台的所有信息，例如文章1、文章2以及文章3等等。目标信息可以为多个样本信息中的任意一个。全局行为数据最大值指的是每个用户群体对多个样本信息的行为数据中数值最大的行为数据，例如从每个用户群体对文章1、文章2以及文章3的平均点击率中确定的最大值。全局行为数据最小值指的是每个用户群体对多个样本信息的行为数据中数值最小的行为数据，例如从每个用户群体对文章1、文章2以及文章3的平均点击率中确定的最小值。进一步地，可以根据全局行为数据最大值和全局行为数据最小值，对每个用户群体对目标信息的行为数据进行归一化处理，从而得到归一化行为数据，即对各用户群体在目标信息的平均点击率进行归一化处理，得到归一化点击率。此处的归一化指的是最大最小值归一化，具体可以用公式(1)来表示：

其中，

通过对行为数据进行归一化处理，能够使得用户群体的平均点击率更加贴近于该年龄段用户群体真正的阅读倾向，提高行为数据的准确性。

在得到归一化行为数据之后，由于推荐系统的因素可能导致相似主题以及语义的文章的行为数据的绝对值大小不一致的情况。因此，将在年龄段上归一化之后的归一化行为数据针对于目标信息(文章内部)再次进行归一化，以更新得到的归一化行为数据。

在更新归一化行为数据时，可以在每个用户群体对所述目标信息的行为数据中，确定局部行为数据最大值与局部行为数据最小值，进一步根据局部行为数据最大值与局部行为数据最小值，对归一化行为数据进行再次归一化处理，以更新归一化行为数据。其中，局部行为数据最小值指的是每个用户群体对目标信息的行为数据中数值最小的行为数据，即从每个用户群体对文章1的平均点击率中确定的最小值。局部行为数据最大值指的是每个用户群体对目标信息的行为数据中数值最大的行为数据，例如，从每个用户群体对文章1的平均点击率中确定的最大值。进一步地，可以根据局部行为数据最大值与局部行为数据最小值，对归一化行为数据进行再次归一化处理，以更新归一化行为数据，可以通过公式(2)进行再次归一化：

其中，

如此一来，对于目标信息而言，可以用更新后的归一化行为数据分析每个年龄段的用户群体对目标信息的阅读倾向性。

在步骤S320中，根据所述归一化行为数据生成所述目标信息的标签组。

本公开实施例中，在得到归一化行为数据之后，可以将更新后的归一化行为数据确定为各个用户群体对应的标签，从而根据各个用户群体对应的标签组成目标信息的标签组，标签组用于描述一组不同年龄段的用户群体的阅读倾向性。通过将标签组作为伪标注数据，来代表模型的拟合对象。

本公开实施例中，通过用户群体对目标信息的行为数据生成目标信息到年龄段之间的伪标注数据，并将该伪标注数据作为标签组，能够使得生成的标签组相对于人工标注的标签而言更准确，更符合实际情况。

在步骤S220中，将所述目标信息的特征信息输入待训练的行为预测模型，得到所述目标信息的用户行为预测数据组，所述用户行为预测数据组包括各用户群体对应的用户行为预测数据。

本公开实施例中，目标信息的特征信息包括但不限于关键词、标题以及类别。待训练的行为预测模型可以为各种合适的模型，此处以待训练的行为预测模型为BERT模型为例进行说明。在获取到目标信息的特征信息之后，可以将特征信息作为输入数据，输入至待训练的行为预测模型中，以使得待训练的行为预测模型对特征信息进行处理，得到目标信息的用户行为预测数据组。需要说明的是，用户行为预测数据组中可以包括每个用户群体对应的用户行为预测数据。

举例而言，可以将目标信息的特征信息以及标签组确定为待训练的行为预测模型的训练样本以进行模型训练，该训练样本的格式可以表示为

图4示意性示出了待训练的行为预测模型的架构图，参考图4中所示，可以将目标信息的特征信息作为待训练的行为预测模型的输入，通过embedding层和传输层后得到模型的输出结果，进一步通过softmax层得到最终的预测结果，该预测结果为目标信息的用户行为预测数据组。即，整个处理过程为：将目标信息的标题、关键词以及类别转换为多个文本向量，并对多个文本向量以及分隔符向量进行拼接确定输入向量，根据输入向量进行预测，得到多个用户群体在所述目标信息的用户行为预测数据。

具体而言，参考图4中所示，BERT模型的输入层中的输入由目标信息的标题、关键词以及类别，三部分通过嵌入层之后拼接所得。需要说明的是，标题、关键词以及类别等都是文本形式，模型的嵌入层要将特征信息转换成固定维度的向量，即多个文本向量，且多个文本向量与特征信息之间一一对应。然后把多个文本向量和分隔符向量进行拼接，得到一个表示目标信息的向量表示作为输入向量。

本公开实施例中，待训练的行为预测模型的输入向量可以表示为bert

进一步地，可以根据输出向量得到包括每个用户群体对应的用户行为预测数据的用户行为预测数据组。即，可以将输出向量中融合了所有特征信息的标志向量输出至softmax层进行处理，以确定得到最终的预测结果作为用户行为预测数据组。用户行为预测数据组用于描述每个年龄段的用户群体对目标信息的阅读行为的预测值。用户行为预测数据可以通过公式(3)确定：

mod el

其中，

本公开实施例中，通过目标信息的特征信息来获取目标信息的用户行为预测数据组，能够从多维度预测每个用户群体对目标信息的用户行为的倾向性，提高用户行为预测数据组的准确性，进而为模型训练提供基础。

在步骤S230中，根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态，确定所述行为预测模型的损失函数。

本公开实施例中，用户行为预测数据组中的数据分布状态用于描述用户行为预测数据组中每个用户群体的预测数据的具体状态，例如数据变化趋势，数据大小等等。进一步地，可以基于标签组和用户行为预测数据组，以及用户行为预测数据组中的数据分布状态来确定行为预测模型的损失函数，以构建行为预测模型。

图5中示意性示出了确定损失函数的流程图，参考图5中所示，主要包括以下步骤：

在步骤S510中，根据所述标签组以及所述用户行为预测数据组确定期望损失项；

在步骤S520中，根据所述用户行为预测数据组中多个用户群体的数据分布状态确定正则项；

在步骤S530中，对所述期望损失项和所述正则项进行逻辑组合，确定所述损失函数。

本公开实施例中，首先，可以根据标签组与用户行为预测数据组确定期望损失项，且期望损失项可以用于描述伪标签数据的分布值，期望损失项可用均方误差来计算。具体而言，可以计算用户行为预测数据组中，每个年龄段的用户群体的预测数据与该年龄段的用户群体的标签(更新后的归一化行为数据)之间的差值，具体可以通过公式(4)来计算期望损失项：

其次，为了让行为预测模型的预测能够更加符合客观规律，需要结合正则项来指导行为预测模型的训练。正则项用来描述正则化，正则化是指为解决过拟合而引入额外信息的过程。在机器学习的优化过程中，正则项往往被加在目标函数当中。此处的正则项可以包括第一正则项和第二正则项，且第一正则项和第二正则项的类型不同。第一正则项用于描述年龄段的变化状态。第二正则项用于描述预测准确性。本公开实施例中，可以根据用户行为预测数据组中的多个用户群体的数据分布状态来确定第一正则项以及第二正则项。

由于年龄段是连续变化的，相邻年龄段的用户群体的偏好的差异较小，而非相邻的年龄段的用户群体的偏好的差异较大。对于各个年龄段的用户群体而言，其阅读倾向性(即预测数据)应该是一个平滑变动的曲线，不会是震荡剧烈的一根波浪线。因此，在根据用户行为预测数据组中的多个用户群体的数据分布状态来确定第一正则项时，可以根据多个用户群体中相邻用户群体的预测数据的分布状态确定第一正则项。相邻用户群体可以为任意两个相邻的用户群体。可以计算用户行为预测数据组中，相邻用户群体的预测数据之间的差值，进而根据该差值来确定第一正则项，具体可以通过公式(5)来确定：

除此之外，在应用过程中还会关注倾向性最高的年龄段的用户群体的预测数据是否准确。基于此，在根据用户行为预测数据组中多个用户群体的数据分布状态确定第二正则项时，可以根据多个用户群体中目标用户群体的预测数据的评估参数来确定第二正则项，评估参数例如可以为准确性。目标用户群体指的是标签组中数值最大的标签所对应的用户群体。即，年龄段可以根据更新后的归一化行为数据中，归一化行为数据的最大值对应的年龄段。第二正则项可以为头部正则项，以根据第二正则项的预测错误的情况加大惩罚。因此，第二正则项可以根据关注倾向程度最高的年龄段的用户群体的预测数据的准确性来判断，具体可以根据公式(5)来计算：

再次，在得到第一正则项和第二正则项之后，可以按照对应的权重，对期望损失项和第一正则项、第二正则项进行逻辑组合，确定所述损失函数。逻辑组合可以为进行加法操作。行为预测模型的损失函数可以根据公式(6)确定：

loss＝0.7*l

其中，损失函数中期望损失项的权重最大，第二正则项的权重对应的权重最小。

通过图5中的技术方案，能够在期望损失项的基础上增加正则项，使得行为预测模型的损失函数更符合实际情况，提高损失函数的准确性和可靠性。

在步骤S240中，根据所述损失函数对所述行为预测模型的模型参数进行调整，以训练所述行为预测模型。

本公开实施例中，在确定行为预测模型的损失函数之后，可以根据损失函数对行为预测模型的模型参数进行调整，从而训练行为预测模型。损失函数指示预测数据应该符合的分布状态，标签组是拟合对象，即希望输出的值。行为预测模型的输出的是用户行为预测数据组，代表年龄段倾向性的分布。模型训练的具体过程可以包括：将目标信息对应的标题、关键词以及类别等多个特征信息作为模型的输入得到预测数据，将多个用户群体对目标信息的行为数据作为模型的标签，根据损失函数对行为预测模型的模型参数进行调整以进行模型训练，让行为预测模型去拟合，使行为预测模型得到的预测数据按照损失函数的权重与标签组吻合。

本公开实施例中的技术方案，能够建立目标信息的文本语义到不同年龄段的用户群体的阅读倾向性之间的映射关系的行为预测模型，并且能够通过标签组、用户行为预测数据组和用户行为预测数据组中的数据分布状态来确定损失函数，进而基于损失函数训练行为预测模型，提高模型的准确性、可靠性和稳定性。避免了相关技术中的模型的局限性，能够进行复用，增加了灵活性和应用范围。通过弱监督学习的思路，利用目标信息的标题、关键词、类别等特征信息，以及目标平台上面各个年龄段的用户群体对目标信息的行为数据，完成目标信息到年龄段对应的用户群体之间的建模，使得建立的行为预测模型能够准确融合年龄段规律，提高了模型的准确性。进一步地，增加了平滑约束以及头部约束两个正则项来生成损失函数对模型进行训练，能够使得训练得到的模型更贴近实际应用且更准确。

本公开实施例还提供了一种行为预测方法，该行为预测方法可以通过上述实施例描述的行为预测模型实现。图6中示意性示出了行为预测方法的流程图，该行为预测方法可以由服务器来执行，该服务器可以是图1中所示的服务器103。参照图6所示，该行为预测方法至少包括步骤S610至步骤S620，详细介绍如下：

在步骤S610中，获取待处理信息，并获取所述待处理信息的多个特征信息。

本公开实施例中，待处理信息可以与目标信息的类型相同，例如新闻类平台上的任意一条需要处理的文章。待处理信息的多个特征信息可以包括但不限于标题、关键词以及类别等。举例而言，可以获取终端上展示的待处理信息，例如目标平台上的文章2。进一步可以对文章2进行语义分析，得到待处理信息的标题、关键词以及类别。

在步骤S620中，将所述多个特征信息输入至行为预测模型，对多个用户群体针对所述待处理信息的用户行为进行预测，得到所述多个用户群体对应的预测数据。

本公开实施例中，可以将待处理信息对应的多个特征信息输入至根据上述实施例训练得到的行为预测模型中，以使该行为预测模型根据输入的特征信息得到每个用户群体对待处理信息的用户行为的预测数据。此处的用户行为可以为阅读行为。预测数据可以为每一个年龄段的用户群体对待处理信息的阅读行为的倾向性或倾向程度。行为预测方法不仅可以应用于新闻阅读行为的预估，还可以应用于其它方面，如进行商品推荐时的商品点击的预估等等。倾向性可以为一个介于0-1之间的数值，且倾向性与数值正相关。越接近于1则代表该年龄段的用户群体阅读该待处理信息的倾向性越高，反之，越接近于0则代表该年龄段的用户群体阅读该待处理信息的倾向性越低。

进一步地，在确定每个用户群体对待处理信息的阅读行为的倾向性后，能够基于该预测结果对每个用户群体推荐合适的信息，减少了年龄段与推荐的信息不符合不匹配的推荐情况，提高推荐的准确性和针对性，提高了用户的阅读体验和推荐效果。

接下来，参考图7对本公开示例性实施方式的行为预测模型的训练装置进行说明。如图7所示，行为预测模型的训练装置700可以包括：

标签生成模块701，用于获取多个用户群体对目标信息的行为数据，并根据所述行为数据生成所述目标信息的标签组，所述标签组包括各用户群体对应的标签；

预测数据确定模块702，用于将所述目标信息的特征信息输入待训练的行为预测模型，得到所述目标信息的用户行为预测数据组，所述用户行为预测数据组包括各用户群体对应的用户行为预测数据；

损失函数确定模块703，用于根据所述标签组、所述用户行为预测数据组以及所述用户行为预测数据组中的数据分布状态，确定所述行为预测模型的损失函数；

模型训练模块704，用于根据所述损失函数对所述行为预测模型的模型参数进行调整，以训练所述行为预测模型。

除此之外，图8示意性示出了本公开示例性实施方式的行为预测装置的框图。参考图8所示，行为预测装置800可以包括：

特征信息获取模块801，用于获取待处理信息，并获取所述待处理信息的多个特征信息；

预测模块802，用于将所述多个特征信息输入至行为预测模型，对多个用户群体针对所述待处理信息的用户行为进行预测，得到所述多个用户群体对应的预测数据；其中，所述行为预测模型为根据权利要求1-7中任意一项所述的行为预测模型的训练方法训练得到的模型。

需要说明的是，行为预测模型的训练装置的各个模块的具体细节已经在对应的行为预测模型的训练方法的步骤中进行了详细描述，行为预测装置的各个模块的具体细节已经在对应的行为预测方法的步骤中进行了详细描述，因此此处不再赘述。

下面参照图9来描述根据本公开的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图9所示，电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于：上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元109)的总线930以及显示单元940。总线930可以包括数据总线、地址总线和控制总线。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元910执行，使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如，所述处理单元910可以执行如图2或图6中所示的步骤。

存储单元920可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202，还可以进一步包括只读存储单元(ROM)9203。

存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204，这样的程序模块9205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

电子设备900也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且，电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器960通过总线930与电子设备900的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备900使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

接下来，对本公开示例性实施方式的计算机可读存储介质进行说明。

在一些可能的实施方式中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的行为预测模型的训练方法中的步骤，例如，所述处理单元可以执行如图2中所示的步骤。也可以执行如图6中所述的行为预测方法的步骤。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

根据本公开的实施方式的用于行为预测模型的训练的程序产品，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了电子设备的若干模块或子模块，但是这种划分仅仅是示意性而并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

此外，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本公开的精神和原理，但是应该理解，本公开并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘宸;
专利申请人：网易传媒科技(北京)有限公司;

上一篇：语音合成方法、装置、可读介质及电子设备
下一篇：一种基于头发张力拉拢闭合头皮伤口的纽扣式夹闭器