掌桥专利:专业的专利平台
掌桥专利
首页

用于离线到在线建模的颗粒信号

文献发布时间:2024-04-18 19:54:45


用于离线到在线建模的颗粒信号

技术领域

本公开一般涉及使用机器学习模型生成关联。更具体地,本公开的示例方面涉及使用机器学习模型框架生成在在线活动和离线活动之间的关联。

背景技术

一些服务提供商可能会为用户或客户提供跨平台服务。在一些示例中,跨平台服务可以包括在与另一服务途径(例如,另一系统、物理服务出口等)具有受限通信的一个服务途径(例如,在线系统)上提供的服务。为了提供改进的跨平台服务,可能期望将一个途径中的活动的数据记录与另一途径中的活动的数据记录相关联。

发明内容

本公开的实施例的方面和优点将在以下描述中部分地阐述,或者可以从描述中了解,或者可以通过对实施例的实践来学习。

在一个示例方面,本公开提供了一种示例计算机实现的方法。示例方法包括由包括一个或多个处理器的计算系统接收标记的记录。在示例方法中,标记的记录包括链接的源活动和链接的目标活动。示例方法包括由计算系统使用标记的记录更新第一机器学习模型的一个或多个参数,所述第一机器学习模型被配置为输出描述与源活动相关联的目标活动的数据。示例方法包括由计算系统使用标记的记录更新第二机器学习模型的一个或多个参数,所述第二机器学习模型被配置为输出目标活动随时间的分布。

在一个示例方面,本公开提供了另一示例计算机实现的方法。示例方法包括由包括一个或多个处理器的计算系统接收源活动数据。示例方法包括由计算系统执行对与源活动数据相关的目标活动的查询。在示例方法中,执行查询包括由计算系统使用机器学习模型框架的第一机器学习模型来确定与源活动数据相关的预测目标活动。在示例方法中,执行查询包括由计算系统使用机器学习模型框架的第二机器学习模型生成目标活动的预测时间分布。示例方法包括由计算系统响应于查询而至少部分地基于预测目标活动和目标活动的预测时间分布来生成查询结果。

在一个示例方面,本公开提供了一种示例系统。示例系统包括一个或多个处理器和存储计算机可读指令的一个或多个存储器设备。在示例系统中,指令在被执行时使一个或多个处理器执行操作。在示例系统中,操作包括接收源活动数据。在示例系统中,操作包括执行对与源活动数据相关的目标活动的查询。在示例系统中,执行查询包括使用机器学习模型框架的第一机器学习模型确定与源活动数据相关的预测目标活动。在示例系统中,执行查询包括使用机器学习模型框架的第二机器学习模型生成目标活动的预测时间分布。在示例系统中,操作包括由计算系统响应于查询而至少部分地基于预测目标活动和目标活动的预测时间分布生成查询结果。

在一个示例方面,本公开提供了一种示例计算机可读介质,其存储计算机可读指令,所述计算机可读指令在被执行时使得一个或多个处理器执行操作。在示例计算机可读介质中,操作包括接收源活动数据。在示例计算机可读介质中,操作包括执行对与源活动数据相关的目标活动的查询。在示例计算机可读介质中,执行查询包括使用机器学习模型框架的第一机器学习模型确定与源活动数据相关的预测目标活动。在示例计算机可读介质中,执行查询包括使用机器学习模型框架的第二机器学习模型生成目标活动的预测时间分布。在示例计算机可读介质中,操作包括由计算系统响应于查询而至少部分地基于预测的目标活动和目标活动的预测时间分布生成查询结果。

参照以下描述和所附权利要求,将更好地理解本公开的各种实施例的这些和其它特征、方面和优点。并入本说明书并构成本说明书一部分的附图图示了本公开的示例性实施例,并且与说明书一起用于解释相关原理。

附图说明

针对本领域普通技术人员的实施例的详细讨论在说明书中阐述,其参考附图,在附图中:

图1描述了根据本公开的示例方面的用于处理数据集上的查询的示例系统;

图2描述了根据本公开的示例方面的用于处理数据集上的查询的查询处理子系统的示例性实施例;

图3描述了根据本公开的示例方面的用于处理数据集上的查询的示例处理系统;

图4描述根据本公开的示例方面的用于处理数据集上的查询的示例方法的流程图;

图5描述根据本公开的示例方面的用于处理数据集上的查询的另一示例方法的流程图;和

图6描述了根据本公开的示例方面的用于训练用于处理数据集上的查询的系统的示例方法的流程图。

在多个图上重复的参考数字旨在标识不同实现中的相同特征。

具体实施方式

通常,本公开涉及在不同于源平台的途径中将来自源平台的活动数据与目标活动相关联的技术。在一些实施例中,源活动数据可以描述与源计算系统(例如,托管服务提供商内容的系统)上的内容的交互。在一些实施例中,目标活动可以与源活动数据的主题内容相关,但是在一些场景中,源平台可能不具有对用于确定关系的目标活动的可见性。例如,源活动可以包括与在线服务的交互,而目标活动可包括访问与在线服务相关联的物理位置—在某些情况下,在线平台可能没有与指示关于任何访问的信息的物理位置进行通信。

有利的是,根据本公开的示例方面的系统和方法可使得例如服务提供商能够对源活动数据执行查询以获得描述与(例如,源自、响应于等)源活动相关联的目标活动的数据。例如,在一些实施例中,在上述场景中与在线平台相关联的服务提供商可以对在线平台上的活动数据执行查询以获得描述对物理位置的访问的数据。获取的查询结果可以包括转换标签信息(conversion label information)的集合(例如指示源活动“已被转换为”目标活动等)。在一些示例中,转换标签信息的集合可以对应于随时间的分布。例如,随时间的分布可以指示在源活动与任何随后向目标活动的转换之间的“滞后”。在一些示例中,每个滞后值(例如,从输出分布采样)对应于目标活动具有该滞后值的概率。以这种方式,例如,根据本公开的示例方面的系统和方法可以允许在源活动数据的集合上处理针对相关目标活动的查询(例如,当这样的查询结果否则可能不可用时)。

在一些实施例中,根据本公开的示例方面的系统和方法可以使用机器学习模型框架来处理源活动数据上的查询来获得上述优点。在一些实施例中,根据本公开的示例方面的系统和方法利用机器学习模型框架中的双模型结构。例如,机器学习模型框架可以包括转换模型和滞后模型。可以在一组标记的记录(诸如源活动数据和后续转换的滞后时间,被标记或以其他方式被链接为彼此对应)上训练每个模型。以这种方式,例如,机器学习模型框架可以使用标记的(例如,标签的)数据来学习使用转换模型以获得一组未标记的源活动数据上的目标活动标签信息,使用滞后模型来获得任何后续目标活动的滞后时间,并由此获得对源活动数据集合上的相关目标活动的查询的结果(例如,否则,当这样的查询结果可能不可用时)。

根据本公开的示例方面的示例系统和方法可以提供各种技术效果和益处。例如,在一些实施例中,示例系统和方法可以使能在(否则将缺乏足够的数据以返回可用查询结果的)数据受限的上下文中针对相关事件的查询的处理。可以通过例如使用本公开的机器学习模型框架来根据机器学习模型框架的一个或多个参数将一个或多个源活动事件编索引为对应于一个或多个目标活动事件来使能查询处理。

在一些实施例中,通过采用机器学习模型框架来获得源活动数据集上的转换结果和滞后结果(例如,即使在直接目标活动映射通常不可用时),示例系统和方法可允许以较少的时间、努力和/或费用(例如,计算费用)获得查询结果。例如,通过在更小的已知被编索引数据集上学习用于机器学习的模型框架的参数集,并且使用所学习得到的参数集来确定在未被编索引的源活动输入与目标活动输出之间的相关性,示例系统和方法可扩展数据库处理系统的能力以确定活动数据之间的关系(例如,在未被索引的在线和离线活动之间)。

在一些实施例中,根据本公开的示例方面的示例系统和方法可以提供存储器中(例如,数据库中)数据结构的改进的存储、管理、检索和交叉引用。例如,示例数据库可包含描述各种未标记源活动实例的真实数据(real-world data)结构。示例数据库(或另一数据库)还可以包含描述标记的活动数据实例的数据结构。基于标记的数据实例,根据本公开的示例计算系统可以学习数据结构的中间集合(例如,机器学习模型框架的所学习参数的集合)以将未标记的源活动实例映射到后续目标活动。尽管数据结构的中间集合不一定对人类观察者是可解释的(例如,可理解为可识别地表示基础真实数据),但数据结构的中间集合可操作以使执行机器学习模型的计算系统学习将未标记源活动实例集合与目标活动标签信息和/或目标活动的时间分布相关联。以这种方式,例如,否则没有与目标活动数据的结构化关系的未被编索引和/或未被分类的源活动数据可有利地由根据本公开的系统和方法查询。并且在一些实施例中,例如,数据结构的中间集合可用于提供数据库中的未被标记的源活动实例数据结构与一个或多个转换标签的关联,以使能那些数据结构的改进存储和/或检索(例如,基于一个或多个标签的被编索引的存储、基于一个或多个标签的检索等)。

在一些示例中,本公开的示例实施例的双模型框架可以特别地提供存储器中(例如,数据库中)数据结构的改进的存储、管理、检索和交叉引用。例如,通过利用用于转换标记和滞后确定的两个不同模型,机器学习模型框架可以实现允许用于本公开的重新配置、维护、故障排除和更新查询处理系统的更多选项的模块性。此外,本公开的利用双模型框架的查询处理系统可以通过用训练用于一个或多个特殊任务的替换模型来替换转换模型或滞后模型中的任一个或两者而即时(on-the-fly)配置。例如,在一些季节中,可与在其它季节中如何最佳地确定滞后不同地最佳地确定滞后。因此,双模型框架提供了高度可配置的查询处理系统,以用于处理数据库中未标记的源活动数据的查询。

在一些实施例中,例如,数据结构的中间集合可用于提供对未标记的源活动实例集上的查询的处理和执行。例如,查询可以包括获取与源活动的输入集合相关的目标活动的预测时间分布的查询。未标记的源活动实例可能不包括记录到目标活动的链接的任何值或标签。然而,有利的是,数据结构的中间集合可以将输入源活动数据映射到包含查询对象的输出数据结构:与源活动的输入集相关的目标活动的时间分布。以这种方式,例如,根据本公开的方面的示例系统和方法可以提供对输入数据集上的查询的执行和处理,即使当这种查询可能否则不可用(例如,由于数据贫乏或通信受限的实现)时。

在一些实施例中,根据本公开的示例方面的示例系统和方法可以提供确定一组未标记的源活动数据之间的相关性。例如,可以沿着源活动数据中没有标记或具有不完整标记的维度确定相关性。例如,即使当源活动数据可能缺少时间关系的完整(或任何)标记时,也可以在源活动数据上确定时间相关性。例如,在一些实施例中,源活动数据可以包括与源活动相关的时间戳(例如,日期、时间、日期和时间等),但是源活动数据可能缺少任何后续目标活动的时间戳。有利的是,根据本公开的示例方面的示例系统和方法可以提供根据任何后续目标数据(例如,针对其,可能缺少标签信息)的时间维度来确定源活动数据之间的相关性。例如,根据本公开的示例方面的示例系统和方法可以提供确定时间窗口的时间关系(例如,描述全部被确定为在给定时间窗口内已转换的源活动实例的数据,诸如计数等)。

如本文所示,本公开的示例系统和方法提供对数据存储、编索引、查询处理和结果检索的改进,这又可改进计算系统(例如,通过对先前未标记的真实数据编索引以用于查询)关联数据结构的能力,(例如,通过由于未标记数据而返回较少的空查询结果)增加计算效率,以及(例如,通过预测未标记数据的标签信息,而不是要求额外的数据收集)降低计算成本,在一些例子中。

示例系统和方法

现在参考附图,将更详细地讨论本公开的示例实施例。图1描述根据本公开的示例方面的用于处理示例查询的一个示例系统100。示例系统100包含计算系统102。计算系统102可以是一个或多个计算设备的任何类型的系统。计算设备可以是例如个人计算设备(例如,膝上型计算机或台式机)、移动计算设备(例如,智能手机或平板电脑)、游戏控制台或控制器、可穿戴计算设备、嵌入式计算设备、服务器计算设备、分布式计算设备的节点、托管在共享服务器上的虚拟实例、或任何其它类型的计算设备。在一些实施例中,计算系统102包括经由网络互连或以可互操作方式分布的多个计算设备。例如,计算系统102可以包括用于通过网络(例如,网络180)服务内容的服务器。例如,计算系统102可以包括web服务器,用于托管web内容,用于收集关于web内容的数据(例如,用于接收、监视、生成或以其他方式处理关于web内容的数据,诸如使用、下载和/或与web内容交互)。

计算系统102可包含处理器112和存储器114。一个或多个处理器112可以是任何合适的处理设备(例如,处理器核心、微处理器、ASIC、FPGA、控制器、微控制器等),并且可以是可操作地连接的一个处理器或多个处理器。存储器114可以包括一个或多个非暂时性计算机可读存储介质,诸如RAM、ROM、EEPROM、EPROM、闪存设备、磁盘等及它们的组合。存储器114可存储由处理器112执行以使计算系统102执行操作的数据116和指令118。

在一些实现中,客户端计算系统102可以存储或以其他方式实现执行机器学习模型框架的一个或多个机器学习模型。在一些实施例中,查询处理子系统120包括双模型机器学习模型框架。机器学习模型框架可以包括机器学习转换模型122(例如,具有可学习权重124)、机器学习滞后模型126(例如,具有可学习权重128)。一个或多个机器学习模型可以是或者可以另外包括各种机器学习模型,诸如神经网络(例如,深度神经网络)或其他类型的机器学习模型,包括非线性模型和/或线性模型。神经网络可以包括前馈神经网络、递归神经网络(例如,长短期记忆递归神经网络)、卷积神经网络或其他形式的神经网络。一些示例机器学习模型可以利用注意力机制,诸如自注意。例如,一些示例性机器学习模型可以包括多头自注意模型(例如,变压器模型(transformer model))。

如图1所示,示例系统100的实施例可以被配置为在源活动140(例如,包含源活动事件142)上处理关于目标活动150(例如,包含目标活动事件152)的查询130。响应于处理查询130,计算系统102可以输出查询结果160。在一些实施例中,查询结果160可以包括转换数据162(例如,根据权重124从转换模型122输出)和滞后分布164(例如,根据权重128从滞后模型126输出)。可以使用标记的记录170来处理查询130,该标记的记录170包含链接的源活动事件142’和链接的目标活动事件152’。

在一些实施例中,查询130被输入到计算系统102的输入中。例如,在一些实施例中,查询处理子系统120可被配置为处理各种查询130作为对计算系统102的输入。在一些实施例中,查询130可隐含在查询处理子系统120的结构和/或配置中。例如,查询处理子系统120可被配置为生成对目标活动的预测时间分布的查询的响应。例如,查询处理子系统120可被配置为生成对查询的响应,所述查询用于描述随后的目标活动150的定时并且与源活动140相关。

在一些实施例中,源活动140包括未标记的源活动事件142。未标记的源活动事件142可包括可描述各种现象的基本上任何种类或类型的数据的实例。通常,实例是指一组一个或多个数据值,它们被组合在一起以描述特定主体或主题。例如,实例可以是特征向量。实例可与图像数据(例如,图像的特征向量、散列图像等)相关联。实例可与测量或其他数据收集事件相关联(例如,在特定时间,或特定主体的,或使用特定装置,或从特定角度等)。在一些示例中,未标记的源活动事件的实例可指示来自源实体的通信(例如,内容项中的消息)。

实例可以与网络会话相关联,诸如与Web服务器的一组交互。在一些实施例中,实例可以与用户与web内容(例如,匿名的或标识的)的交互相关联。在一些实施例中,未标记的源活动事件142可能不包含实例的标签信息。在一些实施例中,未标记的源活动事件142可以包含一些标签信息,但是可能缺少其它标签信息。例如,未标记的源活动事件142可能缺少期望在未标记源活动事件142的集合上处理的查询的标签确定性或以其他方式响应查询。

例如,在一些实施例中,源活动事件142可包含描述源平台和/或平台上促进事件的内容项的数据。源活动事件142可包含描述用户及其在事件中的角色的数据,诸如用户与平台和/或内容项交互多长、用户在平台上采取什么动作(例如,观看了什么内容,诸如使用内容ID、是否将任何产品添加到购物车和/或是否购买了任何产品)、运送位置信息、已知或估计的用户人口统计等。在一些实施例中,源活动事件142可包含定时数据。例如,定时数据可包括事件的日期(例如,日、月、年等)、事件的持续时间、本地日历特征(例如,假日、季节、各种天/日期的传统和/或预期行为模式等)。在一些示例中,定时数据可被输入到查询处理子系统120的所有模型(例如,转换模型122和滞后模型126两者)。在一些示例中,定时数据的一个或多个元素仅被输入到滞后模型126中。

在一些实施例中,源活动事件142可以在源活动140中被匿名或以其他方式被模糊。例如,可以将源活动140以聚集方式(例如,作为聚集事件的集合)报告给计算系统102。

在一些实施例中,目标活动事件152可包括可以描述各种现象的基本上任何种类或类型的数据的实例。一般来说,实例是指一组一个或多个数据值,它们被组合在一起以描述特定主题或主题。例如,实例可以是特征向量。实例可与图像数据(例如,图像的特征向量、散列图像等)相关联。实例可与(例如,在特定时间,或特定主体的,或使用特定设备,或从特定角度等)测量或其他数据收集事件相关联。实例可与网络会话相关联,诸如与Web服务器的一组交互。在一些实施例中,实例可与用户与web内容(例如,匿名的或标识的)的交互相关联。在一些示例中,目标活动事件的实例可指示对来自源实体的通信(例如,内容项中的消息)的接收和/或响应。因此,在一些实施例中,确定与源活动数据相关的目标活动可包括估计来自源实体的通信的读取/观看状态。类似地,在一些实施例中,确定与源活动数据相关的目标活动可包括确定来自源实体的通信的接收者(例如,“第X天的商店访问者是在线通信Y的可能接收者”等)。以这种方式,例如,源活动和目标活动可包括在源平台和用户之间的通信,

在一些实施例中,目标活动事件152未被配置用于向计算系统102的传送154。例如,目标活动事件152可以是未被计算系统102可用的数据捕获的事件。目标活动事件152可以包括在与服务提供商相关联的物理位置的访问或与物理位置的其他交互。目标活动事件152可以包括用户与未被配置成通过一个或多个边界156(例如,硬件边界,诸如网络边界、防火墙等,和/或策略边界,诸如数据共享策略、数据存储策略等)传输信息的系统(例如,除了源平台之外)的交互。

查询结果160可包括例如转换数据162和滞后分布164或基于转换数据162和滞后分布164。转换数据162可以包括目标活动的集合(例如,正转换标签的计数)。在一些示例中,转换数据162包括描述与正转换(例如,正转换的较高可能性)相关联的从输入源活动140提取(例如浮置(floate))的一个或多个特征的数据。以这种方式,例如,可以在源活动140上执行一个或多个查询130以用于获得与正转换相关联的数据。

滞后分布164可以包括目标活动事件152随时间的分布。目标活动事件152的时间在某些情况下可能“滞后”于源活动事件142的时间(源活动事件142从此开始产生)。滞后分布164可以包括转换数据162中指示的目标活动的估计滞后时间的列表。在一些实施例中,分布164可以包括例如直方图。目标活动事件152的示例直方图可以包括对应于定时数据(例如,事件日期、事件时间等)的多个段(bin)。以及与该段中目标活动事件152的发生相关联的概率。在一些实施例中,段可以与段的估计计数相关联。

在一些实施例中,可以从查询处理系统120的中间输出中采样滞后分布164。例如,在一些实施例中,转换模型122输出预测的目标活动(例如,多个从源活动到目标活动的转换),滞后模型126输出目标活动的概率在多天上的分布,并且这两个输出可用于采样以获得滞后分布164。

例如,在一些实施例中,滞后分布164将转换数据162与多个时间段相关联。例如,滞后分布164可以包括数据结构,该数据结构包含用于多个时间段的条目和查询处理子系统120已经与多个时间段的相应时间段相关联的转换数据162的条目。

在一些实施例中,查询处理子系统120可被配置成使用标记的记录170处理查询130。标记的记录170可以包括例如链接的源活动事件142’和链接的目标活动事件152’(例如,分别彼此链接的事件)。源活动事件142’可以包括如上文关于源活动事件142所讨论的源活动事件。此外,源活动事件142’可包含(例如,使用标签、使用数据结构的一个或多个结构特征等)将它们链接到目标活动事件152’的数据。

在一些实施例中,标记的记录170可包括源活动140和目标活动150的子集。例如,源活动140可包括源活动事件142和链接的源活动事件142’。例如,源平台可向多个用户提供服务,仅部分用户提供该用户参与相应目标活动的任何指示。例如,在一些实施例中,登录用户集合(例如,与账户相关联的用户,诸如服务提供商的账户、源平台、源平台上的内容等)可提供未登录用户的更多信息,且已登录用户可提供关于源活动和对应的目标活动(例如,两者都与用户的用户ID相关联)的信息。在一些实施例中,用户ID与第三方系统(例如,与源平台系统不同的系统、源内容的发布者以外的方等)相关联。

在一些实施例中,查询处理子系统120可包含使用标记的记录170训练的机器学习模型框架。例如,可以使用标记的记录170分别学习(例如,设置、更新、调整、调谐等)转换模型122和滞后模型126的权重124和128。

例如,图2描述了描述推断(实线)和模型更新(虚线)数据流的查询处理子系统120的示例实施例。数据存储202可以包含源活动140和标记的记录170。在训练期间,查询处理子系统120可以在标记的记录170上执行查询(例如,查询130)以获得查询结果160。例如,转换模型122可以使用权重124(例如,转换数据162)来生成目标活动数据。滞后模型126可以使用权重128生成滞后数据(例如,滞后分布164)。在一些实施例中,转换模型122和滞后模型124的输出由采样器220采样(例如,随机采样、均匀采样等),以用于提供查询结果160(例如,包含转换数据162和滞后分布164)。

查询结果160可用于更新权重124和权重128中的一个或多个。例如,评估器222可以评估输出160,诸如确定输出查询结果160是否与标记的记录170对齐。例如,评估器222可以基于查询结果160确定目标(例如,损失、成本、分数等)。例如,评估器222可以比较查询结果160与标记的记录170,例如通过将一个或多个预测滞后分布与一个或多个测量滞后时间(例如,通过确定在链接的源活动事件142’和链接的目标活动事件152’之间的一个或多个测量时间延迟,并且与标记的记录170的预测时间延迟进行比较)和目标活动的一个或多个测量计数。以这种方式,例如,一些实施例可采用链接的目标活动事件152’来形成用于评估描述目标活动事件的预测数据的“真实(ground truth)”参考数据。

在一些实施例中,评估器确定转换模型评估223和滞后模型评估224。在一些实施例中,转换模型评估223和滞后模型评估224是相同的评估(例如,包括或包括在转换模型122和滞后模型126的目标、损失、成本、分数等中)。在一些实施例中,转换模型评估223和滞后模型评估224包括转换模型122和滞后模型126中的每一个的不同评估。例如,在一些实施例中,转换模型评估223可以基于由转换模型122输出的预测目标活动的计数和/或速率(例如,直接从转换模型122输出和/或经由采样器220采样,如图中虚线中的各种选项所示)。在一些实施例中,可相对于源活动的总量确定预测目标活动的速率(例如,目标活动-相关源活动与源活动总量的比率,诸如“转换速率”等)。例如,在一些实施例中,滞后模型评估224可以基于由滞后模型126输出的概率的分布(例如,直接从滞后模型126输出和/或经由采样器220采样,如图中虚线中的各种选项所示)。

至少部分地基于评估器222,模型更新器226可以更新权重124和/或权重128的一个或多个参数。例如,模型更新器280可以包括或执行基本上任何模型更新技术,诸如基于梯度的方法、演进方法等。在一些实施例中,模型更新器226一起更新权重124和权重128。在一些实施例中,模型更新器226实现转换模型更新227和滞后模型更新228。在一些实施例中,转换模型更新227和滞后模型更新228被独立地实现(例如,可选地一起,但可选地具有不同的评估、不同配置的模型更新技术,诸如使用不同的超参数等)。

在一些实施例中,评估器222和模型更新器226包含在计算系统102内。在一些实施例中,评估器222和/或模型更新器226在计算系统102的外部(例如,并且诸如经由网络或其他系统间通信协议连接到计算系统102)。

以这种方式,例如,可以根据本公开的示例方面来训练机器学习的模型框架以获得权重124和128,其中权重124和128可以提供针对未标记源活动140的查询的处理。例如,权重不一定对人类观察者是可解释的(例如,可解释为可认知地表示基础真实世界数据(underlying real-world data)),而是可以形成数据结构的集合,其功能是响应于对其的查询将未标记的源活动事件142与目标活动事件152的时间分布相关联。以这种方式,例如,数据结构可以用于使得能够相对于另外的未标记和未编索引的源活动事件142的改进的查询的处理。以这种方式,例如,本公开的查询处理系统和方法的示例实现可以提供扩展计算系统执行查询的能力,否则它们可能无法这样做。

图3描述根据本公开的示例实施例的示例计算系统300的框图。示例系统300包括通过网络380可通信地耦合的客户端计算系统302、服务器计算系统330和训练计算系统350。

客户端计算系统302可以是一个或多个计算设备的任何类型的系统。计算设备可以是例如个人计算设备(例如,膝上型计算机或台式机)、移动计算设备(例如,智能手机或平板电脑)、游戏控制台或控制器、可穿戴计算设备、嵌入式计算设备、服务器计算设备、分布式计算设备的节点、托管在共享服务器上的虚拟实例、或任何其它类型的计算设备。在一些实施例中,客户端计算系统302包括经由网络互连或以可互操作方式分布的多个计算设备。例如,客户端计算系统302可包括用于通过网络(例如,网络380)服务内容的服务器。例如,客户端计算系统302可包括web服务器,用于托管web内容,用于收集关于web内容的数据(例如,用于接收、监视、生成或以其他方式处理关于web内容的数据,诸如使用、下载和/或与web内容交互)。

在一些实施例中,客户端计算系统302可以与例如与源活动140相关联的服务提供商和/或源平台相关联。例如,客户端计算系统302可以是代表服务提供商托管内容的源平台。例如,客户端计算系统302可以为也与目标活动150相关联的服务提供商(例如,具有离线存在,诸如物理位置,用于促进目标活动150)托管在线内容。例如,客户端计算系统302可以托管第一方内容。源活动140可以包括与第一方内容的交互,并且可以被测量作为第一方测量收集的一部分。例如,第一方实体可以与第一方内容的发布相关联。

客户端计算系统302包括一个或多个处理器312和存储器314。一个或多个处理器312可以是任何合适的处理设备(例如,处理器核心、微处理器、ASIC、FPGA、控制器、微控制器等),并且可以是可操作地连接的一个处理器或多个处理器。存储器314可以包括一个或多个非暂时性计算机可读存储介质,诸如RAM、ROM、EEPROM、EPROM、闪存设备、磁盘等及它们的组合。存储器314可以存储由处理器312执行以使客户端计算系统302执行操作的数据316和指令318。

在一些实现中,客户端计算系统302可以存储或包括一个或多个机器学习模型320。例如,机器学习模型320可以是或者可以另外包括各种机器学习模型,诸如神经网络(例如,深度神经网络)或其他类型的机器学习模型,包括非线性模型和/或线性模型。神经网络可以包括前馈神经网络、递归神经网络(例如,长短期记忆递归神经网络)、卷积神经网络或其他形式的神经网络。一些机器学习模型可以利用注意力机制,诸如自注意力。例如,一些示例性机器学习模型可以包括多头自注意力模型(例如,变压器模型)。示例机器学习模型320包括机器学习模型框架,其包括转换模型122和滞后模型126,例如以上参考图1和2讨论的。

在一些实现中,一个或多个机器学习模型320可以通过网络380从服务器计算系统330接收,存储在客户端计算系统存储器314中,并且然后由一个或多个处理器312使用或以其他方式执行。在一些实现中,客户端计算系统302可以执行单个机器学习模型320的多个并行实例。

另外,或备选地,一个或多个机器学习模型340(其可以与机器学习模型320相同或不同)可被包括在服务器计算系统330中或以其他方式存储和执行,服务器计算系统330根据客户端-服务器关系与客户端计算系统302通信。例如,机器学习模型340可以由服务器计算系统340实现为web服务(例如,用于根据本公开的各个方面中的任一个处理源活动140上的查询的服务)的一部分。示例机器学习模型340包括机器学习模型框架,其包括转换模型122和滞后模型126,例如以上参考图1和2讨论的。因此,一个或多个机器学习模型320可以在客户端计算系统302处存储和实现,和/或一个或多个机器学习模型340可以在服务器计算系统330处存储和实现。

在一些实施例中,服务器计算系统330可以配置查询处理子系统120的双模型框架。例如,在一些实施例中,服务器计算系统330可以存储一个或多个转换模型122和/或一个或多个滞后模型126(例如,一个或多个权重124、权重128等的集合),用于替换一个或多个其它转换模型122和/或滞后模型126或使用一个或多个其它转换模型122和/或滞后模型126替换以用于查询处理子系统120的配置和/或维护。例如,在一些实施例中,一些转换模型或滞后模型可以广泛适用,而一些转换模型或滞后模型可以提供特定领域(例如,特定种类的主题活动、特定种类的目标活动等)中的改善的性能,并且服务器计算系统330可以替代和/或补充查询处理子系统120的双模型框架以改进和配置查询130的处理。

客户端计算系统302还可以包括一个或多个输入组件322,其接收输入(例如,用户输入、来自其它系统的输入等)。例如,输入组件322可以是对输入对象(例如,手指或触笔)的触摸敏感的触敏组件(例如,触敏显示屏或触摸板)。其它示例输入组件包括麦克风、键盘(例如,物理和/或图形)、网络端口(例如,无线、有线等)、通信总线等。

服务器计算系统330包括一个或多个处理器332和存储器334。一个或多个处理器332可以是任何合适的处理设备(例如,处理器核心、微处理器、ASIC、FPGA、控制器、微控制器等),并且可以是可操作地连接的一个处理器或多个处理器。存储器334可以包括一个或多个非暂时性计算机可读存储介质,诸如RAM、ROM、EEPROM、EPROM、闪存设备、磁盘等及它们的组合。存储器334可以存储由处理器332执行以使服务器计算系统330执行操作的数据336和指令338。

在一些实现中,服务器计算系统330包括或者由一个或多个服务器计算设备实现。在服务器计算系统330包括多个服务器计算设备的实例中,这样的服务器计算设备可以根据顺序计算体系结构、并行计算体系结构或其某种组合来操作。

如上所述,服务器计算系统330可以存储或以其它方式包括一个或多个机器学习模型340。示例性机器学习模型包括神经网络或其它多层非线性模型。示例神经网络包括前馈神经网络、深度神经网络、递归神经网络和卷积神经网络。一些机器学习模型可以利用注意力机制,诸如自注意。例如,一些示例性机器学习模型可以包括多头自注意模型(例如,变压器模型)。

在一些实施例中,客户端计算系统302能够访问服务器计算系统330和/或训练计算系统350不可用的信息。在一些实施例中,客户端计算系统302可以被配置为托管(host)第一方内容。第一方内容可以包括例如与客户端计算系统302的所有者、运营商和/或受益人(例如,合同受益人,诸如客户端计算系统302上的计算时间的承租人)相关联的内容。在一些实施例中,客户端计算系统302可以收集数据(例如,遥测、分析、使用统计、日志等)。关于第一方内容(例如,源活动140)的下载、查看和使用。在一些实施例中,客户端计算系统302可以收集关于与第一方内容和/或与客户端计算系统或其受益人相关的其它服务或方面的下载、观看和使用和/或链接到第一方内容和/或其它服务或方面的数据。在一些实施例中,服务器计算系统330可不具有对客户端计算系统302上的第一方内容的完全或无限制访问,或者对关于内容的观看和使用的数据的无限制访问。

在一些实施例中,客户端计算系统302和服务器计算系统330都没有对目标活动150的完全访问。例如,在一些场景中,目标活动150不是或不能完整地记录。在一些场景中,客户端计算系统302和/或服务器计算系统330不可用完整的目标活动150(或例如,描述其的数据)。然而,在一些实施例中,服务器计算系统330例如可以访问标记的记录170,标记的记录170可以可选地包括目标活动150的标记子集以及源活动140的标记子集。例如,服务器计算系统330可以与报告他们参与源活动140和目标活动150两者的多个登录用户相关联。

因此,在一些实施例中,根据本公开的示例方面,可以有利地训练一个或多个机器学习模型340以将源活动140与目标活动150相关联。例如,可以根据本公开的示例方面来训练一个或多个机器学习模型340,以学习生成源活动140和目标活动150之间的关系以获得用于获得对在源活动140上处理的查询的结果的权重集合(例如,权重124和权重128)。

客户端计算系统302和/或服务器计算系统330可以通过与通过网络380通信地耦合的训练计算系统350的交互来训练模型320和/或340。训练计算系统350可以与服务器计算系统330分开,或者可以是服务器计算系统330的一部分。

训练计算系统350包括一个或多个处理器352和存储器354。一个或多个处理器352可以是任何合适的处理器件(例如,处理器核心、微处理器、ASIC、FPGA、控制器、微控制器等),并且可以是可操作地连接的一个处理器或多个处理器。存储器354可以包括一个或多个非暂时性计算机可读存储介质,诸如RAM、ROM、EEPROM、EPROM、闪存设备、磁盘等及其组合。存储器354可以存储由处理器352执行以使训练计算系统350执行操作的数据356和指令358。在一些实现中,训练计算系统350包括一个或多个服务器计算设备或者由一个或多个服务器计算设备实现。

训练计算系统350可以包括模型训练器360,模型训练器360使用各种训练或学习技术(诸如例如,误差的反向传播)来训练存储在客户端计算系统302和/或服务器计算系统330处的机器学习模型320和/或340。例如,损失函数可以通过模型被反向传播以(例如,基于损失函数的梯度)更新模型的一个或多个参数。可以使用各种损失函数,诸如均方误差、似然损失、交叉熵损失、铰链损失和/或各种其他损失函数。梯度下降技术可用于在一个或多个训练迭代中迭代地更新参数。在某些实现中,执行错误的反向传播可以包括随时间执行截断反向传播。模型训练器360可以执行一种或多种技术(例如,权重衰减(weightdecay)、退出(dropout)等)以提高被训练的模型的能力。

特别地,模型训练器360可以基于一组训练数据362来训练机器学习模型320和/或340。训练数据362可以包括例如根据本公开的示例方面(例如,如上所述,诸如参考图1和图2)的标记的记录。

在一些实现中,训练数据362可以包括由客户端计算系统302提供或以其他方式获得的数据。因此,在这样的实现中,提供给客户端计算系统302的模型320和/或提供给服务器计算系统330的模型340可以由训练计算系统350在从客户端计算系统302接收的数据上进行训练。在一些实施例中,训练数据362包括服务器计算系统330和/或训练计算系统350不可访问的数据,除非由客户端计算系统302提供。

模型训练器360包括用于提供所需功能的计算机逻辑。模型训练器360可以以控制通用处理器的硬件、固件和/或软件来实现。例如,在一些实现中,模型训练器360包括存储在存储设备上、加载到存储器中并由一个或多个处理器执行的程序文件。在其它实现中,模型训练器360包括存储在有形计算机可读存储介质(诸如RAM、硬盘或光学或磁介质)中的一组或多组计算机可执行指令。

网络380可以是任何类型的通信网络,诸如局域网(例如,内联网)、广域网(例如,因特网)或其一些组合,并且可以包括任何数量的有线或无线链路。一般而言,网络380上的通信可以使用多种通信协议(例如TCP/IP、HTTP、SMTP、FTP)、编码或格式(例如HTML、XML)和/或保护方案(例如VPN、安全HTTP、SSL)经由任何类型的有线和/或无线连接来承载。

本说明书中描述的机器学习模型(如模型120、320、340等)可用于各种任务、应用和/或用例。在一些实现中,本公开的机器学习模型的输入可以是图像数据。机器学习模型可以处理图像数据以生成输出。作为示例,机器学习模型可以处理图像数据以产生图像识别输出(例如,图像数据的识别、图像数据的潜在嵌入、图像数据的编码表示、图像数据的散列等)。作为另一示例,机器学习模型可以处理图像数据以生成图像分割输出。作为另一示例,机器学习模型可以处理图像数据以生成图像分类输出。作为另一示例,机器学习模型可以处理图像数据以生成图像数据修改输出(例如,图像数据的改变等)。作为另一示例,机器学习模型可以处理图像数据以生成编码图像数据输出(例如,图像数据的编码和/或压缩表示等)。作为另一个示例,机器学习模型可以处理图像数据以生成放大的图像数据输出。作为另一示例,机器学习模型可以处理图像数据以生成预测输出。

在一些实现中,本公开的机器学习模型的输入可以是文本或自然语言数据。机器学习模型可以处理文本或自然语言数据以生成输出。作为一个示例,机器学习模型可以处理自然语言数据以生成语言编码输出。作为另一个示例,机器学习模型可以处理文本或自然语言数据以生成潜在文本嵌入输出。作为另一个示例,机器学习模型可以处理文本或自然语言数据以生成翻译输出。作为另一个示例,机器学习模型可以处理文本或自然语言数据以生成分类输出。作为另一个示例,机器学习模型可以处理文本或自然语言数据以生成文本分割输出。作为另一个示例,机器学习模型可以处理文本或自然语言数据以生成语义意图输出。作为另一示例,机器学习模型可以处理文本或自然语言数据以生成升级(upscaled)的文本或自然语言输出(例如,比输入文本或自然语言更高质量的文本或自然语言数据等)。作为另一个示例,机器学习模型可以处理文本或自然语言数据以生成预测输出。

在一些实现中,本公开的机器学习模型的输入可以是语音数据。机器学习模型可以处理语音数据以生成输出。作为一个示例,机器学习模型可以处理语音数据以生成语音识别输出。作为另一个示例,机器学习模型可以处理语音数据以生成语音翻译输出。作为另一个示例,机器学习模型可以处理语音数据以生成潜在嵌入输出。作为另一示例,机器学习模型可以处理语音数据以产生编码语音输出(例如,语音数据的编码和/或压缩表示等)。作为另一示例,机器学习模型可以处理语音数据以生成升级的语音输出(例如,比输入语音数据更高质量的语音数据等)。作为另一示例,机器学习模型可以处理语音数据以生成文本表示输出(例如,输入语音数据的文本表示等)。作为另一个示例,机器学习模型可以处理语音数据以生成预测输出。

在一些实现中,本公开的机器学习模型的输入可以是潜在编码数据(例如,输入的潜在空间表示等)。机器学习的模型可以处理潜在编码数据以生成输出。作为一个示例,机器学习模型可以处理潜在编码数据以生成识别输出。作为另一个示例,机器学习模型可以处理潜在编码数据以生成重构输出。作为另一个示例,机器学习模型可以处理潜在编码数据以生成搜索输出。作为另一个示例,机器学习模型可以处理潜在编码数据以生成重聚(reclustering)输出。作为另一示例,机器学习模型可以处理潜在编码数据以生成预测输出。

在一些实现中,本公开的机器学习模型的输入可以是统计数据。统计数据可以是、表示或以其他方式包括从一些其它数据源计算和/或计算的数据。机器学习模型可以处理统计数据以生成输出。例如,机器学习模型可以处理统计数据以生成识别输出。作为另一个示例,机器学习模型可以处理统计数据以生成预测输出。作为另一个示例,机器学习模型可以处理统计数据以生成分类输出。作为另一个示例,机器学习模型可以处理统计数据以生成分割输出。作为另一个示例,机器学习模型可以处理统计数据以生成可视化输出。作为另一个示例,机器学习模型可以处理统计数据以生成诊断输出。

在一些实现中,本公开的机器学习模型的输入可以是传感器数据。机器学习模型可处理传感器数据以生成输出。作为一个示例,机器学习模型可处理传感器数据以产生识别输出。作为另一个示例,机器学习模型可以处理传感器数据以生成预测输出。作为另一个示例,机器学习的模型可以处理传感器数据以生成分类输出。作为另一个示例,机器学习的模型可以处理传感器数据以生成分割输出。作为另一个示例,机器学习的模型可处理传感器数据以生成可视化输出。作为另一个示例,机器学习的模型可处理传感器数据以生成诊断输出。作为另一个示例,机器学习的模型可处理传感器数据以生成检测输出。

在某些情况下,机器学习模型可以被配置为执行包括编码输入数据以进行可靠和/或高效传输或存储(和/或相应的解码)的任务。例如,任务可以是音频压缩任务。输入可以包括音频数据,输出可以包括压缩的音频数据。在另一示例中,输入包括视觉数据(例如,一个或多个图像或视频),输出包括压缩的视觉数据,并且任务是视觉数据压缩任务。在另一示例中,任务可以包括生成输入数据(例如,输入音频或视频数据)的嵌入。

在某些情况下,输入包括视觉数据,并且任务是计算机视觉任务。在某些情况下,输入包括一个或多个图像的像素数据,并且该任务是图像处理任务。例如,图像处理任务可以是图像分类,其中输出是分数集合,每个分数对应于不同的对象类并且表示一个或多个图像描述属于对象类的对象的似然值(likelihood)。图像处理任务可以是对象检测,其中图像处理输出标识一个或多个图像中的一个或多个区域,并且对于每个区域,该区域描述感兴趣对象的似然值。作为另一示例,图像处理任务可以是图像分割,其中图像处理输出针对一个或多个图像中的每个像素定义预定类别集合中每个类别的相应似然性。例如,类别集合可以是前景和背景。作为另一个示例,类别集合可以是对象类。作为另一示例,图像处理任务可以是深度估计,其中图像处理输出针对一个或多个图像中的每个像素定义相应的深度值。作为另一示例,图像处理任务可以是运动估计,其中网络输入包括多个图像,并且图像处理输出针对输入图像之一的每个像素定义在网络输入中的图像之间的像素处描述的场景的运动。

在某些情况下,输入包括表示口语的音频数据,并且该任务是语音识别任务。输出可以包括映射到口语的文本输出。在某些情况下,任务包括加密或解密输入数据。在某些情况下,任务包括微处理器性能任务,诸如分支预测或存储器地址转换。

在一些实施例中,可以为标记任务或其他索引任务提供上述任何输入。例如,上述任何输入或其它输入可以是或包括实例,诸如未标记的实例(例如,缺少一些或全部标记,诸如缺少期望的标记)。在一些实施例中,任务是针对输入实例处理查询。输出(例如,或中间输出)可以包括将未标记的实例与指示与查询标签的关系的一个或多个值相关联的数据结构。以这种方式,例如,任务可以是索引任务,以对用于处理标签数据查询的未标记实例(例如,关于先前未与实例相关联的标签的标签数据)编索引。输出可以包括描述未标记实例和查询标签之间的关系的计数或其他总结输出。输出可以包括确定为与查询标签相关的未标记实例的检索。在一些实施例中,索引可以是瞬时的(例如,被存储以从处理针对被编索引的实例的查询中获得各种度量和/或分析并且稍后被卸载)或者被存储超过瞬态持续时间(例如,被写入磁盘等)。

图3示出了可用于实现本公开的一个示例计算系统。也可以使用其它计算系统。例如,在一些实现中,客户端计算系统102可以包括模型训练器160和训练数据集162。在这样的实现中,模型120可以在客户端计算系统102处在本地被训练和使用。在一些这样的实现中,客户端计算系统102可以实现模型训练器160以基于用户特定数据来个性化模型120。

图4描述根据本公开的示例实施例执行的示例方法400的流程图。尽管为了说明和讨论的目的,图4描述了以特定顺序执行的步骤,但是本公开的方法不限于特别示出的顺序或布置。可以在不偏离本公开的范围的情况下以各种方式省略、重排、组合和/或适配示例方法400的各个步骤。

在402,示例性方法400包括接收标记的记录。在示例方法400中,标记的记录可以包括链接的源活动和链接的目标活动。例如,标记的记录可以包括标记的记录170。

在404,示例性方法400包括使用标记的记录更新第一机器学习模型的一个或多个参数。在示例方法400中,第一机器学习模型被配置为输出描述与源活动相关联的目标活动的数据。例如,第一机器学习模型可以包括转换模型(例如,转换模型122),用于确定从源活动(例如,源平台上的活动,诸如源活动140)到相关目标活动(例如,与源活动的主题相关的另一途径中的活动)的转换。在一些实施例中,源活动数据包括描述在线活动的数据,而目标活动包括离线活动。在一些实施例中,源活动数据包括描述在线活动的数据,而目标活动包括在线活动。

在406,示例性方法400包括使用标记的记录更新第二机器学习模型的一个或多个参数。在示例方法400中,第二机器学习模型被配置为输出目标活动随时间的分布。例如,第二机器学习模型可以包括滞后模型(例如,滞后模型126),用于确定从源活动流动或以其它方式与源活动相关的目标活动的时间分布。

在示例方法400的一些实施例中,第一机器学习模型和第二机器学习模型是被配置为处理源活动数据上的查询的机器学习模型框架的一部分。例如,在一些实施例中,处理查询包括接收源活动数据。在一些实施例中,源活动数据可与链接的源活动相关联。例如,在一些实施例中,链接的源活动形成源活动数据的子集(例如,否则未链接的源活动数据的子集链接到目标活动)。在一些实施例中,源活动数据包括描述源系统上的在线活动的数据,并且与源系统的通信被限制指示在源活动数据和目标活动之间的链接。在一些实施例中,处理查询包括使用第一机器学习模型确定与源活动数据相关的预测目标活动。在一些实施例中,处理查询包括使用第二机器学习模型生成目标活动的预测时间分布。在一些实施例中,处理查询包括响应于查询至少部分地基于预测目标活动和目标活动的预测时间分布来生成查询结果。在一些实施例中,生成查询的结果包括对第二机器学习模型的输出进行采样。在一些实施例中,查询结果包括将预测的目标活动与多个时间段相关联的数据结构。

在示例方法400的一些实施例中,第一机器学习模型和第二机器学习模型使用不同的更新来训练。例如,在一些实施例中,独立于第二机器学习模型的一个或多个参数来更新第一机器学习模型的一个或多个参数。例如,在一些实施例中,更新一个或多个参数包括至少部分地基于预测目标活动的训练集合上的目标活动计数来更新第一机器学习模型的一个或多个第一参数。在一些实施例中,更新一个或多个参数包括至少部分地基于目标活动的预测时间分布来更新第二机器学习模型的一个或多个第二参数。

在示例性方法400的一些实施例中,第一机器学习模型和第二机器学习模型均接收相同的输入信号集合。在一些实施例中,对第二机器学习模型的输入包括日期(例如,除了也提供给第一机器学习模型的集合之外)。在一些实施例中,第一机器学习模型的输出被输入到第二机器学习模型。在一些实施例中,第一机器学习模型的输出包括目标活动计数。

图5描述根据本公开的示例实施例执行的示例方法500的流程图。尽管为了说明和讨论的目的,图5描述了以特定顺序执行的步骤,但是本公开的方法不限于特别示出的顺序或布置。可以在不偏离本公开的范围的情况下以各种方式省略、重排、组合和/或适配示例方法500的各个步骤。

在502,示例方法500包括接收源活动数据。在一些实施例中,源活动数据(例如,源活动140)包括描述在线活动的数据。在一些实施例中,源活动数据包括描述与第一方平台(例如,客户端计算设备302)相关联的在线活动的数据。

在504,示例方法500包括执行对与源活动数据相关的目标活动的查询。在一些实施例中,目标活动包括离线活动。在一些实施例中,查询是隐式查询(例如,在诸如查询处理子系统120的查询处理子系统的结构和/或机器学习框架中隐式)。

在506,执行查询包括使用机器学习模型框架的第一机器学习模型确定与源活动数据相关的预测目标活动。在一些实施例中,第一机器学习模型的输出包括目标活动计数(例如,目标活动事件的估计量)。

在508,执行查询包括使用机器学习模型框架的第二机器学习模型生成目标活动(例如,目标活动150)的预测时间分布。在一些实施例中,第二机器学习模型的输出包括目标活动随时间的分布(例如,概率分布)。

在510,示例性方法500包括响应于查询至少部分地基于预测目标活动和目标活动的预测时间分布来生成查询结果(例如,查询结果160)。在一些实施例中,查询结果可包括描述预测目标活动随时间的分布的数据。在一些实施例中,查询结果包括将预测的目标活动与多个时间段相关联的数据结构。在一些实施例中,生成查询结果包括对第二机器学习模型的输出进行采样。

在示例性方法500的一些实施例中,第一机器学习模型和第二机器学习模型使用不同的更新来训练。例如,在一些实施例中,更新一个或多个参数包括至少部分地基于预测目标活动的训练集合上的目标活动计数来更新第一机器学习模型的一个或多个第一参数,至少部分地基于目标活动的预测时间分布来更新第二机器学习模型的一个或多个第二参数。

在示例性方法500的一些实施例中,第一机器学习模型和第二机器学习模型均接收相同的输入信号集合。在一些实施例中,对第二机器学习模型的输入包括日期(例如,除了也提供给第一机器学习模型的集合之外)。在一些实施例中,第一机器学习模型的输出被输入到第二机器学习模型。在一些实施例中,第一机器学习模型的输出包括目标活动计数。

在示例性方法500的一些实施例中,源活动数据包括描述源系统上的在线活动的数据,并且与源系统的通信被限制指示在源活动数据和目标活动之间的链接。

图6描述根据本公开的示例实施例训练示例性机器学习模型框架(例如,训练查询处理子系统120,诸如执行示例方法400和/或500)的示例方法600的流程图。尽管为了说明和讨论的目的,图6描述了以特定顺序执行的步骤,但是本公开的方法不限于特别示出的顺序或布置。可在不偏离本公开的范围的情况下以各种方式省略、重排、组合和/或适配示例性方法600的各个步骤。

示例方法600可以包括示例方法400和/或示例方法500的任何一个或多个部分。例如,示例方法600包括在示例方法400和/或示例方法500中或在示例方法400和/或示例方法500之前。

例如,在602,示例性方法600包括接收标记的记录。在一些实施例中,标记的记录(例如,标记的记录170)可以包括源活动数据(例如,如在502处接收的)。在示例方法600中,标记的记录包括链接的源活动数据和链接的目标活动数据(例如,链接到目标活动事件的源活动数据)。

在604,示例性方法600包括对与源活动相关的目标活动执行训练查询。在示例方法600的一些实施例中,执行训练查询包括使用第一机器学习模型确定与链接的源活动数据相关的预测目标活动的训练集合。在示例方法600的一些实施例中,执行训练查询包括使用第二机器学习模型生成目标活动的训练时间分布。

在610,示例性方法600包括至少部分地基于预测目标活动的训练集合、目标活动的训练时间分布和链接的目标活动数据来更新机器学习模型框架的一个或多个参数。例如,在一些实施例中,第一机器学习模型和第二机器学习模型使用不同的更新来训练。在一些实施例中,例如,更新一个或多个参数包括至少部分地基于预测目标活动的训练集合上的目标活动计数来更新第一机器学习模型的一个或多个第一参数。在一些实施例中,例如,更新一个或多个参数包括至少部分地基于目标活动的预测时间分布来更新第二机器学习模型的一个或多个第二参数。

其他公开

此处讨论的技术是指服务器、数据库、软件应用程序和其他基于计算机的系统,以及所采取的动作和向此类系统和自此类系统发送的信息。基于计算机的系统的固有灵活性允许组件之间和组件当中任务和功能的多种可能配置、组合和划分。例如,这里讨论的过程可以使用单个设备或组件或多个设备或组件组合工作来实现。数据库和应用程序可以在单个系统上实现,或分布在多个系统上。分布式组件可以顺序运行,也可以并行运行。

虽然本主题已经相对于其各种具体示例实施例进行了详细描述,但是每个示例通过解释而非限制本公开来提供。本领域技术人员在获得对前述的理解后,可容易地产生对这样的实施例的改变、变型和等同。因此,本主题公开并不排除包含对本领域普通技术人员来说显而易见的对本主题的这样的修改、变型和/或添加。例如,作为一个实施例的一部分示出或描述的特征可与另一实施例一起使用以产生又一实施例。因此,本公开旨在涵盖此类变更、变型和等效内容。

相关技术
  • 用于在在线社交网络中向用户提供离线活动相关支持而全部促进在线社交活动和离线活动的方法、系统及计算机可读记录介质
  • 基于离线计算和在线匹配的双馈风电场概率等值建模方法
技术分类

06120116381238