导航：首页> 印刷；排版机；打字机；模印机〔4〕>应用于在线大数据平台的内容分发方法及AI分析系统

应用于在线大数据平台的内容分发方法及AI分析系统

文献发布时间：2023-06-19 18:32:25

技术领域

本发明涉及大数据领域，具体而言，涉及一种应用于在线大数据平台的内容分发方法及AI分析系统。

背景技术

目前，不论是社交平台还是购物平台，均会利用大数据为用户进行匹配内容的分发，以便用户能够根据系统分发的内容产生对应的消费。而在现有技术中，针对例如社交平台或者购物平台等在线大数据平台，一般会通过预设的内容关联关系进行推荐，即将两个内容进行关联，以便能够为用户分发关联的内容，但仅能对当前用户单次操作的内容进行推荐，若用户存在多次操作，则并不能准确地为用户进行适配内容的分发。

发明内容

本发明的目的在于提供一种应用于在线大数据平台的内容分发方法及AI分析系统。

第一方面，本发明实施例提供一种应用于在线大数据平台的内容分发方法，包括：

响应于目标用户登录指定在线大数据平台的登录消息，对目标用户进行身份识别，得到目标用户在在线大数据平台的目标用户标签；

根据目标用户在线大数据平台上的多个查询指令，输出多个查询指令对应的业务场景；

根据目标用户标签和业务场景，结合预先训练的内容分发模型，为目标用户分发针对于在线大数据平台的目标内容。

第二方面，本发明实施例提供一种AI分析系统，包括服务器；服务器用于执行第一方面至少一种可能的实施方式中的方法。

相比现有技术，本发明提供的有益效果包括：采用本发明公开的应用于在线大数据平台的内容分发方法及AI分析系统，通过对目标用户进行身份识别，得到目标用户在在线大数据平台的目标用户标签；然后根据目标用户在线大数据平台上的多个查询指令，输出多个查询指令对应的业务场景；最终根据目标用户标签和业务场景，结合预先训练的内容分发模型，为目标用户分发针对于在线大数据平台的目标内容，如此设计，能够在用户存在多个查询指令的基础上，为用户定制出高适配的目标内容进行分发。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍。应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定。对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的应用于在线大数据平台的内容分发方法步骤流程示意图；

图2为本发明实施例提供的服务器的结构示意框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

请结合参阅图1，图1为本发明实施例提供的应用于在线大数据平台的内容分发方法的步骤流程示意图。

101、响应于目标用户登录指定在线大数据平台的登录消息，对目标用户进行身份识别，得到目标用户在在线大数据平台的目标用户标签。

102、根据目标用户在线大数据平台上的多个查询指令，输出多个查询指令对应的业务场景。

103、根据目标用户标签和业务场景，结合预先训练的内容分发模型，为目标用户分发针对于在线大数据平台的目标内容。

在本发明实施例中，一旦确定目标用户登陆了指定的在线大数据平台的，例如某购物平台、某社交平台等，开始对该目标用户进行身份识别，得到目标用户在在线大数据平台的目标用户标签，应当理解的是，同一个目标用户，在不同的在线大数据平台上可以适配不同的目标用户标签，以便能够更有针对性的处理后续的分发流程。然后开始收集并获取目标用户在线大数据平台上的多个查询指令，例如，在XX购物平台场景下，查询指令可以是指针对某商品的搜索，而在某社交平台的场景下，可以是指针对某话题的搜索，在此不做限定。基于多个查询指令，确定出多个查询指令对应的业务场景，应例如，在某购物平台场景下，通过用户搜索的多个针对某商品的查询指令，能够确定出对应的业务场景为对应商品所在的生活场景，最终基于该目标用户标签和业务场景，结合预先训练的内容分发模型，为目标用户分发针对于在线大数据平台的目标内容，例如，为其进行商品相关页面、短信的分发。如此设计，能够快速准确地在用户存在多个操作的基础上定制出适配用户的分发内容。

为了能够更加清楚的描述本发明实施例提供的方案，前述步骤102可以通过以下详细的步骤实现。

201、计算机设备根据在线大数据平台上的多个查询指令，获取该多个查询指令的指令向量，该指令向量表征该多个查询指令的查询内容中连续查询页面之间的区别。

在本发明实施例中，该在线大数据平台为触控屏幕或者手写板等用于采集查询指令的查询内容的设备。计算机设备能够根据该多个查询指令的查询内容，获取该查询指令的指令向量，以通过该指令向量表示上述多个查询指令的查询内容中连续查询页面之间的区别。

202、计算机设备根据表示该多个查询指令的指令树结构，获取该指令树结构的节点向量和边向量，该指令树结构中的节点表征该多个查询指令的查询内容，该指令树结构中的边表征该多个查询指令的查询内容之间的关联状态，该关联状态包括时序关联或者来源关联中的至少一种。

在本发明实施例中，计算机设备能够根据上述多个查询指令的查询内容，构建表示该多个查询指令的指令树结构，然后获取该指令树结构中表示查询指令的查询内容的节点的特征向量，得到节点向量；或者该指令树结构中表示查询指令的查询内容之间的关联状态的边的特征向量，得到边向量。

203、计算机设备根据该指令向量、该节点向量以及该边向量，获取第一分类结果和第二分类结果，该第一分类结果表征查询指令的查询内容对应的类别，该第二分类结果表征查询内容相关性对应的类别，该查询内容相关性表征两个查询指令的查询内容是否归类于同一业务场景。

在本发明实施例中，计算机设备能够根据上述指令向量、节点向量以及边向量，对查询指令的查询内容以及查询内容相关性进行分类，得到第一分类结果和第二分类结果。

204、计算机设备根据该第一分类结果和该第二分类结果，输出该多个查询指令对应的业务场景。

在本发明实施例中，计算机设备能够根据上述第一分类结果和第二分类结果，确定该多个输操作对应的业务场景，该业务场景为圆形、正方形、长方形、平行四边形等，本发明实施例对此不进行限制。

本发明实施例提供的方案，通过在节点向量和边向量的基础上引入能够准确的描述查询指令的查询内容指令向量，使得根据指令向量、节点向量以及边向量来确定查询指令对应的业务场景，能够提高对单个业务场景的识别能力。

在本发明实施例中，以由终端执行为例进行说明，还包括以下示例。

301、终端对在线大数据平台上的多个查询指令的查询内容进行解析，得到查询页面集合，该查询页面集合包括多个查询页面。

在本发明实施例中，该在线大数据平台为终端的屏幕或者该终端外接的在线大数据平台。终端能够获取根据在线大数据平台输入的多个查询指令，然后对该多个查询指令的查询内容进行解析，得到查询页面集合，该查询页面集合包括的多个查询页面为坐标点。

302、终端对于该查询页面集合中任一对连续查询页面，获取该连续查询页面之间的同源标签，该同源标签表征该连续查询页面是否归类于同一查询指令。

在本发明实施例中，终端在获取到上述查询页面集合之后，对于每组连续查询页面，终端能够提取连续查询页面的差分特征，该差分特征包括同源标签。

303、终端根据该查询页面集合中的多对连续查询页面，确定该多个查询指令的指令向量，该指令向量表征该多个查询指令的查询内容中连续查询页面之间的区别。

在本发明实施例中，终端能够确定每组连续查询页面的差分特征，然后将多对连续查询页面的差分特征，确定为该多个查询指令的指令向量，也即该指令向量包括多对连续查询页面的差分特征。

304、终端根据表示该多个查询指令的指令树结构，获取该指令树结构的节点向量和边向量，该指令树结构中的节点表征该多个查询指令的查询内容，该指令树结构中的边表征该多个查询指令的查询内容之间的关联状态，该关联状态包括时序关联或者来源关联中的至少一种。

在本发明实施例中，终端能够获取表征上述多个查询指令的指令树结构，该指令树结构可以由终端构建，也可以由终端从服务器获取，本发明实施例对此不进行限制。

以终端构建指令树结构为例，终端能够根据多个查询指令的查询内容语义信息、查询内容来源信息以及查询内容之间的关联状态，生成指令树结构中的节点，然后，根据查询内容之间的关联状态，在迹对应的节点之间生成指令树结构中的边。其中，对于任一查询指令的查询内容，与该查询内容的时序关联的其他查询指令的查询内容，以及与该查询内容的来源关联的其他查询指令的查询内容，与该查询内容有关联状态。终端能够根据查询内容之间的关联状态，为每个查询指令的查询内容确定第一数量个时序关联的查询内容，以及第二数量个来源关联的查询内容，在上述查询内容对应的节点之间生成边。

在一些实施例中，终端能够对指令树结构中的节点和边进行特征提取，得到节点向量和边向量。终端能够根据指令树结构中节点表示的查询指令的查询内容的语义特征、来源特征以及关联特征，确定节点向量。根据指令树结构中边连接的节点表示的查询指令的查询内容之间的关联状态，确定边向量。其中，关联特征表征查询指令的查询内容之间的关联状态，关联状态包括时序关联或者来源关联中的至少一种。

需要说明的是，终端能够根据业务场景识别模型来对查询指令的查询内容进行识别。该业务场景识别模型包括节点层、边层、序列层以及合并层。其中，节点层用于对指令树结构的节点向量进行处理，边层用于对指令树结构的边向量进行处理，序列层用于对指令向量进行处理，合并层用于对上述三个层的输出结果进行处理。参见下述步骤305至步骤308所示。

305、终端根据指令向量，获取多个查询指令的查询内容向量。

在一些实施例中，终端能够对指令向量进行拆分，得到多个子指令向量，该子指令向量包括至少一对连续查询页面的特征向量。然后终端对该多个子指令向量分别进行降维处理，得到多个查询指令的查询内容向量。

需要说明的是，降维处理过程是在拆分的基础上对每个段内连续查询页面的特征向量向量进行降维处理，得到查询内容的特征向量向量。拆分使用的是开始标志和结束标志。

需要说明的是，本发明实施例中为了描述方便对步骤进行了编号，该编号并不限定步骤的执行顺序，在本发明实施例中，不限制步骤304和步骤305的执行顺序。

306、终端根据该节点向量和该边向量，获取该指令树结构中节点的综合评估向量，该节点的综合评估向量包括该指令树结构中其他节点的特征向量和与该节点相连的边的特征向量。

在本发明实施例中，该节点的综合评估向量由终端确定，或者由终端从服务器获取。对于指令树结构中的任一节点，通过确定指令树结构中其他节点对于该节点的权重，与该节点相连的边对该节点的权重，然后根据上述两种权重，能够确定该节点的综合评估向量，使得该综合评估向量既包括其他节点的特征向量对该节点的影响，又考虑了相关的边的特征向量对该节点的影响。

在一些实施例中，以终端确定节点的综合评估向量为例。终端能够根据节点向量，获取第一置信度，根据边向量，获取第二置信度。然后，终端能够根据第一置信度和第二置信度，确定指令树结构中节点的综合评估向量。其中，该第一置信度表征指令树结构中两个不同节点之间的综合评估置信度，该第二置信度表征指令树结构中各边对应的综合评估置信度。通过获取第一置信度和第二置信度，然后根据上述两种置信度，来确定该节点的综合评估向量，使得该综合评估向量既包括其他节点的特征向量对该节点的影响，又考虑了相关的边的特征向量对该节点的影响。

需要说明的是，本发明实施例中为了描述方便对步骤进行了编号，该编号并不限定步骤的执行顺序，在本发明实施例中，不限制步骤305和步骤306的执行顺序。

307、终端根据该节点向量和该边向量，获取该指令树结构中边的综合评估向量，该边的综合评估向量包括该指令树结构中边连接的节点的特征向量。

在本发明实施例中，该边的综合评估向量由终端确定，或者由终端从服务器获取。对于指令树结构中的任一边，通过融合边的特征向量和边连接的节点的特征向量，能够得到边的综合评估向量，使得该综合评估向量既包括边的特征向量又包括相关的节点的特征向量。

在一些实施例中，以终端确定边的综合评估向量为例。终端能够根据节点向量，获取该指令树结构中边的中间综合评估向量，该边的中间综合评估向量包括边连接的节点的特征向量。然后，终端能够根据边向量和中间综合评估向量，确定指令树结构中边的综合评估向量。通过融合边的特征向量和边连接的节点的特征向量，能够得到边的综合评估向量，使得该综合评估向量既包括边的特征向量又包括相关的节点的特征向量。

在一些实施例中，终端能够根据一层加性网络对边的特征向量进行处理。然后终端能够确定边的中间综合评估向量。最后，确定边综合评估向量。

308、终端根据该查询内容向量、该节点的综合评估向量以及该边的综合评估向量，确定第一分类结果和第二分类结果。

在本发明实施例中，该第一分类结果表征查询指令的查询内容对应的类别，该第二分类结果表征查询内容相关性对应的类别，该查询内容相关性表征两个查询指令的查询内容是否归类于同一业务场景。终端能够根据查询内容向量、节点的综合评估向量以及边综合评估向量，对查询内容进行分类，确定该第一分类结果。终端能够根据节点的综合评估向量和边的综合评估向量，对查询内容相关性进行分类，确定第二分类结果。

在一些实施例中，终端能够采用类似于确定节点的综合评估向量的方式，确定节点的类别向量，从而根据该节点的类别向量，对节点表示的查询内容进行分类。首先，终端能够根据该查询内容向量和该节点的综合评估向量，确定节点的查询内容综合评估向量。然后，终端能够根据该节点的查询内容综合评估向量，获取第三置信度，该第三置信度表征该指令树结构中不同节点之间的综合评估置信度。然后，终端能够根据该边的综合评估向量，获取第四置信度，该第四置信度表征该指令树结构中各边对应的综合评估置信度。然后，终端能够根据该第三置信度和该第四置信度，获取该指令树结构中节点的类别向量，该节点的类别向量包括该节点表示的查询指令的查询内容的特征向量、该指令树结构中其他节点的综合评估向量和与该节点相连的边的综合评估向量。最后，终端能够根据该节点的类别向量，确定该第一分类结果。通过将查询内容向量、节点的综合评估向量以及边的综合评估向量加入计算，使得三种特征之间能够相互影响，从而能够更细致的描述刻画查询内容的特征向量，提高对单个业务场景的识别能力。

在一些实施例中，终端能够采用类似于确定边的综合评估向量的方式，确定边的类别向量，从而根据该边的类别向量，对边表示的查询内容相关性进行分类。终端确定边的类别向量的方式与确定边的综合评估向量的方式同理，不同点在于输入换成了节点的综合评估向量和边的综合评估向量，在此不再赘述。

309、终端根据第一分类结果和第二分类结果，输出多个查询指令对应的业务场景。

在本发明实施例中，终端能够根据第一分类结果和第二分类结果，确定上述多个查询指令对应的业务场景，然后输出处于标准可编辑格式的该业务场景。

本发明实施例提供业务场景识别模型的训练方法的示例，在本发明实施例中以由服务器执行为例进行说明。该方法包括以下步骤。

901、服务器将多个样本查询指令的查询内容输入业务场景识别模型，得到第一预测信息和第二预测信息，该第一预测信息用于指示该多个样本查询指令的查询内容预测的类别，该第二预测信息表征查询内容相关性预测的类别，该查询内容相关性表征两个样本查询指令的查询内容是否归类于同一业务场景。

在本发明实施例中，服务器确定第一预测信息和第二预测信息的方式与终端确定第一分类结果和第二分类结果的方式类似，在此不再赘述。

902、服务器根据该第一预测信息、该第二预测信息以及该多个样本查询指令的查询内容对应的标签业务场景，确定第一损失和第二损失，该第一损失表示预测查询内容所属类别的损失，该第二损失表征预测该查询内容相关性所属类别的损失。

在本发明实施例中，服务器能够采用串行训练的方式，进行两阶段的训练，第一阶段是指令树结构的节点向量、边向量以及指令向量的学习阶段。第二阶段是第一阶段的输出，采用联合训练的方式，结合指令向量对查询内容刻画细腻的优点和指令树结构善于捕捉查询内容相关性的优点，提升节点分类和节点间关系分类的准确率。训练目标为最小化查询内容分类的损失以及查询内容相关性分类的损失。损失函数为交叉熵，表示为查询内容的预测类别与真实类别之间的误差。由于训练数据中查询内容类别之间的样例数量不均衡，会导致出现多的查询内容类别模型训练得好，出现少的查询内容类别模型训练得不好，因此在损失函数的设计上，使用加权的交叉熵来缓解这个问题。

需要说明的是，由类别概率的中位数与类别的出现频率的比值得到，使得类别数量越多的类别，其每次回传的梯度损失会更小，而类别数量较少的类别，其每次回传的梯度损失会更大。

损失函数同样为交叉熵，表示查询内容相关性的预测类别与真实类别之间的误差，查询内容相关性指的是两个查询内容是否归类于同一个业务场景，1代表两个查询内容归类于同一个业务场景，0表示两个查询内容不归类于同一个业务场景。本发明实施例中，采用加权的交叉熵来解决样本不均衡的问题。

需要说明的是，与训练集中类别的数量成反比。由于对查询内容相关性进行分类时，负样本的数量要大于正样本的数量，通过该第二损失能够有助于模型区分查询内容是否归类于同一个类型，使得模型即使在非连接边（也即负样本）的数量远大于连接边（也即正样本）的数量的情况下，也能准确区分连接边与非连接边。

903、服务器根据该第一损失和第二损失，对该业务场景识别模型进行训练。

在本发明实施例中，服务器能够根据上述第一损失和第二损失调整业务场景识别模型的参数。在一些实施例中，服务器能够使用随机梯度下降法等优化算法来进行训练。

需要说明的是，该业务场景识别模型包括节点层、边层、序列层以及联合学习层。其中，节点层用于学习指令树结构中节点的特征向量，边层用于学习指令树结构中边的特征向量，序列层用于学习查询内容的查询页面的指令向量，联合学习层用于根据上述三个层的输出，学习查询内容的类别和查询内容相关性的类别。本发明实施例提供的方案，能够动态调整业务场景识别模型中各特征学习层单独学习时的网络层数，如调整业务场景识别模型中节点层、边层以及序列层的网络层数；还能够动态调整联合学习层的网路层数。

为了能够更加清楚的描述本发明实施例提供的方案，前述步骤103中的内分发模型可以通过以下详细的方式获取。

212、获取样本业务场景分发内容、样本用户标签的样本需求分发内容、以及样本用户标签针对样本业务场景分发内容的预置标签。

其中，业务场景分发内容可以指的是任意一种可以向用户分发的信息，该向用户分发的信息可以依附于多媒体载体上，例如网页、视频、音频等；也可以依附于实质的物理载体中，例如纸质的广告页等，本公开对此不做限制。样本业务场景分发内容可以指的是在过去的某段时间内向样本用户标签分发过的信息。

分发对象可以是人、也可以是设备等，样本用户标签可以指的是在过去的某段时间内向其分发了某些信息的对象。

需求内容可以包括分发对象（包括待分发对象或者样本用户标签）的行为信息，例如分发对象有过兴趣的内容分类信息、标签信息、商品来源信息等多维度数据，本公开对此不做限制。样本需求分发内容可以包括该样本用户标签在过去一段时间内的历史行为信息。

可以理解的是，样本用户标签的样本需求分发内容可以包括样本用户标签的一个需求内容，也可以包括多个需求内容，本公开对此不做限制。

样本用户标签针对样本业务场景分发内容的预置标签可以包括样本用户标签针对样本业务场景分发内容的点击、收藏、长时间浏览等所对应的标签，本公开对此不做限制，本领域技术人员可以根据实际需求进行设定。

214、通过第一内容分发模块对样本业务场景分发内容和样本需求分发内容进行特征抽取，以获取向样本用户标签分发样本业务场景分发内容的分发置信度，以便根据分发置信度和预置标签确定第一代价函数的参量。

其中，第一内容分发模块可以是任意一种可以完成特征提取和特征分类的网络结构，第一内容分发模块可例如包括卷积网络结构、激活网络结构、拼接网络结构和分类网络结构等。在一些实施例中，第一内容分发模块可以是深度内容分发模块，即第一内容分发模块可以包括多层次的网络（例如包括至少两层特征提取生成网络结构、至少一层特征融合内容分发模块、至少一层激活网络结构以及分类网络结构），即第一内容分发模块可以包括多层待训练的参数，例如可以是DIN网络（包括但不限于Embedding网络、由激活单元和加和池化层组成的加权网络单元、和全连接激活层（PRelu、Softmax）；也可以是粗糙内容分发模块，例如仅由MLP（多层神经网络模型）网络结构、激活网络结构等组成的内容分发模块，再例如仅由几个卷基层和分类网络结构（Softmax）组成的神经网络，本公开对第一内容分发模块的网络层次及网络结构不做限制，任意一种可以进行信息分发的网络结构均可以是本公开中的第一内容分发模块。其中，MLP是一种网络层次较少的前馈神经网络模型。

在一些实施例中，第一内容分发模块可以对样本业务场景分发内容和样本需求分发内容进行特征抽取，然后使用分类器对特征融合后的特征向量进行分类处理，以获取向样本用户标签分发样本业务场景分发内容的分发置信度，最后根据分发置信度和预置标签确定一个第一代价函数的参量。

可以理解的是，本公开中的第一代价函数仅仅是一个名称，与第二代价函数之间不存在主要和辅助的功能区别。

在另外一些实施例中，初始内容分发模型还可以包括一个Embedding网络，那么初始内容分发模型的训练方法还可以包括：通过Embedding网络对样本业务场景分发内容和样本需求分发内容分别进行特征转化，以生成样本分发内容隐语义特征和样本需求分发内容隐语义特征。

那么通过第一内容分发模块对样本业务场景分发内容和样本需求分发内容进行特征抽取，以获取向样本用户标签分发样本业务场景分发内容的分发置信度步骤可以包括：通过第一内容分发模块对样本分发内容隐语义特征和样本需求分发内容隐语义特征进行特征抽取，以获取向样本用户标签分发样本业务场景分发内容的分发置信度。

在一些实施例中，可以通过初始内容分发模型的Embedding网络对样本业务场景分发内容和样本需求分发内容分别进行特征转化，以获得低维语义向量——样本分发内容隐语义特征和样本需求分发内容隐语义特征。

可以理解的是，若样本用户标签的样本需求分发内容有多个（例如需求内容1、需求内容2、……需求内容N，N为大于或者等于1的整数），那么对应的通过Embedding网络生成的样本需求分发内容隐语义特征也会有多个，并且各个样本需求分发内容会与各个样本需求分发内容隐语义特征会存在一一对应的关系。

在一些实施例中，该第一内容分发模块可以包括该Embedding网络，也可以让Embedding网络独立于第一内容分发模块，本公开对此不做限制。

假设第一内容分发模块是DIN网络模型，那么通过第一内容分发模块对样本分发内容隐语义特征和样本需求分发内容隐语义特征进行特征抽取，然后使用分类器对特征融合后的特征向量进行分类处理，以获取向样本用户标签分发样本业务场景分发内容的分发置信度可以包括以下步骤：

确定样本需求分发内容隐语义特征相对于样本分发内容隐语义特征的激活置信度；通过激活置信度对样本需求分发内容隐语义特征进行权重赋予，以获得加权需求分发内容隐语义特征；对加权需求分发内容隐语义特征和样本分发内容隐语义特征进行融合操作，以获取待处理语义特征；对待处理语义特征进行多次全连接激活函数的调用，以获取向样本用户标签分发样本业务场景分发内容的分发置信度。

可以理解的是，因为初始内容分发模型中线性神经网络的表达力不够，所以通常需要在初始内容分发模型中增加激活函数的调用以为初始内容分发模型加入非线性因素。

在本发明实施例中，各样本需求分发内容隐语义特征（在训练过程中，可以将兴趣隐向量称之为样本需求分发内容隐语义特征）与样本分发内容隐语义特征（在训练过程中，可以将分发信息隐向量称之为样本分发内容隐语义特征）分别经过激活单元计算获得兴趣权重。在激活单元中，两组输入向量与其外积拼接后再进行两层全连接计算即可获得一个兴趣权重标量，分别作为各样本需求分发内容隐语义特征的对应的激活置信度，从而根据该激活置信度对各个样本需求分发内容隐语义特征进行加权池化，以获得加权需求分发内容隐语义特征；最后将样本分发内容隐语义特征和加权需求分发内容隐语义特征进行拼接、拉平，此后经过多层全连接层输出预测的分发置信度。

上述加权池化操作可以指的是，根据各个激活置信度对应地对各个样本需求分发内容隐语义特征进行权重赋予，然后将各个权重赋予之后的样本需求分发内容隐语义特征进行池化处理（可例如是最大值池化、平均值池化、求和池化等）。若采用求和池化处理，那么加权需求分发内容隐语义特征可以是各个样本需求分发内容隐语义特征与各个激活置信度的加权之和。

在一些实施例中，训练过程中，不仅可以通过样本用户标签的样本需求分发内容确定向样本用户标签分发样本业务场景分发内容的分发置信度，还可以结合样本用户标签的画像信息确定向样本用户标签分发样本业务场景分发内容的分发置信度。具体可以包括以下步骤：获取样本用户标签的样本用户特征；通过Embedding网络对样本用户特征进行处理，以获得样本用户隐语义特征；对加权需求分发内容隐语义特征、样本分发内容隐语义特征、以及样本用户隐语义特征进行融合操作，以获取待处理语义特征；对待处理语义特征进行多次全连接激活函数的调用，以获取向样本用户标签分发样本业务场景分发内容的分发置信度。

其中，该样本用户标签的画像信息可以用来勾画目标用户的用户特性，其核心是为用户打标签，包括但不限于用户的姓名、性别、年龄、所处位置、爱好等可以用来描述样本用户标签的信息。

在另外一些实施例中，在训练过程中，不仅可以通过样本用户标签的样本需求分发内容确定向样本用户标签分发样本业务场景分发内容的分发置信度，还可以结合样本用户标签的样本用户辅助特征确定向样本用户标签分发样本业务场景分发内容的分发置信度。具体可以包括以下步骤：获取样本用户标签点击样本业务场景分发内容的样本用户辅助特征；通过Embedding网络对样本用户辅助特征进行处理，以获得样本用户辅助隐语义特征；对加权需求分发内容隐语义特征、样本分发内容隐语义特征、以及样本用户辅助隐语义特征进行融合操作，以获取待处理语义特征；对待处理语义特征进行多次全连接激活函数的调用，以获取向样本用户标签分发样本业务场景分发内容的分发置信度。

其中，该样本用户辅助特征可以包括样本用户标签除了样本用户特征、样本需求分发内容以外的所有信息，例如可以是用户下单的时间信息、下单的位置信息等，本公开对此不做限制。

在一些实施例中，在获得分发置信度和预置标签后，可以计算分发置信度和预置标签的交叉熵损失函数，以获得第一代价函数的参量。

216、通过第二内容分发模块对样本业务场景分发内容和样本需求分发内容进行特征距离确定处理，以获取样本用户标签与样本业务场景分发内容的映射关系，以根据相关性和预置标签确定第二代价函数的参量。

第二内容分发模块可以是任意一种能够确定样本业务场景分发内容和样本需求分发内容之间的特征距离，从而确定样本用户标签和样本业务场景分发内容之间的映射关系的网络结构，该第二内容分发模块可例如包括卷积网络结构、激活网络结构、拼接网络结构和分类网络结构（softmax）中的任意一个或者多个等。

在一些实施例中，第二内容分发模块可以是深度内容分发模块，即第二内容分发模块可以包括多层次的网络（例如包括至少一层卷积网络结构、至少一层特征融合内容分发模块、至少一层激活网络结构以及分类网络结构），即第二内容分发模块可以包括多层待训练的参数，例如可以是粗糙内容分发模块，例如仅由MLP（多层感知机）网络结构、激活网络结构等组成的内容分发模块，本公开对第二内容分发模块的网络层次及网络结构不做限制，任意一种可以获取样本用户标签与样本业务场景分发内容的映射关系的网络结构均可以是本公开中的第二内容分发模块。

在另外一些实施例中，初始内容分发模型还可以包括一个Embedding网络，那么初始内容分发模型的训练方法还可以包括：通过Embedding网络对样本业务场景分发内容和样本需求分发内容分别进行特征转化，以生成样本分发内容隐语义特征和样本需求分发内容隐语义特征。那么通过第二内容分发模块对样本业务场景分发内容和样本需求分发内容进行特征距离确定处理，以获取样本用户标签与样本业务场景分发内容的映射关系，以根据相关性和预置标签确定第二代价函数的参量可以包括：通过第二内容分发模块对样本分发内容隐语义特征和样本需求分发内容隐语义特征进行特征距离确定处理，以获取样本用户标签与样本业务场景分发内容的映射关系，以根据相关性和预置标签确定第二代价函数的参量。

在一些实施例中，该第二内容分发模块可以包括该Embedding网络，也可以让Embedding网络独立于第二内容分发模块，本公开对此不做限制。

在另外一些实施例中，第一内容分发模块可以有自己对应的Embedding网络，也可以与第二内容分发模块共享一个Embedding网络，本公开对此不做限制。

在一些实施例中，第二内容分发模块的网络层次可以多于第一内容分发模块的网络层次，也可以少于第一内容分发模块的网络层次，本公开对此不做限制。

在获得样本用户标签与样本业务场景分发内容的映射关系后，可以计算样本用户标签与样本业务场景分发内容的映射关系与预置标签之间的交叉熵损失函数，以获得第二代价函数的参量。

218、根据第一代价函数的参量和第二代价函数的参量将初始内容分发模型训练为内容分发模型。

在一些实施例中，可以将第一代价函数的参量与第二代价函数的参量相加，以获取一个终极损失函数的参量，然后根据该终极损失函数的参量反向训练初始内容分发模型，待达到一定的训练次数或者初始内容分发模型的预测精度达到一定的阈值后，则完成初始内容分发模型训练，获得内容分发模型。

本公开通过在模型中引入描述内容间特征距离的第二代价函数的参量的方式，改善初始内容分发模型的预测能力。

在本发明实施例中，上述确定样本用户标签与样本业务场景分发内容的映射关系的方法可以包括以下步骤。

222、对样本分发内容隐语义特征进行粗糙特征抽取，以生成样本分发内容粗糙特征。

224、对样本需求分发内容隐语义特征进行粗糙特征抽取，以生成样本需求分发内容粗糙特征。

226、对样本分发内容粗糙特征和样本需求分发内容粗糙特征进行激活函数的调用，以获得样本分发内容粗糙目标特征和样本需求分发内容粗糙目标特征。

在本发明实施例中，可以对样本分发内容粗糙特征进行Sigmoid函数的调用（一次激活函数的调用），以获得第一激活特征；对样本分发内容粗糙特征进行标准化激活函数的调用（又一次激活函数的调用），以获得第二激活特征（例如使用进行激活函数的调用，以获得第二激活特征）；然后通过第二激活特征对第一激活特征进行门哈达码积求取，以生成样本分发内容粗糙特征。

其中，Sigmoid函数的调用可以指的是向样本分发内容粗糙特征中增加线性特征的处理方式。标准化激活函数的调用，不仅可以向样本分发内容粗糙特征中引入线性特征，还可以将样本分发内容粗糙特征归一化至0-1之间。

通过第二激活特征对第一激活特征进行门哈达码积求取可以指的是将第二激活特征和第一激活特征求哈达码积，以获得样本分发内容粗糙特征。其中，通过第二激活特征对第一激活特征进行门限处理，可以通过第二激活特征的参量对第一激活特征中的参量进行大小调整，以避免第一激活特征中产生突变和跳跃的现象。

对样本需求分发内容粗糙特征进行激活函数的调用的处理方式可以参考样本分发内容粗糙特征的激活方式，本公开对此不做限制。

228、根据样本分发内容粗糙目标特征和样本需求分发内容粗糙目标特征，确定样本用户标签与样本业务场景分发内容的映射关系。

在本发明实施例中，样本用户标签与样本业务场景分发内容的映射关系的确定可以通过如下方法完成。

将样本分发内容粗糙目标特征和样本需求分发内容粗糙目标特征进行内积运算，以获取目标特征运算值；然后将目标特征运算值进行相加，以获得样本用户标签与样本业务场景分发内容关联系数，其中关联系数用来表征样本用户标签与样本业务场景分发内容的映射关系。

其中，将样本分发内容粗糙目标特征和样本需求分发内容粗糙目标特征进行内积运算指的是对样本分发内容粗糙目标特征和样本需求分发内容粗糙目标特征进行点积处理或者数量积处理，以获得目标特征运算值。

关联系数可以用来表征样本用户标签与样本业务场景分发内容之间的相关度，若样本用户标签的样本需求分发内容与样本业务场景分发内容的映射关系很大，则该关联系数就会对应很大。例如样本用户标签的样本需求分发内容中包括收藏该样本业务场景分发内容，那么该样本用户标签就很有可能会点击该样本业务场景分发内容，那么样本用户标签与样本业务场景分发内容的相关度就会比较大，那么该关联系数也对应的会比较大。

可以理解的是，若样本用户标签的样本需求分发内容只有一个，那么对应的特征激活值也就只有一个，那么该特征激活值就可以直接作为样本用户标签与样本业务场景分发内容关联系数；若样本用户标签的样本需求分发内容由多个，那么需要将该多个样本需求分发内容对应的特征激活值相加，以获取样本用户标签与样本业务场景分发内容关联系数。

在一些实施例中，若样本用户标签包括至少一个样本需求分发内容，样本需求分发内容粗糙特征包括至少一个样本需求分发内容粗糙特征，且至少一个样本需求分发内容粗糙特征与至少一个样本需求分发内容一一对应，那么样本用户标签与样本业务场景分发内容的映射关系的确定可以通过如下方法完成：

对样本需求分发内容粗糙特征R1、R2、……RN进行褶积操作，以获得至少一个样本需求分发内容褶积特征A1、A2、……AN；利用特征距离确定单元确定各个样本需求分发内容褶积特征与样本分发内容粗糙特征之间的特征距离（其中特征距离确定单元可以采用多种计算方式，比如MLP、直接求点积等），以生成至少一个需求内容距离特征B1、B2、……BN；对各个需求内容距离特征进行融合分类（softmax）处理，以获取各个样本需求分发内容褶积特征与样本分发内容粗糙特征的相关度b1、b2、……bN；根据各个样本需求分发内容褶积特征与样本分发内容粗糙特征的相关度对各个样本需求分发内容褶积特征进行加和池化处理，以获得样本用户标签的需求内容特征；根据样本用户标签的需求内容特征和样本分发内容粗糙特征，获得样本用户标签与样本业务场景分发内容关联系数，其中关联系数用来表征样本用户标签与样本业务场景分发内容的映射关系。

其中，关联系数还可以用其它方式确定，例如注意力网络、循环神经网络模型等任意可以获取样本用户标签与样本业务场景分发内容的映射关系的网络。

在一些实施例中，当获得样本用户标签与样本业务场景分发内容的映射关系后，可以继续基于该样本用户标签与样本业务场景分发内容的映射关系确定第二代价函数的参量。

在一些实施例中，还可以通过第一内容分发模块对样本业务场景分发内容和样本需求分发内容进行特征抽取，以获得第一代价函数的参量，然后基于第一代价函数的参量和第二代价函数的参量确定一预置标签，然后基于该预置标签对初始内容分发模型进行训练。

本发明提供了一种将内容间特征距离纳入初始内容分发模型学习目标的模型改进方案，可以对第一内容分发模块（以Din模型为代表）的单一损失函数模型进行优化，通过第二内容分发模块引入描述内容间特征距离的第二代价函数，将内容间的相似性加入初始内容分发模型的学习目标中，针对性的指导内容隐向量的训练，提升隐向量准确性，进而改善模型的预测能力。

在现有的分发神经网络（例如第一内容分发模块）中，其结构复杂性非常高，除了attention（注意力）机制、池化，可能还会有多个带激活函数的全连接层，导致损失函数的参量传导至Embedding网络时对参数更新的指导性较弱。即：在现有网络模型中指导Embedding网络中的隐向量训练的目标仅有最终预测分值与训练样本的标签之间的第一代价函数的参量，此第一代价函数的参量并不能直接指导隐向量的学习；第一代价函数的运算与Embedding网络层之间往往有多层其他运算逻辑（如attention（注意力）网络、Dense网络（稠密神经网络）、RNN网络（循环神经网络）等），中间步骤和参数较多，中间参数与Embedding网络的参数同步训练，第一代价函数对Embedding网络的指导作用经中间网络被稀释。

根据链式求导机制，损失函数对参数训练的影响是逐层的，同时受到损失函数和前层参数影响，生成损失函数的位置离需要更新的参数层数越多，参数学习越容易受到前层参数的影响，降低学习效率。

因此，第一代价函数的参量会自动的对各自影响的部分逐层计算梯度，梯度决定参数更新的方向。由于逐层计算的机制，普遍认为的是第一代价函数对Embedding网络参数的影响力较小，粗糙的学习效果会被深层网络稀释，而本公开提供的第二代价函数的参量可以直接的作用于Embedding网络，对Embedding网络的指导更加直接（因此从Embedding网络到第二代价函数的确定所经历的层数少，因此第二代价函数的参量对Embedding网络的指导作用没有被稀释）。本公开提供的初始内容分发模型，通过结构优化引入了第二代价函数，使得初始内容分发模型的损失函数能够直接作用于Embedding网络，对Embedding网络获得的隐向量进行直接指导。

另外，本公开提供的第二代价函数还是一种可以描述样本用户标签与样本业务场景分发内容的映射关系的损失函数的参量，因此将该相关性加入初始内容分发模型的学习目标中，可以针对性的指导隐向量的训练，提升隐向量准确性，进而改善初始内容分发模型的预测能力。本公开提出的模型方案对内容刻画更准确，预测能力更强，且易于在现有方案的基础上进行改造。

在一些实施例中，在确定样本用户标签与样本业务场景分发内容的映射关系时，还可以结合样本用户标签的画像信息，该样本用户标签的画像信息可以用来勾画目标用户的用户特性，其核心是为用户打标签，包括但不限于用户的姓名、性别、年龄、所处位置、爱好等可以用来描述样本用户标签的信息。

在一些实施例中，可以通过以下方法结合样本用户标签的样本用户特征确定样本用户标签与样本业务场景分发内容的映射关系：获取样本用户标签的样本用户特征；通过Embedding网络对样本用户特征进行处理，以获得样本用户隐语义特征；通过第二内容分发模块对样本分发内容隐语义特征、样本需求分发内容隐语义特征和样本用户隐语义特征进行特征距离确定处理，以获取样本用户标签与样本业务场景分发内容的映射关系。

通过Embedding网络对样本用户特征进行处理可以指的是通过Embedding网络中的卷积核对样本用户特征进行褶积操作，以从样本用户特征中提取出一些粗糙画像语义特征。

在一些实施例中，在确定样本用户标签与样本业务场景分发内容的映射关系时，还可以结合样本用户标签的行为的样本用户辅助特征，该样本用户辅助特征可以包括样本用户标签除了样本用户特征、样本需求分发内容以外的所有信息，例如可以是用户下单的时间信息、下单的位置信息等，本公开对此不做限制。

在一些实施例中，可以通过以下方法结合样本用户标签的样本用户辅助特征确定样本用户标签与样本业务场景分发内容的映射关系：获取样本用户标签点击样本业务场景分发内容的样本用户辅助特征；通过Embedding网络对样本用户辅助特征进行处理，以获得样本用户辅助隐语义特征；通过第二内容分发模块对样本分发内容隐语义特征、样本需求分发内容隐语义特征和样本用户辅助隐语义特征进行特征距离确定处理，以获取样本用户标签与样本业务场景分发内容的映射关系。通过Embedding网络对样本用户辅助特征进行处理可以指的是通过Embedding网络中的卷积核对样本用户辅助特征进行褶积操作，以从样本用户辅助特征中提取出一些粗糙语义特征。

本发明实施例提供一种服务器100，服务器100包括处理器及存储有计算机指令的非易失性存储器，计算机指令被处理器执行时，服务器100执行前述的应用于在线大数据平台的内容分发方法。如图2所示，图2为本发明实施例提供的服务器100的结构框图。服务器100包括存储器111、处理器112及通信单元113。

为实现数据的传输或交互，存储器111、处理器112以及通信单元113各元件相互之间直接或间接地电性连接。例如，可通过一条或多条通讯总线或信号线实现这些元件相互之间电性连接。

出于说明目的，前面的描述是参考具体实施例而进行的。但是，上述说明性论述并不打算穷举或将本公开局限于所公开的精确形式。根据上述教导，众多修改和变化都是可行的。选择并描述这些实施例是为了最佳地说明本公开的原理及其实际应用，从而使本领域技术人员最佳地利用本公开，并利用具有不同修改的各种实施例以适于预期的特定应用。出于说明目的，前面的描述是参考具体实施例而进行的。但是，上述说明性论述并不打算穷举或将本公开局限于所公开的精确形式。根据上述教导，众多修改和变化都是可行的。选择并描述这些实施例是为了最佳地说明本公开的原理及其实际应用，从而使本领域技术人员最佳地利用本公开，并利用具有不同修改的各种实施例以适于预期的特定应用。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘远祥;尚衍超;
专利申请人：山西尚衍超科技有限公司;

上一篇：一种具有定向防偏移功能的冲压检测设备
下一篇：一种鞋材成品数码喷射方法及印花机