掌桥专利:专业的专利平台
掌桥专利
首页

基于大数据线上模式的用户画像挖掘方法及机器学习系统

文献发布时间:2023-06-19 11:29:13


基于大数据线上模式的用户画像挖掘方法及机器学习系统

技术领域

本公开涉及大数据技术领域,示例性地,涉及一种基于大数据线上模式的用户画像挖掘方法及机器学习系统。

背景技术

用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。相关技术中,如何提高用户画像挖掘的精准度,是亟待思考和解决的技术问题。

发明内容

为了至少克服现有技术中的上述不足,本公开的目的在于提供一种基于大数据线上模式的用户画像挖掘方法及机器学习系统。

第一方面,本公开提供一种基于大数据线上模式的用户画像挖掘方法,应用于机器学习系统,所述机器学习系统与所述多个业务服务设备通信连接,所述方法包括:

根据所述业务服务设备的服务用户的大数据资讯服务获取每个业务互动过程对应的资讯互动行为序列,所述资讯互动行为序列包括至少两个目标互动资讯的互动行为数据,所述互动行为数据包括所述目标互动资讯每次调用目标微服务时的资讯互动行为和调用业务节点;

根据每个目标互动资讯调用所述目标微服务时的资讯互动行为,确定每个资讯互动行为序列的业务互动指标,所述业务互动指标用于表征所述资讯互动行为序列中的目标互动资讯在调用所述目标微服务时的业务兴趣度;

根据每个目标互动资讯每次调用所述目标微服务时的调用业务节点,确定每个资讯互动行为序列的业务覆盖信息;所述业务覆盖信息用于表征所述资讯互动行为序列中的目标互动资讯调用所述目标微服务的业务覆盖程度;

根据每个业务互动过程对应的资讯互动行为序列的所述业务互动指标和所述业务覆盖信息,进行业务互动过程的用户画像挖掘。

第二方面,本公开实施例还提供一种基于大数据线上模式的用户画像挖掘系统,所述基于大数据线上模式的用户画像挖掘系统包括机器学习系统以及与所述机器学习系统通信连接的多个业务服务设备;

所述机器学习系统,用于:

根据所述业务服务设备的服务用户的大数据资讯服务获取每个业务互动过程对应的资讯互动行为序列,所述资讯互动行为序列包括至少两个目标互动资讯的互动行为数据,所述互动行为数据包括所述目标互动资讯每次调用目标微服务时的资讯互动行为和调用业务节点;

根据每个目标互动资讯调用所述目标微服务时的资讯互动行为,确定每个资讯互动行为序列的业务互动指标,所述业务互动指标用于表征所述资讯互动行为序列中的目标互动资讯在调用所述目标微服务时的业务兴趣度;

根据每个目标互动资讯每次调用所述目标微服务时的调用业务节点,确定每个资讯互动行为序列的业务覆盖信息;所述业务覆盖信息用于表征所述资讯互动行为序列中的目标互动资讯调用所述目标微服务的业务覆盖程度;

根据每个业务互动过程对应的资讯互动行为序列的所述业务互动指标和所述业务覆盖信息,进行业务互动过程的用户画像挖掘。

根据上述任意一个方面,本公开通过综合多种业务互动过程的数据评估方案,如业务互动指标是基于资讯互动行为的兴趣特征对业务互动过程进行分析,业务覆盖信息则是通过用户的业务使用特征对业务互动过程进行分析,两者结合能同时整合资讯互动行为的兴趣特征和业务使用特征,提高用户画像挖掘的精准度。

附图说明

图1为本公开实施例提供的基于大数据线上模式的用户画像挖掘系统的应用场景示意图;

图2为本公开实施例提供的基于大数据线上模式的用户画像挖掘方法的流程示意图;

图3为本公开实施例提供的基于大数据线上模式的用户画像挖掘装置的功能模块示意图;

图4为本公开实施例提供的用于实现上述的基于大数据线上模式的用户画像挖掘方法的机器学习系统的结构组件示意框图。

具体实施方式

下面结合说明书附图对本公开进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。

图1是本公开一种实施例提供的基于大数据线上模式的用户画像挖掘系统10的交互示意图。基于大数据线上模式的用户画像挖掘系统10可以包括机器学习系统100以及与机器学习系统100通信连接的业务服务设备200。图1所示的基于大数据线上模式的用户画像挖掘系统10仅为一种可行的示例,在其它可行的实施例中,该基于大数据线上模式的用户画像挖掘系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。

在一种单独实施例中,基于大数据线上模式的用户画像挖掘系统10中的机器学习系统100和业务服务设备200可以通过配合执行以下方法实施例所描述的基于大数据线上模式的用户画像挖掘方法,具体机器学习系统100和业务服务设备200的执行步骤部分可以参照以下方法实施例的详细描述。

基于此,为了解决前述背景技术中的技术问题,图2为本公开实施例提供的基于大数据线上模式的用户画像挖掘方法的流程示意图,本实施例提供的基于大数据线上模式的用户画像挖掘方法可以由图1中所示的机器学习系统100执行,下面对该基于大数据线上模式的用户画像挖掘方法进行详细介绍。

步骤S110,根据业务服务设备200的服务用户的大数据资讯服务获取每个业务互动过程对应的资讯互动行为序列。

其中,资讯互动行为序列可以包括至少两个目标互动资讯的互动行为数据,互动行为数据包括目标互动资讯每次调用目标微服务时的资讯互动行为和调用业务节点。其中,互动资讯可以是指存在动态链接的资讯页面,可以包括资讯的文本内容、音视频内容和服务链接内容等,资讯互动行为可以是指用户针对该互动资讯的页面中的资讯互动,包括但不限于点赞行为、取消行为等。调用业务节点可以是指时刻点,或者逻辑上的业务互动的节点,但不限于此。

在一个独立的实施例中,步骤S110可以通过以下步骤具体实现。

步骤S111,获取各目标互动资讯的互动行为数据。其中,互动行为数据包括业务互动过程ID以及目标互动资讯每次调用目标微服务时的资讯互动行为和调用业务节点,业务互动过程ID用于指示目标互动资讯获得目标微服务的业务互动过程。

本实施例中,可以将当前亟待推广的微服务作为目标微服务,将配置有目标微服务的互动资讯作为目标互动资讯,在目标微服务的配置包内添加互动行为获取程序,如此,目标互动资讯每次调用目标微服务时,互动行为获取程序就能采集当前目标互动资讯的资讯互动行为和调用业务节点,并将采集的资讯互动行为和调用业务节点上报给服务器,同时上报给服务器的还有目标互动资讯的资讯标识和业务互动过程ID,其中,资讯标识用于唯一标识目标互动资讯,业务互动过程ID用于指示目标互动资讯中目标微服务的来源,服务器接收到互动行为获取程序上报的信息后,根据资讯标识将属于同一目标互动资讯的资讯互动行为、调用业务节点、业务互动过程ID和资讯标识汇总到对应的目标互动资讯名下,得到每个目标互动资讯的互动行为数据,这里的互动行为数据可以视为一个数据集合,数据集合中的每条数据对应目标互动资讯对目标微服务的一次调用动作。例如,目标微服务在目标互动资讯A上调用了n(n≥1的整数)次,则目标互动资讯A的互动行为数据包括n条数据。

其中,互动行为获取程序获取到的资讯互动行为具体可以包含诸多,除了上报资讯id用来标识资讯和业务互动过程id用来标识业务互动过程外,主要的特征分为以下几大类,分别是军事类、科技类、短视频类等。

步骤S112,将各目标互动资讯的互动行为数据按照业务互动过程ID进行归类,获得分别与各业务互动过程ID指示的业务互动过程对应的候选资讯互动行为序列,每个候选资讯互动行为序列包括至少两个目标互动资讯的互动行为数据,同一候选资讯互动行为序列中所有目标互动资讯具有相同的业务互动过程ID。

在获得了各目标互动资讯的互动行为数据后,可以按照互动行为数据的业务互动过程ID,对互动行为数据进行归类,即,将具有相同业务互动过程ID的互动行为数据归为同一候选资讯互动行为序列,如此,每个候选资讯互动行为序列的业务互动过程ID不相同,由于业务互动过程ID指示目标微服务的来源业务互动过程,因此不同候选资讯互动行为序列对应了不同的业务互动过程。此步骤将目标互动资讯的互动行为数据按照业务互动过程进行分类,方便后续基于目标互动资讯的互动行为特征分析各业务互动过程的细节特征。

由于如果某个业务互动过程内的资讯数量太少可能会使该业务互动指标有较大误差,因此需要过滤掉资讯数量太少的业务互动过程。因此,在步骤S112之后,还可以包括步骤S113:统计每个候选资讯互动行为序列中互动行为数据的数据量,将数据量大于等于预设阈值的候选资讯互动行为序列作为资讯互动行为序列。通过滤除数据量小于预设阈值的候选资讯互动行为序列,得到用于业务互动过程价值分析的资讯互动行为序列,可以提高后续业务互动指标计算的精准度。其中,预设阈值一般取几百到几千。

步骤S120,根据每个目标互动资讯调用目标微服务时的资讯互动行为,确定每个资讯互动行为序列的业务互动指标,业务互动指标用于表征资讯互动行为序列中的目标互动资讯在调用目标微服务时的业务兴趣度。

其中,每个资讯互动行为序列的业务互动指标包括第一业务互动指标和第二业务互动指标。在一种独立的实施例中,步骤S120具体可以包括:根据每个目标互动资讯第一次调用目标微服务时的资讯互动行为,确定每个资讯互动行为序列的第一业务互动指标;第一业务互动指标用于表征资讯互动行为序列中的目标互动资讯在配置目标微服务时的业务兴趣度;根据每个目标互动资讯在每个互动阶段内第一次调用目标微服务时的资讯互动行为,确定每个资讯互动行为序列的第二业务互动指标;第二业务互动指标用于表征资讯互动行为序列中的目标互动资讯在启用目标微服务时的业务兴趣度;将每个资讯互动行为序列的第一业务互动指标和第二业务互动指标,作为资讯互动行为序列的业务互动指标。

在一种独立实施例中,对应基于单条资讯互动行为对每个业务互动过程进行业务兴趣检测,可以包括以下步骤。

步骤S201,将每个目标互动资讯第一次调用目标微服务时的资讯互动行为作为目标互动资讯的第一资讯互动行为。

目标互动资讯第一次调用目标微服务时的资讯互动行为是指目标互动资讯配置目标微服务时的资讯互动行为。例如,对于任一目标互动资讯的互动行为数据,可以根据调用业务节点查找得到出现最早的资讯互动行为,将其作为目标互动资讯第一次调用目标微服务时的资讯互动行为。

这里只获取目标互动资讯第一次调用目标微服务时的资讯互动行为,是因为需要寻找所有目标互动资讯中资讯互动行为存在比较高的业务兴趣的互动资讯,因此每个目标互动资讯的影响因子必须是一样的。如果使用目标互动资讯每次启动目标微服务时的互动行为数据,则每个目标互动资讯的影响因子不相同,不具有可比性。

步骤S202,对每个目标互动资讯的第一资讯互动行为进行特征处理,得到与各目标互动资讯对应的第一互动行为特征。

得到每个目标互动资讯对应的第一资讯互动行为后,接下来需要选择使用哪些特征进行业务兴趣检测。由于需要满足资讯互动行为特征越业务兴趣则资讯是兴趣资讯的可能性越大这一假设,因此选择的特征需要满足在正常情况下分布较一致,在兴趣确认情况下会呈现不同特征值和特征值的组合,且这种业务兴趣特征值和特征值组合占比很小。

对第一资讯互动行为进行特征处理包括:从第一资讯互动行为中提取用于业务兴趣分析的特征,以及将提取的特征处理成可用于计算的特征向量。

在一个独立的实施例中,可以将第一资讯互动行为包含的所有类别的资讯互动行为特征分为动态特征和静态特征两大类。其中动态特征是指随着互动行为的改变而改变的特征,主要是目标互动资讯的随时可变的特征;静态特征是用户不会轻易改动的特征,主要是目标互动资讯本身的一些特征。将动态特征和静态特征作为用于业务兴趣分析的特征。进一步的,将动态特征和静态特征处理成模型可直接输入的特征向量,主要是将这些特征转化为字符串以及对数值进行整形,其中,对数值进行整形是指:根据数值落入的范围,将该范围对应的指代字符作为该数值的整形结果。

步骤S203,将各目标互动资讯的第一互动行为特征输入业务兴趣预测网络,基于业务兴趣预测网络对每个目标互动资讯的第一互动行为特征进行业务兴趣特分析,得到每个目标互动资讯的第一业务兴趣数值。

以上得到目标互动资讯的第一互动行为特征后,就可以采用业务兴趣预测网络检测业务兴趣的目标互动资讯。业务兴趣检测算法可以是孤立森林算法(IsolationForest)、一分类向量机(One-ClassSVM)、基于高斯概率密度的业务兴趣点检测(EllipticEnvelope)、基于集成学习方法业务兴趣点检测(Isolation Forest)、基于密度的局部业务兴趣因子(Local OutlierFactor)等中任一一种,或采用多种业务兴趣检测算法,对多种检测结果进行投票或集成等。

在一个独立的实施例中,可以从标注信息中随机选择n条标注基础数据,并输入一棵孤立树。对n条样本随机指定一个数据维度并根据该维度随机产生一个分裂点,该分裂点将n条样本划分为左子树和右子树两部分。对其余的数据维度继续随机指定一个维度并对子树进行划分,一直重复该过程直到叶子节点上只有一个数据即无法再分裂为止,得到了单棵孤立树。使用同样的方法得到m棵孤立树,即随机选择n个样本作为根节点,反复从树的根节点开始构建树。这些树共同组成了孤立森林,最后的结果需要综合所有树的结果共同产生。样本的业务兴趣度是通过根节点到叶子节点的路径长度确定的,因为分布稀疏的业务兴趣点通常只需简单几次分裂即可划分出,因此它们的路径长度通常较小。最终样本的业务兴趣得分如果接近1则一定是业务兴趣点,如果远小于0.5一定不是业务兴趣点。

孤立森林模型主要有3个超参数需要预先设定,分别是树的最大深度、森林中所有树的数量和每次构建树时采样的数量。本公开实施例中,树的最大深度可以设为10-100之间,或者直接不做限定;森林中所有树的数量取100-200;采样的数量取256即可,因为采样数量太多可能降低模型识别业务兴趣数据的能力。

在模型预测时,对于输入的待检数据,首先遍历所有的树分别获得其到达叶子节点的路径高度,然后计算所有高度的平均值h(x),然后得到样本业务兴趣分数值p(x,m),业务兴趣分数值越接近1说明业务兴趣概率越大。

将各目标互动资讯的第一互动行为特征输入孤立森林模型,基于孤立森林模型对每个目标互动资讯的第一互动行为特征进行业务兴趣特分析,可以得到每个目标互动资讯的模型业务兴趣分数,即第一业务兴趣数值。

步骤S204,基于每个资讯互动行为序列中目标互动资讯的总数量和第一业务兴趣数值大于第一阈值的目标互动资讯的第一业务兴趣数值,确定每个资讯互动行为序列对应的第一业务互动指标。

在得到每个目标互动资讯的第一业务兴趣数值之后,可以选择第一业务兴趣数值大于第一阈值(可以取0.8)的目标互动资讯,这些目标互动资讯可以视为疑似业务兴趣资讯。根据疑似业务兴趣资讯的第一业务兴趣数值,计算每个资讯互动行为序列中所有疑似业务兴趣资讯的总得分,然后除以该资讯互动行为序列中目标互动资讯的总数量,得到每个资讯互动行为序列的业务兴趣平均分,将该业务兴趣平均分作为第一业务互动指标,第一业务互动指标越高则业务互动过程的价值相对越高。

在一种独立的实施例中,对应基于多条资讯互动行为对业务互动过程进行业务兴趣检测,可以包括以下步骤。

步骤S301,将每个目标互动资讯在每个互动阶段内第一次调用目标微服务时对应的资讯互动行为作为第二资讯互动行为。

步骤S302,将第二资讯互动行为的数量大于等于预设数量阈值的目标互动资讯,确定为候选互动资讯。

这一部分是期望通过检测目标互动资讯前后登陆目标微服务对应的多条资讯互动行为的变化情况挖掘业务兴趣资讯,因此这里的数据过滤不是只过滤出第一次配置时的资讯互动行为,而是先对同一个目标互动资讯按周期过滤出每个周期内第一条资讯互动行为数据,作为第二资讯互动行为,然后将同一目标互动资讯的第二资讯互动行为数据做聚合。也就是说对同一目标互动资讯能够得到一条或多条第二资讯互动行为。对聚合后的同一目标互动资讯的所有第二资讯互动行为,过滤掉第二资讯互动行为的数据量小于预设数量阈值n的目标互动资讯,将第二资讯互动行为的数量大于等于n的目标互动资讯作为候选互动资讯,n为定义的阈值,可以定义为5-10,目的是降低第二资讯互动行为数量太少的资讯的特征对整体结果的影响。

步骤S303,对每个候选互动资讯的所有第二资讯互动行为进行特征处理,得到与各候选互动资讯对应的第二互动行为特征。

得到了每个候选互动资讯的所有第二资讯互动行为后,接下来需要对每个候选互动资讯的多条第二资讯互动行为进行特征处理,生成与各候选互动资讯对应的第二互动行为特征。其中,对候选互动资讯的多条第二资讯互动行为进行特征处理包括:从第二资讯互动行为中提取用于业务兴趣分析的特征,以及将提取的特征处理成可用于计算的特征向量。由于这部分检测的是多条资讯互动行为的变化情况,因此采用的特征基本都是动态特征,即随着用户行为而改变的特征。进一步的,将提取的特征处理成可用于计算的特征向量,主要是将各特征在预设时间内的变化转换为字符或数值。

步骤S304,将各候选互动资讯的第二互动行为特征输入业务兴趣预测网络,基于业务兴趣预测网络对各候选互动资讯的第二互动行为特征进行业务兴趣分析,得到每个候选互动资讯的第二业务兴趣数值。

以上得到每个资讯互动行为序列中候选互动资讯的第二互动行为特征后,就可以采用业务兴趣预测网络检测业务兴趣的目标互动资讯。本公开实施例中,采用孤立森林(Isolation Forest)算法作为业务兴趣预测网络。孤立森林算法请参考前述记载,在此不再赘述。

将各候选互动资讯的第二互动行为特征输入孤立森林模型,基于孤立森林模型对每个候选互动资讯的第二互动行为特征进行业务兴趣特分析,可以得到每个候选互动资讯的模型业务兴趣分数,即第二业务兴趣数值。

步骤S305,基于每个资讯互动行为序列中候选互动资讯的总数量和第二业务兴趣数值大于第二阈值的候选互动资讯的第二业务兴趣数值,确定每个资讯互动行为序列对应的第二业务互动指标。

在得到每个候选互动资讯的第二业务兴趣数值之后,可以选择第二业务兴趣数值大于第一阈值(可以取0.8)的候选互动资讯,这些候选互动资讯可以视为疑似业务兴趣资讯。根据疑似业务兴趣资讯的第二业务兴趣数值,计算每个资讯互动行为序列中所有疑似业务兴趣资讯的总得分,然后除以该资讯互动行为序列中候选互动资讯的总数量,得到每个资讯互动行为序列的业务兴趣平均分,将该业务兴趣平均分作为第二业务互动指标,第二业务互动指标越高则业务互动过程的价值相对越差。

步骤S130,根据每个目标互动资讯每次调用目标微服务时的调用业务节点,确定每个资讯互动行为序列的业务覆盖信息;业务覆盖信息用于表征资讯互动行为序列中的目标互动资讯调用目标微服务的业务覆盖程度。

在一种独立的实施例中,业务覆盖信息的计算方法可以包括以下步骤。

步骤S401,根据每个目标互动资讯每次调用目标微服务时的调用业务节点,统计每个资讯互动行为序列中在第一调用业务节点配置目标微服务并在第二调用业务节点启用目标微服务的目标互动资讯的数量、在第一调用业务节点配置目标微服务的目标互动资讯的数量、在第一调用业务节点和第二调用业务节点均启用目标微服务的目标互动资讯的数量以及在第一调用业务节点启用目标微服务的目标互动资讯的数量;第二调用业务节点为第一调用业务节点以后的调用业务节点。

步骤S402,根据每个资讯互动行为序列中在第一调用业务节点配置目标微服务并在第二调用业务节点启用目标微服务的目标互动资讯的数量和在第一调用业务节点配置目标微服务的目标互动资讯的数量,计算每个资讯互动行为序列对应的第一业务覆盖信息。

步骤S403,根据每个资讯互动行为序列中在第一调用业务节点和第二调用业务节点启均用目标微服务的目标互动资讯的数量和在第一调用业务节点启用目标微服务的目标互动资讯的数量,计算每个资讯互动行为序列对应的第二业务覆盖信息。

步骤S404,根据资讯互动行为序列对应的第一业务覆盖信息和第二业务覆盖信息,确定每个资讯互动行为序列对应的业务覆盖信息。

本公开实施例主要计算两种业务覆盖信息,分别是原始互动流程的业务覆盖信息和进展互动流程的业务覆盖信息。以上在第一调用业务节点配置目标微服务的目标互动资讯视为原始互动流程,在第一调用业务节点之前已配置且在第一调用业务节点启用目标微服务的目标互动资讯视为进展互动流程。原始互动流程的业务覆盖信息即第一业务覆盖信息,是指资讯互动行为序列中在第一调用业务节点配置目标微服务并在第二调用业务节点启用该目标微服务的目标互动资讯的数量占在第一调用业务节点配置目标微服务的目标互动资讯的数量的比率。进展互动流程的业务覆盖信息即第二业务覆盖信息,是指资讯互动行为序列中在第一调用业务节点和第二调用业务节点启均用目标微服务的目标互动资讯的数量占在第一调用业务节点启用目标微服务的目标互动资讯的数量的比率。

示例性的:原始互动流程的业务覆盖信息可以是指当天配置该目标微服务并在第n天仍启动了该目标微服务的资讯的数量占当天配置该目标微服务的资讯的数量的比率。这里改变n的取值,可以分业务互动过程计算互动流程的1日业务覆盖信息、3日业务覆盖信息、1周业务覆盖信息、2周业务覆盖信息、3周业务覆盖信息和1月业务覆盖信息。

进展互动流程的业务覆盖信息可以是指当天启动了该目标微服务并在第n天仍启动了该目标微服务的资讯的数量占当前启动了该目标微服务的资讯的数量的比率。这里改变n的取值,可以分业务互动过程计算互动流程的1日业务覆盖信息、3日业务覆盖信息、1周业务覆盖信息、2周业务覆盖信息、3周业务覆盖信息和1月业务覆盖信息。

对于每个资讯互动行为序列,计算每个资讯互动行为序列的第一业务覆盖信息和第二业务覆盖信息的平均值,将平均值作为该资讯互动行为序列对应的业务覆盖信息。

步骤S140,根据每个业务互动过程对应的资讯互动行为序列的业务互动指标和业务覆盖信息,进行业务互动过程的用户画像挖掘。

资讯互动行为序列的业务互动指标包括:基于单条资讯互动行为业务兴趣检测得到的第一业务互动指标和基于多条资讯互动行为业务兴趣检测得到的第二业务互动指标。在一个可能的实现方式中,根据每个业务互动过程对应的资讯互动行为序列的业务互动指标和业务覆盖信息,进行业务互动过程的用户画像挖掘可以包括以下步骤

步骤S141,对每个资讯互动行为序列的第一业务互动指标、第二业务互动指标和业务覆盖信息进行统一规则转换处理,获得第一业务互动指标对应的第一统一规则值、第二业务互动指标对应的第二统一规则值和业务覆盖信息对应的第三统一规则值。

步骤S142,获取预设的与第一业务互动指标对应的第一影响因子、与第二业务互动指标对应的第二影响因子和与业务覆盖信息对应的第三影响因子。

步骤S143,根据第一影响因子、第二影响因子和第三影响因子,对每个资讯互动行为序列的第一统一规则值、第二统一规则值和第三统一规则值进行加权计算,得到每个资讯互动行为序列的业务兴趣数值。

步骤S144,根据各业务互动过程对应的资讯互动行为序列的业务兴趣数值,进行业务互动过程的用户画像挖掘。

本实施例中,第一业务互动指标、第二业务互动指标和业务覆盖信息的数值差异可能会很大,为了整合三种方法获得的各业务互动过程的分值,来进行业务互动过程次序排列,需要将三种方法获得的分值进行统一规则转换处理,这里统一规则转换处理是指将第一业务互动指标、第二业务互动指标和业务覆盖信息按比例处理,使之落入一个特定区间。常见的统一规则转换处理方法有:min-max标准化(Min-max normalization),log函数转换,atan函数转换,z-score标准化(zero-menanormalization),模糊量化法。

在一个可能的实现方式中,可以采用标准化公式x'=(x-μ)/σ分别对第一业务互动指标、第二业务互动指标和业务覆盖信息进行统一规则转换处理,获得与第一业务互动指标对应的第一统一规则值、与第二业务互动指标对应的第二统一规则值和与业务覆盖信息对应的第三统一规则值,其中,x为待处理分值,为第一业务互动指标、第二业务互动指标或者业务覆盖信息,x'为x对应的统一规则值,μ为各资讯互动行为序列对应分值的均值,σ为各资讯互动行为序列对应分值的标准差,当x为第一业务互动指标时,μ为各资讯互动行为序列对应的第一业务互动指标的均值,σ为各资讯互动行为序列对应第一业务互动指标的标准差。

假设对第一业务互动指标m1、第二业务互动指标m2和业务覆盖信息m3进行统一规则转换处理后,获得第一业务互动指标m1的第一统一规则值m1’、第二业务互动指标m2的第二统一规则值m2’和业务覆盖信息m3对应的第三统一规则值m3’,a、b、c分别代表第一业务互动指标、第二业务互动指标、业务覆盖信息的分值的影响因子(a、b、c均大于0小于1),则资讯互动行为序列的业务兴趣数值m=a*m1’+b*m2’-c*m3’,由此可以根据业务兴趣数值m对资讯互动行为序列对应的业务互动过程进行次序排列,得到资讯互动行为序列对应的各业务互动过程的总次序排列,其中,m的分值越高则次序排列越低,其对应的业务互动过程是业务兴趣业务互动过程的可能性越大。因而,可以根据各业务互动过程对应的资讯互动行为序列的业务兴趣数值,进行业务互动过程的用户画像挖掘。其中,譬如进行业务互动过程的用户画像挖掘的方法可以是:将业务兴趣数值较高的预设数量的资讯互动行为序列所对应的业务互动过程包括业务互动标签作为挖掘的用户画像挖掘,预设数量可以是定值,也可以根据预设的业务兴趣占比和所有资讯互动行为序列的总数量计算得到;或者,计算各资讯互动行为序列的业务兴趣数值与分值最高的业务兴趣数值之间的差值,当差值小于预设的差值阈值时,将该资讯互动行为序列对应的业务互动过程包括业务互动标签作为挖掘的用户画像挖掘。

此外,得到业务互动过程总次序排列后,还可以将次序排列最高的资讯互动行为序列的包括业务互动标签作为高价值用户画像,将次序排列较低的资讯互动行为序列的包括业务互动标签作为低价值用户画像,可以针对次序排列较低的业务互动过程进行分析,比如对比分析高价值用户画像和低价值用户画像中,一天中各个时间段的目标微服务启动数的差异以及折线图的趋势变化差异,如果低价值用户画像中一天中各个时间段的目标微服务启动数基本平衡则可能存在很大的问题。同样还可以分析一周内的各天的目标微服务启动数的差异等。

在本公开实施例中,获取每个业务互动过程对应的资讯互动行为序列,每个资讯互动行为序列包括至少两个目标互动资讯的互动行为数据;根据每个目标互动资讯第一次调用目标微服务时的资讯互动行为,确定每个资讯互动行为序列的第一业务互动指标;根据每个目标互动资讯在每个互动阶段内第一次调用目标微服务时的资讯互动行为,确定每个资讯互动行为序列的第二业务互动指标;根据每个目标互动资讯每次调用目标微服务时的调用业务节点,确定每个资讯互动行为序列的业务覆盖信息;进而根据每个业务互动过程对应的资讯互动行为序列的第一业务互动指标、第二业务互动指标和业务覆盖信息,进行业务互动过程的用户画像挖掘。本公开综合了基于单条资讯互动行为业务兴趣检测的第一业务互动指标、基于多条资讯互动行为业务兴趣检测的第二业务互动指标、基于资讯互动行为上报的调用业务节点和频度规律的业务覆盖信息三种业务互动过程价值评价方法,其中,第一业务互动指标和第二业务互动指标是基于资讯互动行为的兴趣特征对业务互动过程进行分析,业务覆盖信息则是通过用户的业务使用特征对业务互动过程进行分析,两者结合能同时整合资讯互动行为的兴趣特征和业务使用特征,提高用户画像挖掘的精准度。

本公开实施例基于资讯互动行为对目标微服务的推送业务互动过程价值做排序,最终的业务互动过程排序结果综合了基于单条资讯互动行为业务兴趣检测结果、基于多条资讯互动行为业务兴趣检测结果、业务覆盖信息三种业务互动过程的次序排列结果。不仅能输出业务互动过程的次序排列,而且能输出各业务互动过程的加权汇总得分,辅助对业务互动过程价值做更近一步的判断。对识别出低价值的推送业务互动过程,可以在二次分析后决定是否减少或停止对这些低价值推送业务互动过程的权重或者频率,同时对高价值的推送业务互动过程可以适当增加推送更新配置的权重或者频率。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本公开所必须的。

在以上描述的基础上,下面对本公开下述实施例中所涉及到的部分术语进行说明。

资源推送配置信息:用于影响订阅业务项目的推送行为的配置项目因素,例如推送频率设置、推送层次设置、推送间隔周期设置、推送持续范围设置等。业务使用趋势特征:用于表征订阅业务项目的业务服务过程所处的业务使用阶段或者表征订阅业务项目的业务使用的增长或者减缓情况,例如订阅业务项目的业务使用量、订阅业务项目业务使用率、订阅业务项目的业务更新数量等。动态服务场景特征:用于表征大数据资讯服务以外的动态场景状况,例如全局推送频率、全局场景使用率等。静态服务场景特征:用于表征大数据资讯服务内的静态场景状况,例如大数据资讯服务的被动推送频率、大数据资讯服务内推送层次等。

在下述的实施例中,第一线上模式阶段的动态服务场景特征可以是通过第三应用获取的实时动态场景信息采集,即第一线上模式阶段的动态服务场景特征为第一线上模式阶段真实的动态场景状态,还可以是以往同期的动态场景数据,即第一线上模式阶段的动态服务场景特征是第一线上模式阶段模拟的动态场景状态。其中,第一线上模式阶段是相对于第二线上模式阶段的过往线上模式阶段,第一线上模式阶段和第二线上模式阶段的单位可以根据实际开发和业务迭代周期灵活设定。其中,静态服务场景特征是通过业务脚本对大数据资讯服务中的推送行为进行感知得到的,业务使用趋势特征是通过业务脚本对大数据资讯服务中订阅业务项目的趋势感知得到的。

在前述步骤S110之前,本实施例所提供的方法还可以包括以下步骤。

步骤S101,获取大数据资讯服务中订阅业务项目在第一线上模式阶段的业务使用趋势特征、大数据资讯服务在第一线上模式阶段的静态服务场景特征、以及大数据资讯服务在第一线上模式阶段的动态服务场景特征。

例如,机器学习系统100可以通过大数据资讯服务中的业务脚本获取相对于当前线上模式阶段(第二线上模式阶段)的过往线上模式阶段(第一线上模式阶段)的静态服务场景特征以及业务使用趋势特征,通过第三应用获取第一线上模式阶段的动态服务场景特征以及第二线上模式阶段的动态服务场景特征,基于第一线上模式阶段的业务使用趋势特征、第一线上模式阶段的静态服务场景特征以及第一线上模式阶段的动态服务场景特征,自动生成针对大数据资讯服务的配置指令,并通过解析针对大数据资讯服务的配置指令,得到第一线上模式阶段的业务使用趋势特征、第一线上模式阶段的静态服务场景特征以及第一线上模式阶段的动态服务场景特征,以便后续基于第一线上模式阶段的业务使用趋势特征、第一线上模式阶段的静态服务场景特征以及第一线上模式阶段的动态服务场景特征调用目标训练模型进行资源推送配置信息的动态优化。

步骤S102,基于第一线上模式阶段的业务使用趋势特征、第一线上模式阶段的静态服务场景特征、以及第一线上模式阶段的动态服务场景特征调用目标训练模型,以得到在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息,其中,第二线上模式阶段在第一线上模式阶段的下一开发更新阶段。

例如,将第一线上模式阶段的业务使用趋势特征、第一线上模式阶段的静态服务场景特征、以及第一线上模式阶段的动态服务场景特征输入目标训练模型,使得目标训练模型学习到以下策略:将大数据资讯服务的资源推送配置信息和动态服务场景特征共用作用于大数据资讯服务的静态服务场景特征,并将大数据资讯服务的静态服务场景特征作用于订阅业务项目的业务使用趋势特征,从而通过目标训练模型进行预测处理,得到在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息,即下一线上模式阶段用于配置大数据资讯服务的资源推送配置信息,结合动态服务场景特征动态调整控制大数据资讯服务中订阅业务项目的推送行为,进而实现订阅业务项目推送行为的智能化地精准预测。

示例性地,在一种独立的实施例中,步骤S102可通过步骤S1021-步骤S1023实现:基于目标训练模型执行以下处理:在步骤S1021中,基于第一线上模式阶段的业务使用趋势特征,确定第二线上模式阶段中满足推送更新要求的预设业务使用趋势特征;在步骤S1022中,确定实现预设业务使用趋势特征时第二线上模式阶段的静态服务场景特征;在步骤S1023中,基于第二线上模式阶段的动态服务场景特征与第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息共同作用于第二线上模式阶段的静态服务场景特征的联动关系,确定在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。

例如,机器学习系统100通过解析针对大数据资讯服务的配置指令,获取第一线上模式阶段的业务使用趋势特征、第一线上模式阶段的静态服务场景特征、以及第一线上模式阶段的动态服务场景特征,并调用目标训练模型进行预测处理,基于目标训练模型学习到的策略,先基于第一线上模式阶段的业务使用趋势特征进行业务使用趋势特征的预测处理,得到第二线上模式阶段中满足推送更新要求的预设业务使用趋势特征,其中,推送更新要求可以预先根据实际场景进行设置的,例如推送更新要求是订阅业务项目的业务转换率最大化,还可以是订阅业务项目所带来的业务净值最大化等。在获得第二线上模式阶段的预设业务使用趋势特征后,确定实现预设业务使用趋势特征时第二线上模式阶段的静态服务场景特征,最后,基于目标训练模型学习到的第二线上模式阶段的动态服务场景特征与第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息共同作用于第二线上模式阶段的静态服务场景特征的联动关系,确定在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息,以便智能化控制大数据资讯服务中订阅业务项目的推送行为。

在一种单独实施例中,第一线上模式阶段的业务使用趋势特征为订阅业务项目的业务使用率为50%,基于订阅业务项目所带来的业务净值最大化的推送更新要求,基于第一线上模式阶段的业务使用趋势特征进行业务使用趋势特征的预测处理,得到第二线上模式阶段的预设业务使用趋势特征为业务使用率为75%,为了实现第二线上模式阶段的预设业务使用趋势特征,第二线上模式阶段的静态服务场景特征为大数据资讯服务推送频率达到8次/秒、推送层次达到5个跨度层级,并通过第三方应用的动态场景信息采集获取第二线上模式阶段的动态服务场景特征为全局推送频率为5次/秒,基于第二线上模式阶段的动态服务场景特征与第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息共同作用于第二线上模式阶段的静态服务场景特征的联动关系,确定第二线上模式阶段的资源推送配置信息为推送频率设置为开启以达到8次/秒、推送层次设置为开启以达到5个跨度层级、推送间隔周期设置为1小时。

在一种单独实施例中,目标训练模型包括第一处理单元、第二处理单元以及特征处理单元;基于第一处理单元对第一线上模式阶段的业务使用趋势特征进行特征关联处理,得到第二线上模式阶段中满足推送更新要求的预设业务使用趋势特征;相对地,基于第二处理单元包括的大数据资讯服务的静态服务场景特征与订阅业务项目的业务使用趋势特征之间的特征关联关系,对第二线上模式阶段的预设业务使用趋势特征进行特征关联处理,得到实现第二线上模式阶段的预设业务使用趋势特征时第二线上模式阶段的静态服务场景特征;相对地,基于特征处理单元包括的大数据资讯服务的资源推送配置信息和动态服务场景特征共同与大数据资讯服务的静态服务场景特征之间的特征关联关系,将第二线上模式阶段的静态服务场景特征映射为在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。

在一种独立的实施例中,可以将第一线上模式阶段的业务使用趋势特征输入目标训练模型中的第一处理单元,通过第一处理单元对第一线上模式阶段的业务使用趋势特征进行特征关联处理,得到第二线上模式阶段中满足推送更新要求的预设业务使用趋势特征,并将预设业务使用趋势特征输入至第二处理单元,通过第二处理单元学习到的大数据资讯服务的静态服务场景特征与订阅业务项目的业务使用趋势特征之间的特征关联关系,对第二线上模式阶段的预设业务使用趋势特征进行特征关联处理,得到实现第二线上模式阶段的预设业务使用趋势特征时第二线上模式阶段的静态服务场景特征,并将第二线上模式阶段的静态服务场景特征输入至特征处理单元,通过特征处理单元学习到的大数据资讯服务的资源推送配置信息和动态服务场景特征共同与大数据资讯服务的静态服务场景特征之间的特征关联关系,将第二线上模式阶段的静态服务场景特征映射为在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。从而,通过目标训练模型中多层单元即可预测得到第二线上模式阶段的资源推送配置信息,进而实现订阅业务项目推送行为的智能化地精准预测,避免通过人工调控的方式对大数据资讯服务中订阅业务项目的推送行为进行调整。

在一种单独实施例中,目标训练模型包括第一处理单元、第二处理单元以及特征处理单元;基于第一处理单元对第一线上模式阶段的业务使用趋势特征进行特征关联处理,得到第二线上模式阶段中满足推送更新要求的预设业务使用趋势特征;相对地,基于第二处理单元包括的大数据资讯服务的静态服务场景特征与订阅业务项目的业务使用趋势特征变化之间的特征关联关系,对第一线上模式阶段的业务使用趋势特征与第二线上模式阶段的预设业务使用趋势特征的特征差异进行特征转换处理,得到实现第二线上模式阶段的预设业务使用趋势特征时第二线上模式阶段的静态服务场景特征;相对地,基于特征处理单元包括的大数据资讯服务的资源推送配置信息和动态服务场景特征共同与大数据资讯服务的静态服务场景特征之间的特征关联关系,将第二线上模式阶段的静态服务场景特征映射为在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。

例如,可以将第一线上模式阶段的业务使用趋势特征输入目标训练模型中的第一处理单元,通过第一处理单元对第一线上模式阶段的业务使用趋势特征进行特征关联处理,得到第二线上模式阶段中满足推送更新要求的预设业务使用趋势特征,并将预设业务使用趋势特征输入至第二处理单元,通过第二处理单元学习到的大数据资讯服务的静态服务场景特征与订阅业务项目的业务使用趋势特征变化之间的特征关联关系,对第一线上模式阶段的业务使用趋势特征与第二线上模式阶段的预设业务使用趋势特征的特征差异进行特征转换处理,得到实现第二线上模式阶段的预设业务使用趋势特征时第二线上模式阶段的静态服务场景特征,第二处理单元将第二线上模式阶段的静态服务场景特征输入至特征处理单元,通过特征处理单元学习到的大数据资讯服务的资源推送配置信息和动态服务场景特征共同与大数据资讯服务的静态服务场景特征之间的特征关联关系,将第二线上模式阶段的静态服务场景特征映射为在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。从而,通过目标训练模型中多层单元即可预测得到第二线上模式阶段的资源推送配置信息,进而实现订阅业务项目推送行为的智能化地精准预测,避免通过人工调控的方式对大数据资讯服务中订阅业务项目的推送行为进行调整。

在一种独立的实施例中,第一线上模式阶段的业务使用趋势特征为订阅业务项目的业务使用率为50%,第二线上模式阶段的预设业务使用趋势特征为业务使用率为75%,则订阅业务项目的业务使用趋势特征变化为业务使用率增加25%,为了实现订阅业务项目的业务使用趋势特征变化,第二线上模式阶段的静态服务场景特征为大数据资讯服务推送频率达到8次/秒、推送层次达到5个跨度层级,从而通过第二处理单元学习到订阅业务项目实际生长过程中大数据资讯服务的静态服务场景特征与订阅业务项目的业务使用趋势特征变化之间的关系,从而准确地确定出实现第二线上模式阶段的预设业务使用趋势特征时第二线上模式阶段的静态服务场景特征,以便后续准确地定位出在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。

在一种单独实施例中,特征处理单元包括第一特征提取节点、第二特征提取节点、全连接节点以及第三特征提取节点;将第二线上模式阶段的静态服务场景特征映射为在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息,包括:基于第一特征提取节点对第二线上模式阶段的动态服务场景特征进行特征提取,得到对应动态服务场景特征的第一特征向量;基于第二特征提取节点对第二线上模式阶段的静态服务场景特征进行特征提取,得到对应静态服务场景特征的第二特征向量;基于全连接节点确定第二特征向量与第一特征向量的特征差异;基于第三特征提取节点对特征差异进行特征提取,得到在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。

例如,第二处理单元将第二线上模式阶段的静态服务场景特征输入至特征处理单元后,基于学习到的大数据资讯服务的资源推送配置信息和动态服务场景特征共同与大数据资讯服务的静态服务场景特征之间的特征关联关系,通过特征处理单元中的第一特征提取节点对第二线上模式阶段的动态服务场景特征进行特征提取,得到对应动态服务场景特征的第一特征向量(即第一卷积向量),并通过特征处理单元中的第二特征提取节点对第二线上模式阶段的静态服务场景特征进行特征提取,得到对应静态服务场景特征的第二特征向量(即第二卷积向量),然后通过全连接节点对第二特征向量与第一特征向量作差,以得到第二特征向量与第一特征向量的特征差异,最后通过第三特征提取节点对特征差异进行特征提取,得到在第二线上模式阶段中用于配置大数据资讯服务的资源推送配置信息。

步骤S103,在第二线上模式阶段将资源推送配置信息应用到大数据资讯服务中。

例如,机器学习系统100将针对大数据资讯服务的配置指令发送至服务器,服务器接收到针对大数据资讯服务的配置指令后,调用目标训练模型进行预测处理后,得到第二线上模式阶段的资源推送配置信息,并将第二线上模式阶段的资源推送配置信息反馈至机器学习系统100,机器学习系统100通过业务服务设备在第二线上模式阶段将资源推送配置信息应用到大数据资讯服务中,从而将第一线上模式阶段的静态服务场景特征转换至第二线上模式阶段的静态服务场景特征,并在第二线上模式阶段的静态服务场景特征以及第二线上模式阶段的动态服务场景特征共同作用下,将第一线上模式阶段的业务使用趋势特征转换至第二线上模式阶段的业务使用趋势特征,从而实现自动化控制大数据资讯服务中订阅业务项目的生长。

在一种单独的实施例中,还可以包括步骤S104-步骤S105:在步骤S104中,基于大数据资讯服务中订阅业务项目在多个过往线上模式阶段的业务使用趋势特征、大数据资讯服务在多个过往线上模式阶段的静态服务场景特征、大数据资讯服务在多个过往线上模式阶段的动态服务场景特征,构建目标训练模型的标注特征对象;在步骤S105中,基于标注特征对象对目标训练模型进行训练,得到用于资源推送配置信息预测的目标训练模型。

例如,将当前线上模式阶段的特征(包括业务使用趋势特征、静态服务场景特征以及动态服务场景特征)作为下一线上模式阶段的过往线上模式阶段的特征。可以将大数据资讯服务中订阅业务项目的业务服务过程的一个业务迭代阶段内的特征(包括业务使用趋势特征、静态服务场景特征以及动态服务场景特征)作为标注特征对象,以训练目标训练模型,即多个过往线上模式阶段属于订阅业务项目的业务服务过程的一个业务迭代阶段,例如订阅业务项目的业务服务过程周期为30个阶段,且资源推送配置信息是以阶段为单位进行更新的,则多个过往线上模式阶段的数量为30,即第1阶段、第2阶段、…第30阶段。

其中,多个过往线上模式阶段还可以是由多个周期构成,例如多个过往线上模式阶段为第1过往线上模式阶段、第2过往线上模式阶段以及第3过往线上模式阶段,而第1过往线上模式阶段是订阅业务项目的第1个业务迭代阶段中的任一线上模式阶段、第2过往线上模式阶段是订阅业务项目的第2个业务迭代阶段中的任一线上模式阶段、第3过往线上模式阶段是订阅业务项目的第3个业务迭代阶段中的任一线上模式阶段。

在一种单独实施例中,基于大数据资讯服务中订阅业务项目在多个过往线上模式阶段的业务使用趋势特征、大数据资讯服务在多个过往线上模式阶段的静态服务场景特征、大数据资讯服务在多个过往线上模式阶段的动态服务场景特征,构建目标训练模型的标注特征对象,包括:针对多个过往线上模式阶段中的任一过往线上模式阶段执行以下处理:获取过往线上模式阶段的下一过往线上模式阶段的业务使用趋势特征、过往线上模式阶段的下一过往线上模式阶段的静态服务场景特征以及过往线上模式阶段的下一过往线上模式阶段的动态服务场景特征;将大数据资讯服务中订阅业务项目在过往线上模式阶段的业务使用趋势特征、大数据资讯服务在过往线上模式阶段的静态服务场景特征、过往线上模式阶段的动态服务场景特征组合为过往线上模式阶段的第一特征向量;将过往线上模式阶段的下一过往线上模式阶段的业务使用趋势特征、过往线上模式阶段的下一过往线上模式阶段的静态服务场景特征以及过往线上模式阶段的下一过往线上模式阶段的动态服务场景特征组合为下一过往线上模式阶段的第二特征向量;基于过往线上模式阶段的第一特征向量、在过往线上模式阶段中用于配置大数据资讯服务的资源推送配置信息以及下一过往线上模式阶段的第二特征向量,构建过往线上模式阶段的标注特征对象;将多个过往线上模式阶段的标注特征对象进行融合处理,得到目标训练模型的标注特征对象。

例如,当某一过往线上模式阶段的业务使用趋势特征为x1、静态服务场景特征为y1、动态服务场景特征为z1时,则该过往线上模式阶段的特征向量为S1[x1,y1,z1]。当该过往线上模式阶段的下一过往线上模式阶段的业务使用趋势特征为x2、静态服务场景特征为y2、动态服务场景特征为z2时,则该过往线上模式阶段的下一过往线上模式阶段的特征向量为S2[x2,y2,z2]。当该过往线上模式阶段中用于配置大数据资讯服务的资源推送配置信息为a1时,则将该过往线上模式阶段的业务使用趋势特征S1、该过往线上模式阶段中用于配置大数据资讯服务的资源推送配置信息为a1以及该过往线上模式阶段的下一过往线上模式阶段的特征向量S2组合为该过往线上模式阶段的标注特征对象[S1,a1,S2]。当有N个过往线上模式阶段时,则标注特征对象为[S1,a1,S2]、…、[sN-1,aN-1,sN]、[sN,aN,终止态],其中,N为大于2的自然数,终止态表示训练终止条件。

其中,在动态调整控制大数据资讯服务中订阅业务项目的推送行为的过程中,可以将过往线上模式阶段的标注特征对象存储至扩展订阅区域,以收集标注特征对象,从而当扩展订阅区域中过往线上模式阶段的标注特征对象的数量达到设定阈值时,从扩展订阅区域获取多个过往线上模式阶段的标注特征对象,并基于多个过往线上模式阶段的标注特征对象对目标训练模型进行训练。

在一种单独实施例中,基于大数据资讯服务中订阅业务项目的业务服务过程的标注特征对象对目标训练模型进行训练,得到用于资源推送配置信息预测的目标训练模型,包括:基于标注特征对象中的任一过往线上模式阶段的标注特征对象以及过往线上模式阶段的标注评价信息,构建目标训练模型的模型更新参考函数;更新目标训练模型的参数直至模型更新参考函数收敛,将模型更新参考函数收敛时目标训练模型的更新的参数,作为用于资源推送配置信息预测的目标训练模型的参数。

在一种单独实施例中,构建目标训练模型的模型更新参考函数之前,还包括:基于标注特征对象中的任一过往线上模式阶段的标注特征对象调用目标训练模型进行预测处理,得到在过往线上模式阶段中用于配置大数据资讯服务的预测资源推送配置信息;基于预测资源推送配置信息,得到过往线上模式阶段的预测评价信息;基于过往线上模式阶段的标注特征对象、过往线上模式阶段的预测评价信息以及过往线上模式阶段的标注评价信息,构建目标训练模型的模型更新参考函数。

例如,在训练阶段,调用目标训练模型进行预测处理,得到在过往线上模式阶段中用于配置大数据资讯服务的预测资源推送配置信息,并基于预测资源推送配置信息,得到过往线上模式阶段的预测评价信息,例如基于预测资源推送配置信息,预测大数据资讯服务中订阅业务项目能够达到的业务使用趋势特征,将订阅业务项目能够达到的业务使用趋势特征所带来的业务使用趋势预估信息作为预测评价信息;基于预测资源推送配置信息,预测大数据资讯服务中订阅业务项目能够达到的业务使用趋势特征,将订阅业务项目能够达到的业务使用趋势特征所带来的业务使用趋势预估信息作为预测评价信息,并预测资源推送配置信息所需索引关联的引用业务信息,将业务使用趋势预估信息与引用业务信息的特征差异作为标注评价信息。最后,基于过往线上模式阶段的标注特征对象、过往线上模式阶段的预测评价信息以及过往线上模式阶段的标注评价信息,构建目标训练模型的模型更新参考函数。

在一种单独实施例中,基于目标训练模型中的第一处理单元对过往线上模式阶段的业务使用趋势特征进行特征关联处理,得到下一过往线上模式阶段中满足推送更新要求的预设业务使用趋势特征,基于目标训练模型中的特征处理单元包括的大数据资讯服务的资源推送配置信息和动态服务场景特征共同与大数据资讯服务的静态服务场景特征之间的特征关联关系,将下一过往线上模式阶段的静态服务场景特征映射为在下一过往线上模式阶段中用于配置大数据资讯服务的预测资源推送配置信息。

例如,基于任一过往线上模式阶段的标注特征对象、过往线上模式阶段的预测评价信息以及过往线上模式阶段的标注评价信息(例如订阅业务项目在该过往线上模式阶段实际带来的业务净值,或者订阅业务项目在该过往线上模式阶段实际的业务转换率),确定目标训练模型的模型更新参考函数(例如,交叉熵损失函数等,但不限于此)的值后,可以判断目标训练模型的模型更新参考函数的值是否超出预设阈值,当目标训练模型的模型更新参考函数的值超出预设阈值时,基于目标训练模型的模型更新参考函数确定目标训练模型的误差信号,将误差信息在目标训练模型中反向传播,并在传播的过程中更新各个层的模型参数。

在一种独立的实施例中,构建目标训练模型的模型更新参考函数之前,还包括:获取过往线上模式阶段的标注特征对象中的下一过往线上模式阶段的业务使用趋势特征,基于下一过往线上模式阶段的业务使用趋势特征调用订阅业务项目仿真器模型,以确定订阅业务项目的业务服务过程在过往线上模式阶段所带来的业务使用趋势预估信息,并将业务使用趋势预估信息作为过往线上模式阶段的标注评价信息。例如,将订阅业务项目在该过往线上模式阶段实际的业务转换率作为过往线上模式阶段的标注评价信息。

在一种独立的实施例中,构建目标训练模型的模型更新参考函数之前,还包括:获取过往线上模式阶段的标注特征对象中的下一过往线上模式阶段的业务使用趋势特征,基于下一过往线上模式阶段的业务使用趋势特征调用订阅业务项目仿真器模型,以确定订阅业务项目的业务服务过程在过往线上模式阶段所带来的业务使用趋势预估信息;获取在过往线上模式阶段中用于配置大数据资讯服务的资源推送配置信息;基于在过往线上模式阶段中用于配置大数据资讯服务的资源推送配置信息调用订阅业务项目仿真器模型,以确定资源推送配置信息所需索引关联的引用业务信息,将业务使用趋势预估信息作为过往线上模式阶段的标注评价信息,包括:将业务使用趋势预估信息与引用业务信息的特征差异作为过往线上模式阶段的标注评价信息。例如,订阅业务项目在该过往线上模式阶段实际带来的业务净值作为过往线上模式阶段的标注评价信息。

在一种可能的实施例中,针对前述步骤S103,可以通过以下示例性的步骤进一步实现。

步骤S1031,获取针对大数据资讯服务的资源推送配置信息的更新指令。

在本实施例中,机器学习系统100可以接收前端服务节点发送的更新指令,更新指令用于指示针对资源推送配置信息中的当前推送资讯文本信息执行推送状态更新。

步骤S1032,在当前推送资讯文本信息处于第一推送配置状态时,确定当前推送资讯文本信息所对应的更新模式,及更新模式中处于更新激活状态的所有更新业务微服务,并请求所有更新业务微服务响应更新指令,针对当前推送资讯文本信息执行推送状态更新。

步骤S1033,在当前推送资讯文本信息处于第二推送配置状态时,确定当前推送资讯文本信息在资源推送配置信息中的当前推送配置指令,并在当前推送配置指令满足预设的更新级别时,针对当前推送资讯文本信息执行推送状态更新。

在本实施例中,当前推送资讯文本信息中保存有一状态信息标识,状态信息标识用于指示当前推送资讯文本信息的状态;比如,当状态信息标识指示当前推送资讯文本信息处于第一推送配置状态时,深度学习系统100确定当前推送资讯文本信息处于完全推送激活状态,此时深度学习系统100可以确定出当前推送资讯文本信息所对应的更新模式,以及更新模式中处于更新激活状态的所有更新业务微服务。

其中,当前推送资讯文本信息中可以保存有一更新标签,更新标签可以用于指示对应的更新模式;深度学习系统100可以保存一更新标签映射表,更新标签映射表中记录有多个更新标签与多个更新模式的对应关系;深度学习系统100可以通过查询更新标签映射表,从而获得当前推送资讯文本信息中保存的更新标签信息所对应的更新模式;并且,深度学习系统100可以向确定出的更新模式的应用服务发送查询信息,以请求更新模式中所有更新业务微服务返回的响应信息。

接下来,深度学习系统100可以根据更新模式中各个更新业务微服务各自返回响应信息的情况,确定各个更新业务微服务的工作状态;比如,深度学习系统100可以确定设定时间内反馈了响应信息的更新业务微服务处于更新激活状态,而超出设定时间也没有反馈响应信息的更新业务微服务则不处于更新激活状态;如此,当深度学习系统100确定出更新模式中处于更新激活状态的所有更新业务微服务后,深度学习系统100可以请求所有更新业务微服务响应更新请求,针对当前推送资讯文本信息执行推送状态更新。

另外,当状态信息标识指示当前推送资讯文本信息处于第二推送配置状态时,深度学习系统100确定当前推送资讯文本信息处于部分推送激活状态,即当前推送资讯文本信息中包含一些不推送激活的数据,此时深度学习系统100可以确定出当前推送资讯文本信息在资源推送配置信息中的当前推送配置指令,并查找预先配置的更新等级策略表,该更新等级策略表中记录有多个信令各自对应的更新级别;当深度学习系统100通过查找更新等级策略表,确定当前推送配置指令对应的更新级别,并当深度学习系统100判定当前推送配置指令对应的更新级别满足预设的更新级别时,深度学习系统100确定当前推送资讯文本信息符合更新需求,则深度学习系统100针对当前推送资讯文本信息执行推送状态更新。

可见,在本公开提供的方案中,通过获取针对大数据资讯服务的资源推送配置信息的更新指令,其中,更新指令用于指示针对资源推送配置信息中的当前推送资讯文本信息执行推送状态更新;在当前推送资讯文本信息处于第一推送配置状态的情况下,确定当前推送资讯文本信息所对应的更新模式,及更新模式中处于更新激活状态的所有更新业务微服务,并请求所有更新业务微服务响应更新指令,针对当前推送资讯文本信息执行推送状态更新;另外,在当前推送资讯文本信息处于第二推送配置状态的情况下,确定当前推送资讯文本信息在资源推送配置信息中的当前推送配置指令,并在当前推送配置指令满足预设的更新级别时,针对当前推送资讯文本信息执行推送状态更新。如此,通过判断当前推送资讯文本信息处于第一推送配置状态或第二推送配置状态的两种情况,从而针对不同的情况响应于当前推送资讯文本信息的更新指令,以执行推送状态更新,进而提升了推送资讯文本信息的推送可靠性,避免数据污染。

其中,在一种单独实施例中,针对更新模式的工作状态不同,机器学习系统100在执行步骤S1031之后,还可以先获取资源推送配置信息的资源推送描述信息。

接下来,机器学习系统100可以利用上述的方式,获取更新模式的工作状态;并且,机器学习系统100可以在获取到用于指示更新模式处于更新维护模式时,将当前推送资讯文本信息从第一推送配置状态切换为第二推送配置状态,并根据资源推送描述信息获取当前推送资讯文本信息在资源推送配置信息中的当前推送配置指令,进而执行步骤S1033。

在本实施例中,当前推送配置指令可以记录在资源推送描述信息的指定字段中。

另外,机器学习系统100可以在获取到用于指示更新模式处于更新非维护模式时,将当前推送资讯文本信息从第二推送配置状态切换为第一推送配置状态,并根据资源推送描述信息获取资源推送配置信息中的经营内容描述数据;从而执行步骤S1032。

其中,在一种单独实施例中,机器学习系统100在执行步骤S1033以确定当前推送资讯文本信息在资源推送配置信息中的当前推送配置指令时,可以采用以下方案:

首先,机器学习系统100可以以当前推送资讯文本信息在资源推送配置信息中的资讯文本配置源作为目标配置源,以当前推送资讯文本信息中的预设资讯文本配置源范围为固定范围确定出遍历配置源范围。在本实施例中,预设资讯文本配置源范围可以记录在当前推送资讯文本信息中的预设配置源范围。接下来,机器学习系统100可以根据当前推送资讯文本信息的配置源热度范围,从遍历配置源范围中确定出当前推送资讯文本信息的配置源高热度范围;其中,配置源高热度范围为当前推送资讯文本信息中保存推送配置指令的高热度范。在本实施例中,配置源热度范围可以保存在当前推送资讯文本信息的元数据中。然后,机器学习系统100可以从配置源高热度范围搜索当前推送资讯文本信息的当前推送配置指令。接下来,当从配置源高热度范围未搜索到当前推送配置指令时,机器学习系统100可以以当前推送资讯文本信息在资源推送配置信息中的资讯文本配置源作为目标配置源,以当前推送资讯文本信息的对应的资讯文本索引作为目标操作对象,按照设定的索引类别划分,得到多个推送资讯文本信息资讯文本索引。然后,机器学习系统100可以获取多个推送资讯文本信息资讯文本索引中每个推送资讯文本信息资讯文本索引各自对应的索引类别码,并按照每个索引类别码各自对应的推送资讯文本信息资讯文本索引的顺序,将所有的索引类别码进行融合,以生成当前推送资讯文本信息的当前推送配置指令。

另外,在一种单独实施例中,为了针对大数据资讯服务的整体价值进行评估,针对大数据资讯服务所对应的当前推送资讯文本信息,信息处理方法还可以包括以下步骤:

首先,机器学习系统100可以获取当前推送资讯文本信息在预设推送循环周期内各自的历史推送行为信息以及每个历史推送行为信息各自对应的推送行为反馈信息。在本实施例中,预设推送循环周期可以为大数据资讯服务在过去的五个循环周期;历史推送行为信息可以包括在各个预设推送循环周期内的推送行为过程中的资讯引用控制信息。接下来,机器学习系统100可以根据历史推送行为信息和推送行为反馈信息对当前推送资讯文本信息进行推送指标变化计算,以得到当前推送资讯文本信息在每个推送循环周期内对应的推送指标变化评估信息。在本实施例中,机器学习系统100可以采用例如最小二乘拟合等方式,根据历史推送行为信息和推送行为反馈信息,对当前推送资讯文本信息进行业务指标增长计算,从而得到当前推送资讯文本信息在每个推送循环周期内对应的推送指标变化评估信息。然后,机器学习系统100可以分别对每个推送指标变化评估信息进行重要性参数计算,以得到至少一组推送指标重要性参数。接下来,机器学习系统100可以确定待估算的当前推送指标变化评估信息以及与当前推送指标变化评估信息相邻周期的相关推送指标变化评估信息;其中,相关推送指标变化评估信息为与当前推送指标变化评估信息相邻的前一周期的推送指标变化评估信息。然后,机器学习系统100可以根据推送指标重要性参数确定当前推送指标变化评估信息与相关推送指标变化评估信息各自对应的预期推送有效转化参数。接下来,机器学习系统100可以根据所有的预期推送有效转化参数以及各自对应的推送指标变化评估信息,对当前推送资讯文本信息进行推送价值估算,以得到当前推送资讯文本信息对应的预期推送价值数据。然后,机器学习系统100可以获取历史推送资讯文本信息所对应的历史推送价值数据,并根据历史推送价值数据确定当前推送资讯文本信息的当前推送预期数据;其中,历史推送资讯文本信息为当前推送资讯文本信息对应的在先推送资讯文本信息。接下来,机器学习系统100可以根据预期推送价值数据对当前推送预期数据进行推送价值度计算,以得到当前推送资讯文本信息的推送价值影响参数。然后,机器学习系统100可以根据推送价值影响参数对当前推送资讯文本信息进行价值估算,以得到当前推送资讯文本信息所对应的参考推送价值。

如此,基于本公开实施例提供的上述方案,通过对当前推送资讯文本信息进行推送价值估算,可以基于估算出来的推送价值,对大数据资讯服务的当前推送资讯文本信息进行整体价值评估,从而对大数据资讯服务的指标进行客观评估,提升业务拓展的可靠性。

其中,作为一种可能的实施方式,为了提高获取历史推送价值数据时的可靠性,防止数据被泄漏,机器学习系统100在获取历史推送资讯文本信息所对应的历史推送价值数据时可以采用以下方式:

首先,机器学习系统100可以确定出与当前推送资讯文本信息对应的目标历史资讯更新项目,并获取由目标历史资讯更新项目所保存的历史资讯更新数据包;其中,历史资讯更新数据包为目标历史资讯更新项目所保存的所有历史推送资讯文本信息的数据包。接下来,机器学习系统100可以获取由目标历史资讯更新项目反馈的历史资讯更新数据包的更新序列号。然后,机器学习系统100可以利用更新序列号对历史资讯更新数据包进行解码。接下来,机器学习系统100可以获取历史推送资讯文本信息的统计周期开始节点和统计周期结束节点。然后,机器学习系统100可以根据统计周期开始节点和统计周期结束节点,确定出目标统计周期。接下来,机器学习系统100可以获取解码后的历史资讯更新数据包在目标统计周期内的目标历史推送订阅信息。然后,机器学习系统100可以在目标历史推送订阅信息中解析出当前推送资讯文本信息所对应的历史推送价值数据。

图3为本公开实施例提供的基于大数据线上模式的用户画像挖掘装置300的功能模块示意图,下面分别对该基于大数据线上模式的用户画像挖掘装置300的各个功能模块的功能进行详细阐述。

获取模块310,用于根据业务服务设备的服务用户的大数据资讯服务中获取每个业务互动过程对应的资讯互动行为序列,资讯互动行为序列包括至少两个目标互动资讯的互动行为数据,互动行为数据包括目标互动资讯每次调用目标微服务时的资讯互动行为和调用业务节点。

第一确定模块320,用于根据每个目标互动资讯调用目标微服务时的资讯互动行为,确定每个资讯互动行为序列的业务互动指标,业务互动指标用于表征资讯互动行为序列中的目标互动资讯在调用目标微服务时的业务兴趣度。

第二确定模块330,用于根据每个目标互动资讯每次调用目标微服务时的调用业务节点,确定每个资讯互动行为序列的业务覆盖信息。业务覆盖信息用于表征资讯互动行为序列中的目标互动资讯调用目标微服务的业务覆盖程度。

挖掘模块340,用于根据每个业务互动过程对应的资讯互动行为序列的业务互动指标和业务覆盖信息,进行业务互动过程的用户画像挖掘。

图4示出了本公开实施例提供的用于实现上述的基于大数据线上模式的用户画像挖掘方法的机器学习系统100的硬件结构示意图,如图4所示,机器学习系统100可包括处理器110、机器可读存储介质120、总线130以及收发器140。

在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机执行指令,使得处理器110可以执行如上方法实施例的基于大数据线上模式的用户画像挖掘方法,处理器110、机器可读存储介质120以及收发器140通过总线130连接,处理器110可以用于控制收发器140的收发动作,从而可以与前述的业务服务设备200进行数据收发。

处理器110的具体实现过程可参见上述机器学习系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。

此外,本公开实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上基于大数据线上模式的用户画像挖掘方法。

最后,应当理解的是,本说明书中实施例仅用以说明本说明书实施例的原则。其它的变形也可能属于本说明书范围。因此,在一种单独实施例中而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

相关技术
  • 基于大数据线上模式的用户画像挖掘方法及机器学习系统
  • 一种基于大数据的用户画像建立方法和用户画像管理系统
技术分类

06120112940226