掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。

背景技术

如今人工智能在各个行业中的迅速发展,例如:电子商务行业中的产品推荐业务、短视频行业中的视频处理业务等等。上述业务都需要基于海量数据在多个网络结构下训练各类深度模型,而其中超参数的设定直接关系到最终模型性能的好坏,传统的设定方法往往是基于人工经验或者网格搜索等。

在实现本申请的过程中,发明人依靠人工经验的调参方式,对研发人员专业技能要求较高,尤其在跨专业领域应用人工智能技术的今天,往往无法取得显著效果。

而网格搜索等传统方式对于依托样本数据较大的深度模型来讲时间成本较高并且效果往往一般。例如:超参数A有2种选择,超参数B有3种选择,超参数C有4种选择,那么所有的超参数组合就有2×3×4也就是24种,因此需要研发人员遍历这24种组合并且找到其中最优的方案,对于连续值还需要等间距采样。而在实际过程中这24种组合不一定取得全局最优解,而且计算量很大且浪费时间成本。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种数据处理方法、装置、电子设备及存储介质。

根据本申请实施例的一个方面,提供了一种数据处理方法,包括:

根据接收的查询信息查询用于构建网络结构的组成元素;

根据所述组成元素构建至少一个候选网络结构;

采用训练参数对所述候选网络结构进行训练,得到所述候选网络结构的训练结果;

从所述候选网络结构中选择满足预设性能要求的网络结构作为目标网络结构。

进一步,所述采用训练参数对所述候选网络结构进行训练,得到所述候选网络结构的训练结果,包括:

采用训练参数对所述候选网络结构进行训练,确定所述候选网络结构的第一性能数据;

根据所述训练参数以及所述第一性能数据,生成先验数据集合;

基于所述先验数据集合进行拟合得到第一高斯模型;

根据预设采集函数确定所述第一高斯模型的极小值,并根据所述极小值对所述候选网络模型进行训练,确定所述候选网络结构的第二性能数据;

将所述第二性能数据确定为所述训练结果。

进一步的,所述根据所述训练结果从所述候选网络结构中选择满足预设性能要求的网络结构作为目标网络结构,包括:

当所述训练结果中存在满足预设性能要求的第二性能数据时,将所述第二性能数据满足预设性能要求的候选网络结构确定为所述目标网络结构。

进一步,所述方法还包括:

当所述训练结果中不存在满足预设性能要求的第二性能数据时,根据所述极小值以及所述第二性能数据更新所述先验数据集合;

基于更新后的先验数据集合进行拟合得到第二高斯模型;

根据所述预设采集函数确定所述第二高斯模型的极小值,并根据所述第二高斯模型的极小值对所述候选网络模型进行训练,直至所述训练结果中存在满足预设性能要求的性能数据。

进一步,所述方法还包括:

获取样本数据以及所述样本数据对应的标签数据;

提取各样本数据中的关联特征,所述关联特征中包括至少两个特征;

统计所述关联特征的支持度;

根据所述支持度确定与所述标签数据关联的目标关联特征。

进一步,所述方法还包括:

确定所述目标网络结构的结构类型;

按照所述结构类型对应的预处理操作对所述目标关联特征和所述标签数据进行处理;

将所述处理后的目标关联特征以及标签数据输入所述目标网络结构,由所述目标网络结构学习所述目标关联特征与所述标签数据的关系,得到分析模型。

根据本申请实施例的再一个方面,还提供了一种数据处理方法,包括:

根据来自于请求方的服务请求确定所述请求方的至少两个特征集合;

根据各个特征集合的关联关系,得到特征组合集合;

将所述特征组合集合输入预先训练的分析模型,得到由所述分析模型输出的待推送内容的置信度;

根据所述置信度确定发送至请求方的目标推送内容。

根据本申请实施例的再一个方面,还提供了一种数据处理装置,包括:

查询模块,用于根据接收的查询信息查询用于构建网络结构的组成元素;

构建模块,用于根据所述组成元素构建至少一个候选网络结构;

训练模块,用于采用训练参数对所述候选网络结构进行训练,得到所述候选网络结构的训练结果;

选择模块,用于根据所述训练结果从所述候选网络结构中选择满足预设性能要求的网络结构作为目标网络结构。

根据本申请实施例的再一个方面,还提供了一种数据处理装置,包括:

获取模块,用于获取请求方发送的服务推送请求,所述服务推送请求携带请求方信息;

分析模块,用于根据各个特征集合的关联关系得到特征组合集合;

输入模块,用于将所述组合特征输入预先训练的分析模型,得到由所述分析模型输出的待推送内容的权重;

确定模块,用于根据所述待推送内容的权重确定发送至请求方的目标推送内容。

根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。

根据本申请实施例的另一方面,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。

本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例在构建网络模型之前通过自动化搜索确定组成元素,并根据组成元素构建候选网络结构,并根据训练参数对候选网络结构进行自动训练,从而得到满足性能要求的网络结构,提高了网络结构优化效率以及性能,同时有效降低了计算量以及时间成本,不再需要研发人员依靠人工经验的调参。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种数据处理方法的流程图;

图2为本申请另一实施例提供的一种数据处理方法的流程图;

图3为本申请另一实施例提供的一种数据处理方法的流程图;

图4为本申请另一实施例提供的一种数据处理方法的流程图;

图5为本申请实施例提供的一种数据处理装置的框图;

图6为本申请另一实施例提供的一种数据处理装置的框图;

图7为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个类似的实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本申请实施例提供了一种数据处理方法、装置、电子设备及存储介质。本发明实施例所提供的方法可以应用于任意需要的电子设备,例如,可以为服务器、终端等电子设备,在此不做具体限定,为描述方便,后续简称为电子设备。

根据本申请实施例的一方面,提供了一种数据处理方法的方法实施例,图1为本申请实施例提供的一种智能家居设备的控制方法的流程图,如图1所示,该方法还包括:

步骤S11,根据接收的查询信息查询用于构建网络结构的组成元素;

在本申请实施例中,查询信息基于用户输入的需求信息,需求信息可以是用于进行数据识别的信息,或用于进行数据分类的信息等等。用于构建网络结构的组成元素可以是卷积层、池化层、连接层、输出层等等,同时还包括卷积核的大小。

在本申请实施例中,预先设有用于存储网络结构组成元素的模型库,模型库中包括网络结构的组成元素。因此,从模型库中得到与查询信息相匹配的组成元素。

步骤S12,根据组成元素构建至少一个候选网络结构;

在本申请实施例中,模型库中还存储有每个组成元素的搭配方式,因此根据每个每个组成元素的搭配方式进行排列组合,可以得到多个候选网络结构。

作为一个示例,卷积层有2种搭配方式,池化层有3种搭配方式,连接层有1种搭配方式,输出层有1种搭配方式。因此,最终得到候选网络结构就有:2×3=6个。

步骤S13,采用训练参数对候选网络结构进行训练,得到候选网络结构的训练结果;

在本申请实施例中,步骤S13,从候选网络结构中选择满足预设性能要求的网络结构作为目标网络结构,包括以下步骤A1-A5:

步骤A1,采用训练参数对候选网络结构进行训练,确定候选网络结构的第一性能数据;

在本申请实施例中,训练参数可以是预先设置的超参数x,采用超参数对候选网络模型进行训练,从而得到候选网络模型的性能数据。在本申请实施例中,性能数据可以是候选网络模型的损失函数值。计算过程如下:

x=argminy。

其中,x属于集合A,集合A包含至少一个超参数,y为性能数据。

本申请实施例中,当第一次采用超参数对上述多个候选网络结构进行训练时,刻画出每个候选网络结构的性能数据记为第一性能数据。

步骤A2,根据训练参数以及第一性能数据,生成先验数据集合;

在本申请实施例中,每一个训练参数和该训练参数对应的第一性能参数生成一个数据组,根据得到的多个数据组确定先验数据集合,先验数据集合为:

D

步骤A3,基于先验数据集合进行拟合得到第一高斯模型;

在本申请实施例中,根据先验数据集合进行拟合,得到第一高斯模型(GaussianMixture Model缩写:GM)。高斯模型如下:

上述式中,p(x;μ,M)为高斯函数,M为协方差矩阵,x为超参数,μ为先验数据集合中各组数据的均值,μ∈R(实数集),d为先验数据集合中的数据量。

可以理解的,高斯模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。

步骤A4,根据预设采集函数确定第一高斯模型的极小值,并根据极小值对候选网络模型进行训练,确定候选网络结构的第二性能数据;

在本申请实施例中,预设采集函数如下:

上述式中,α

在本申请实施例中,根据上述采集函数确定第一高斯模型的极小值x',然后采用该极小值x'对各个候选网络模型进行二次训练,以此刻画出各个候选网络模型的第二性能数据y'。

在本申请实施例中,通过采集函数获取高斯模型的极小值,并采用极小值重新对上述多个候选网络结构进行训练,从而刻画出每个候选网络结构的第二性能数据,目的是增加先验数据集合D中数据组的数据量,以保证根据先验数据集合D拟合的高斯函数满足迭代条件。

步骤A5,将第二性能数据确定为训练结果。

在本申请实施例中,将上述实施例得到的第二性能数据y'作为训练结果。

步骤S14,根据训练结果从候选网络结构中选择满足预设性能要求的网络结构作为目标网络结构;

在本申请实施例中,步骤S14,包括:当训练结果中存在满足预设性能要求的第二性能数据时,将第二性能数据满足预设性能要求的候选网络结构确定为目标网络结构。

其中,预设性能要求可以是预设损失函数,当预设损失函数越小则模型准确度越高,当训练结果中的第二性能数据已经小于预设损失函数时,则将第二性能数据满足预设性能要求的候选网络结构确定为目标网络结构。

本申请实施例提供的方法,还包括以下步骤B1-B3:

步骤B1,当训练结果中不存在满足预设性能要求的第二性能数据时,根据极小值以及第二性能数据更新先验数据集合;

在本申请实施例中,当训练结果中的第二性能数据还不能满足预设的模型准确度时,根据极小值x'以及第二性能数据y'更新先验数据集合,从而得到更新后的先验数据集合D

步骤B2,基于更新后的先验数据集合进行拟合得到第二高斯模型;

步骤B3,根据预设采集函数确定第二高斯模型的极小值,并根据第二高斯模型的极小值对候选网络模型进行训练,直至训练结果中存在满足预设性能要求的性能数据。

本申请实施例在构建网络模型之前通过自动化搜索确定组成元素,并根据组成元素构建候选网络结构,并根据训练参数对候选网络结构进行自动训练,从而得到满足性能要求的网络结构,提高了网络结构优化效率以及性能。同时有效降低了计算量以及时间成本,不再需要研发人员依靠人工经验的调参。

图2为本申请实施例提供的一种数据处理方法的流程图,如图2所示,该方法可以包括以下步骤:

步骤S21,获取样本数据;

在本申请实施例中,可以是历史推荐记录从获取样本数据,样本数据为历史推荐内容对应的特征集合。例如性别特征集合,年龄特征集合等等。

步骤S22,提取各样本数据中的关联特征,以及所述关键特征对应的标签数据,关联特征中包括至少两个特征;

在本申请实施例中,特征集合中包括多个单特征,然后根据历史推荐内容根据单特征提取关联特征,并将历史推荐内容作为标签数据。

作为一个示例,性别特征集合包括的:男以及女两个单特征;年龄特征集合包括:少年、中年、老年等等单特征。关联特征为:男—少年—标签数据A,男—中年—标签数据B,女—中年—标签数据C,以及女—中年—标签数据D。

步骤S23,统计关联特征的支持度;

在本申请实施例中,计算每个关联特征的出现次数,将关联特征的出现次数,作为关联特征的支持度。

步骤S24,根据支持度确定与标签数据关联的目标关联特征。

在本申请实施例中,将支持度大于预设支持度的关联特征作为与标签数据关联的目标关联特征。

作为一个示例,男—少年—标签数据A,男—中年—标签数据B,女—少年—标签数据B,男—少年—标签数据A,基于上述内容确定标签数据A对应的“男—少年”为目标关联特征。

在本申请实施例中,由于深度学习模型并不容易学到特征之间的隐藏关系,因此通过对输入网络结构的特征进行分析,确定关联特征,从而得到特征中存在的隐藏关系,以此能够提高模型的性能。例如,对于离散特征,简单的线性模型无法学到多个特征的交互。

因此,本申请通过笛卡尔积来生成组合特征。如果把所有组合特征都获取到,那么组合特征的个数是随着阶数呈指数性增长。在本申请实施例中逐步搜索特征,通过重新排列特征的输入顺序,有利于提高模型输出的预测结果的准确性。

图3为本申请实施例提供的一种数据处理方法的流程图,如图3所示,该方法可以包括以下步骤:

步骤S31,确定目标网络结构的结构类型;

步骤S32,按照结构类型对应的预处理操作对目标关联特征和标签数据进行处理;

在本申请实施例中,对目标关联特征和标签数据进行有效预处理,能够进一步提高所训练模型准确度,由于模型对数据都存在一定假设,需要使用一些数据预处理的方法将进入模型的数据处理成适合模型学习的分布。

例如:神经网络模型需要归一化处理,随机森林模型(Gradient BoostingMachine缩写:GBM)需要剔除高维离散特征,逻辑回归模型(Logistic Regression缩写:LR)需要线性分形等,而为了更加科学有效的找到最优组合,在本方案中通过使用贝叶斯优化的方法,通过训练、反馈、优化这一循环的过程来找到各个模型对应的最佳数据预处理方法。

步骤S33,将处理后的目标关联特征以及标签数据输入目标网络结构,由目标网络结构学习目标关联特征与标签数据的关系,得到分析模型。

图4为本申请实施例提供的一种数据处理方法的流程图,如图4所示,该方法可以包括以下步骤:

步骤S41,根据来自于请求方的服务请求确定请求方的至少两个特征集合;

在本申请实施例中,请求方可以是客户端,服务请求可以是客户端触发内容获取操作生成,当接收到服务请求后,根据服务请求得到请求方的至少两个特征集合。

在本申请实施例中,服务请求携带请求方标识,例如设备号,账号标识等等。然后根据请求方标识从特征库中调取与请求方标识对应的特征集合。

步骤S42,根据各个特征集合的关联关系,得到特征组合集合;

在本申请实施例中,步骤S42,根据各个特征集合的关联关系得到特征组合集合,包括以下步骤C1-C3:

步骤C1,对请求方的特征集合进行分析,得到存在关联关系的特征集合;

步骤C2,将存在关联关系的特征集合确定为目标特征集合;

步骤C3,根据目标特征集合的笛卡尔乘积,得到特征组合集合。

步骤S43,将特征组合集合输入预先训练的分析模型,得到由分析模型输出的待推送内容的置信度;

在本申请实施例中,将特征组合集合输入预先训练的分析模型,得到由分析模型输出的待推送内容的置信度,包括:将特征组合集合输入预先训练的分析模型,由分析模型根据特征组合集合确定请求方感兴趣的待推送内容,以及待推送内容的置信度。

步骤S44,根据置信度确定发送至请求方的目标推送内容。

在本申请实施例中,步骤S44,根据待推送内容的置信度确定发送至请求方的目标推送内容,包括以下步骤D1-D2:

步骤D1,根据置信度对待推送内容进行排序,得到排序结果;

步骤D2,从排序结果中筛选出置信度符合推送条件的待推送内容作为目标推送内容。

在本申请实施例中,从排序结果中筛选出置信度符合推送条件的待推送内容作为目标推送内容,可以是从排序结果中选择置信度最高的待推送内容作为目标推送内容。或者,从排序结果中选择置信度大于预设置信度的待推送内容作为目标推送内容。

图5为本申请实施例提供的一种数据处理装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图5所示,该装置包括:

查询模块51,用于根据接收的查询信息查询用于构建网络结构的组成元素;

构建模块52,用于根据组成元素构建至少一个候选网络结构;

训练模块53,用于采用训练参数对候选网络结构进行训练;

选择模块54,用于从候选网络结构中选择满足预设性能要求的网络结构作为目标网络结构。

在本申请实施例中,选择模块54,用于采用训练参数对候选网络结构进行训练,确定候选网络结构的第一性能数据;根据训练参数以及第一性能数据,生成先验数据集合;基于先验数据集合进行拟合得到第一高斯模型;根据预设采集函数确定第一高斯模型的极小值,并根据极小值对候选网络模型进行训练,确定候选网络结构的第二性能数据;当存在第二性能数据满足预设性能要求的候选网络模型时,将第二性能数据满足预设性能要求的候选网络结构确定为目标网络结构。

在本申请实施例中,训练模块53,用于当不存在第二性能数据满足预设性能要求的候选网络模型时,根据极小值以及第二性能数据更新先验数据集合;基于更新后的先验数据集合进行拟合得到第二高斯模型;根据预设采集函数确定第二高斯模型的极小值,并根据第二高斯模型的极小值对候选网络模型进行训练,直至存在第二性能数据满足预设性能要求的候选网络模型。

在本申请实施例中,装置还包括:分析模块,用于获取样本数据以及样本数据对应的标签数据;提取各样本数据中的关联特征,关联特征中包括至少两个特征;统计关联特征的支持度;根据支持度确定与标签数据关联的目标关联特征。

在本申请实施例中,装置还包括:生成模块,用于确定目标网络结构的结构类型;按照结构类型对应的预处理操作对目标关联特征和标签数据进行处理;将处理后的目标关联特征以及标签数据输入目标网络结构,由目标网络结构学习目标关联特征与标签数据的关系,得到分析模型。

图6为本申请实施例提供的一种数据处理装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图6所示,该装置包括:

获取模块61,用于获取请求方发送的服务推送请求,服务推送请求携带请求方信息;

分析模块62,用于根据各个特征集合的关联关系得到特征组合集合;

输入模块63,用于将组合特征输入预先训练的分析模型,得到由分析模型输出的待推送内容的权重;

确定模块64,用于根据待推送内容的权重确定发送至请求方的目标推送内容。

本申请实施例还提供一种电子设备,如图7所示,电子设备可以包括:处理器1501、通信接口1502、存储器1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。

存储器1503,用于存放计算机程序;

处理器1501,用于执行存储器1503上所存放的计算机程序时,实现上述实施例的步骤。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据处理方法。

在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据处理方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk)等。

以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种数据处理方法、装置、电子设备和存储介质
  • 一种图像数据处理方法、装置、电子设备及其存储介质
技术分类

06120112640738