掌桥专利:专业的专利平台
掌桥专利
首页

一种数据处理方法和相关装置

文献发布时间:2024-04-18 19:58:30


一种数据处理方法和相关装置

技术领域

本申请涉及数据测试技术领域,特别是涉及一种数据处理方法和相关装置。

背景技术

为提升用户体验,开发者会持续开发新产品和新算法,需要一个高效的方法快速准确的测试新产品和新算法在用户体验上的真实效果,从而促进产品和算法的快速迭代,这对产品的发展具有非常重大的意义。

在相关技术中,测试算法或产品变化影响的常用方法是AB实验法,即随机抽取两批用户作为实验组和对照组,实验组用户看到的是新产品或算法的效果,而对照组用户看到的是现有产品或算法的效果,然后通过数据分析对新产品或算法的收益进行评价。

然而,这种测试方式得出的测试结果准确性较差,难以准确体现出测试内容对于用户体验的实际影响。

发明内容

为了解决上述技术问题,本申请提供了一种数据处理方法,提高了测试结果的准确度。

本申请实施例公开了如下技术方案:

第一方面,本申请实施例公开了一种数据处理方法,所述方法包括:

获取第一用户在测试时段对应的实验组数据,所述实验组数据是所述第一用户在第一测试条件集合下产生的,所述实验组数据具有对应的数据指标;

获取所述第一用户在所述数据指标下对应的第一历史时段数据;

根据所述第一历史时段数据,预测所述第一用户在第二测试条件集合下对应的第一预测数据,所述第一预测数据对应所述测试时段,所述第一测试条件集合和所述第二测试条件集合的区别为目标测试条件;

根据所述第一预测数据和所述实验组数据,确定所述目标测试条件的测试结果。

第二方面,本申请实施例公开了一种数据处理装置,所述装置包括第一获取单元、第二获取单元、预测单元和确定单元:

所述第一获取单元,用于获取第一用户在测试时段对应的实验组数据,所述实验组数据是所述第一用户在第一测试条件集合下产生的,所述实验组数据具有对应的数据指标;

所述第二获取单元,用于获取所述第一用户在所述数据指标下对应的第一历史时段数据;

所述预测单元,用于根据所述第一历史时段数据,预测所述第一用户在第二测试条件集合下对应的第一预测数据,所述第一预测数据对应所述测试时段,所述第一测试条件集合和所述第二测试条件集合的区别为目标测试条件;

所述确定单元,用于根据所述第一预测数据和所述实验组数据,确定所述目标测试条件的测试结果。

在一种可能的实现方式中,所述确定单元具体用于:

根据所述第一预测数据和所述实验组数据之间的差异,确定所述目标测试条件的测试结果。

在一种可能的实现方式中,所述预测单元具体用于:

通过所述第二测试条件集合对应的第一预测模型,根据所述第一历史时段数据,预测所述第一用户在所述第二测试条件集合下对应的第一预测数据,所述第一预测模型用于预测用户在所述第二测试条件集合下对应的测试数据。

在一种可能的实现方式中,所述确定单元具体用于:

根据所述实验组数据训练得到第二预测模型,所述第二预测模型用于预测用户在所述第一测试条件集合下产生的测试数据;

根据所述第一历史时段数据和所述第二预测模型,确定所述第一用户在所述第一测试条件集合下对应的第二预测数据;

根据所述第一预测数据和所述第二预测数据的差异,确定所述目标测试条件的测试结果。

在一种可能的实现方式中,所述第一预测模型是通过以下方式得到的:

获取第二用户在所述测试时段对应的测试组数据,所述测试组数据是所述第二用户在所述第二测试条件集合下产生的,所述测试组数据与所述实验组数据对应相同的数据指标;

获取所述第二用户在所述数据指标下对应的第二历史时段数据,所述第一历史时段数据和所述第二历史时段数据对应相同的历史时段;

将所述第二历史时段数据作为输入,将所述测试组数据作为期望输出,调整初始预测模型,得到所述第一预测模型。

在一种可能的实现方式中,所述第一测试条件集合预测单元具体用于:

将所述第一历史时段数据作为输入,将所述实验组数据作为期望输出,调整初始预测模型,得到所述第一预测模型。

在一种可能的实现方式中,所述确定单元具体用于;

若所述差异超过预测阈值,确定所述测试结果为所述目标测试条件为显著条件;

若所述差异未超过所述预测阈值,确定所述测试结果为所述目标测试条件为不显著条件。

在一种可能的实现方式中,所述数据指标包括视频点击量、停留时长、视频观看时长、视频曝光度中的任意一种或多种的组合。

第三方面,本申请实施例公开了一种计算机设备,所述设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令执行第一方面中任意一项所述的数据处理方法。

第四方面,本申请实施例公开了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行第一方面中任意一项所述的数据处理方法。

第五方面,本申请实施例公开了一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行第一方面中任意一项所述的数据处理方法。

由上述技术方案可以看出,在进行测试时,可以先获取第一用户在测试时段对应的实验组数据,该实验组数据是第一用户在第一测试条件集合下产生的,然后可以获取第一用户在该数据指标下对应的第一历史时段数据,并根据该第一历史时段数据,预测该第一用户在第二测试条件集合下对应的第一预测数据,该第一预测数据对应该测试时段,该第一测试条件集合和第二测试条件集合的区别为目标测试条件。由于通过该实验组数据能够分析出第一用户在第一测试条件集合下的用户反应,通过该第一预测数据能够分析出第一用户在第二测试条件集合下的用户反应,因此通过该实验组数据和该第一预测数据能够在一定程度上分析出该第一用户在该目标测试条件下的用户反应差别,进而能够确定出该目标测试条件对应的测试结果。由于该第一预测数据和实验组数据是基于同一批用户得到的,因此在一定程度上可以避免测试用户不同带来目标测试条件以外的测试干扰因素,提高了测试结果的准确度。同时,该方案无需同一用户针对多个测试条件进行多次测试,只需进行一次用户测试,也保障了测试效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种实际应用场景中数据处理方法的示意图;

图2为本申请实施例提供的一种数据处理方法的流程图;

图3为本申请实施例提供的一种数据处理方法的示意图;

图4为本申请实施例提供的一种数据处理方法的示意图;

图5为本申请实施例提供的一种实际应用场景中数据处理方法的示意图;

图6为本申请实施例提供的一种数据处理方法的示意图;

图7为本申请实施例提供的一种数据处理方法的示意图;

图8为本申请实施例提供的一种数据处理装置的结构框图;

图9为本申请实施例提供的一种终端的结构图;

图10为本申请实施例提供的一种服务器的结构图。

具体实施方式

下面结合附图,对本申请的实施例进行描述。

在相关技术中,在进行测试时,普遍采用用户分组的方式进行测试,即随机抽取两批用户作为实验组和对照组,实验组用户看到的是新产品或算法的效果,而对照组用户看到的是现有产品或算法的效果,然后通过数据分析对新产品或算法的收益进行评价。

然而,由于所属实验组和对照组的用户本身具有一定差异,例如两个组的用户对于某款产品的使用活跃度针对同一款产品本身就有所差别,因此当通过两个组用户的活跃度数据进行测试分析时,会由于用户本身的差别给测试数据带来干扰,难以直接反映出新的测试条件本身所带给用户在用户活跃度上的效果,测试效果较差。

为了解决上述技术问题,本申请提供了一种数据处理方法,处理设备可以基于同一批用户对应的实际测试数据和预测数据进行测试结果分析,降低了用户差异对测试带来的干扰,提高了测试结果的准确度。

可以理解的是,该方法可以应用于处理设备上,该处理设备为能够进行数据处理的处理设备,例如可以为具有数据处理功能的终端设备或服务器。该方法可以通过终端设备或服务器独立执行,也可以应用于终端设备和服务器通信的网络场景,通过终端设备和服务器配合执行。其中,终端设备可以为计算机、手机等设备。服务器可以理解为是应用服务器,也可以为Web服务器,在实际部署时,该服务器可以为独立服务器,也可以为集群服务器。

为了便于理解本申请实施例提供的技术方案,接下来,将结合一种实际应用场景,对本申请实施例提供的一种数据处理方法进行介绍。

参见图1,图1为本申请实施例提供的一种实际应用场景中数据处理方法的示意图,在该实际应用场景中,处理设备为具有数据处理功能的服务器101。

针对多个用户进行测试时,服务器101可以获取多个用户在测试时段中,基于第一测试条件集合产生的实验组数据,在该实际应用场景中,第一测试条件集合为更新后测试应用,该更新后测试应用是更新前测试应用在增加目标测试条件后得到的,该实验组数据具有对应的数据指标。

针对该多个用户,服务器101可以获取多个用户在历史时段对应的历史时段数据,该历史时段数据同样对应于该数据指标。然后基于该历史时段数据预测多个用户在第二测试条件集合下,即针对更新前测试应用产生的预测数据。由于基于该实验组数据能够分析出用户在第一测试条件集合下的测试反应,基于该预测数据能够分析出用户在第二测试条件集合下的测试反应,因此,通过该预测数据和实验组数据,可以在一定程度上分析出多个用户针对更新前测试应用和更新后测试应用的反应区别,从而体现出该目标测试条件在多个用户上的反响,确定出该目标测试条件的测试结果。由于该预测数据和实验组数据是同一批用户针对不同测试条件得出的数据,因此能够降低用户不同带来的数据干扰,得到更加准确地测试结果。

接下来,将结合附图,对本申请实施例提供的一种数据处理方法进行介绍。

参见图2,图2为本申请实施例提供的一种数据处理方法的流程图,该方法包括:

S201:获取第一用户在测试时段对应的实验组数据。

本申请主要应用于测试场景,测试的目的是针对某一个或多个测试条件来分析该测试条件的有无在实际情况中的效果差异,该效果差异在本申请中主要体现在用户反应上。因此,在本申请中,测试为采用不同的测试条件来获取用户对应该测试条件的反应,基于用户的反应差别是否明显来确定测试条件对于用户来说是否显著。其中,用户反应是指用户在测试时所能够体现出自身体验的反应,例如,针对视频软件的测试,该用户反应可以为用户在看视频时做出的操作反应,如看视频的停留时长、点赞概率等。该用户反应可以通过处理设备所采集或预测得到的各种测试指标下的测试数据进行体现。

在进行测试时,处理设备可以将用户先分实验组和测试组,第一用户为实验组对应的用户,该第一用户按照测试需求可以为一个或多个。实验组中的用户在第一测试条件集合下进行测试,测试组中的用户在第二测试条件集合下进行测试,该第一测试条件集合和第二测试条件集合的区别为目标测试条件,该目标测试条件为此次测试所针对的测试条件,即此次测试的目的在于测试用户对于有无该目标测试条件的用户体验差距是否明显,从而得出该目标测试条件是否为能够在用户体验上带来改进的测试条件。

需要测试在用户层面上的效果的条件,例如可以为产品上的某一改进等。例如,如图3所示,图3为本申请实施例提供的一种测试场景示意图,其中第一测试条件集合为将视频在手机界面中的第三条内容后插入,第二测试条件集合为将视频在手机界面中的第四条内容后插入,目标测试条件即为将视频插入位置上移,以测试用户对于新的视频插入位置的接受度。

该实验组数据为该第一用户在第一测试条件集合下产生的,即第一用户在测试时段中在第一测试条件集合下所产生的数据,该实验组数据具有对应的数据指标,该数据指标用于体现用户对于该第一测试条件集合的意向程度,根据测试内容的不同,该数据指标也可以包括多种,例如,在一种可能的实现方式中,该数据指标可以包括视频点击量、停留时长、视频观看时长、视频曝光度中的任意一种或多种的组合。

S202:获取第一用户在数据指标下对应的第一历史时段数据。

为了消除用户自身的差异对测试结果的干扰,在本申请实施例中,处理设备可以基于同一用户产生的数据对测试结果进行确定。通过上一步骤,处理设备获得了该第一用户在第一测试条件集合下的测试数据,基于该实验组数据能够分析出第一用户在第一测试条件集合下的用户反应,因此处理设备还需要获取能够用于分析第一用户在第二测试条件集合下的用户反应的测试数据。

可以理解的是,用户的历史数据在一定程度上能够体现出用户的个人习惯,例如用户对于某款产品的历史使用数据能够体现出该用户对于该产品的使用习惯。因此,为了能够快速得到较为准确的用户数据,处理设备可以先获取该第一用户在数据指标下对应的第一历史时段数据,该第一历史时段数据为该第一用户在历史时段中产生的数据。当然,为了使处理设备能够较为准确地依靠该第一历史时段数据对用户数据进行预测,该第一历史时段数据必须与该实验组数据对应相同的数据指标,从而才能得到对此次测试有效的数据。

例如,当实验组数据的数据指标为用户对于某款产品的停留时长时,该第一历史时段数据也应当为该用户在历史时段中对于该产品的停留时长,从而能够提高数据的一致性,降低对测试结果的干扰。

S203:根据第一历史时段数据,预测第一用户在第二测试条件集合下对应的第一预测数据。

其中,第一预测数据对应所述测试时段,即该第一预测数据为模拟第一用户在测试时段中,在第二测试条件集合下所产生的数据。由于该第一历史时段数据能够较为准确的体现出用户的行为特征,因此该第一预测数据也能够较为准确地体现出该第一用户在第二测试条件集合下的用户体验。

S204:根据第一预测数据和实验组数据,确定目标测试条件的测试结果。

上已述及,通过该实验组数据能够分析出该第一用户在测试时段中,在第一测试条件集合下的用户体验,该第一预测数据能够较为准确的体现出该第一用户在测试时段中,在第二测试条件集合下的用户体验,因此,通过该第一预测数据和实验组数据,处理设备可以分析出第一用户针对该目标测试条件的用户体验差异,进而能够确定出目标测试条件的测试结果。

由上述技术方案可以看出,在进行测试时,可以先获取第一用户在测试时段对应的实验组数据,该实验组数据是第一用户在第一测试条件集合下产生的,然后可以获取第一用户在该数据指标下对应的第一历史时段数据,并根据该第一历史时段数据,预测该第一用户在第二测试条件集合下对应的第一预测数据,该第一预测数据对应该测试时段,该第一测试条件集合和第二测试条件集合的区别为目标测试条件。由于通过该实验组数据能够分析出第一用户在第一测试条件集合下的用户反应,通过该第一预测数据能够分析出第一用户在第二测试条件集合下的用户反应,因此通过该实验组数据和该第一预测数据能够在一定程度上分析出该第一用户在该目标测试条件下的用户反应差别,进而能够确定出该目标测试条件对应的测试结果。由于该第一预测数据和实验组数据是基于同一批用户得到的,因此在一定程度上可以避免测试用户不同带来目标测试条件以外的测试干扰因素,提高了测试结果的准确度。同时,该方案无需同一用户针对多个测试条件进行多次测试,只需进行一次用户测试,也保障了测试效率。

其中,基于实验组数据和第一预测数据确定测试结果的方式有多种,在本申请中,主要可以分为直接基于实验组数据进行分析和基于实验组数据确定预测数据进行分析两种,接下来将针对这两种不同方式进行分别介绍。

在一种可能的实现方式中,处理设备可以直接根据该第一预测数据和实验组数据之间的差异,确定该目标测试条件的测试结果。由于该实验组数据能够直接体现出第一用户在该第一测试条件集合的用户反应,该第一预测数据能够较为准确的体现出第一用户在第二测试条件集合下的用户反应,因此,通过该第一预测数据和实验组数据之间的差异,能够直接反应出用户针对该目标测试条件的测试条件差别下所产生的用户反应差异,进而能够确定出该目标测试条件的测试效果。

在一种可能的实现方式中,在进行数据预测时,处理设备可以通过第二测试条件集合对应的第一预测模型,根据该第一历史时段数据,预测该第一用户在第二测试条件集合下对应的第一预测数据,该第一预测模型用于预测用户在所述第二测试条件集合下对应的测试数据第二测试条件集合。

具体的,在一种可能的实现方式中,该第一预测模型可以是通过以下方式得到的:

处理设备先获取第二用户在测试时段对应的测试组数据,该测试组数据是第二用户在第二测试条件集合下产生的,该测试组数据与实验组数据对应相同的数据指标,即该测试组数据用于体现第二用户在第二测试条件集合下的用户体验。同理,处理设备可以获取该第二用户在数据指标下对应的第二历史时段数据,该第二历史时段数据用于体现该第二用户的用户特点,为了使该第一预测模型能够更加适用于对第一预测数据进行预测,处理设备可以确保该第一历史时段数据和第二历史时段数据对应相同的历史时段。

处理设备可以将该第二历史时段数据作为输入,将所述测试组数据作为期望输出,调整初始预测模型,得到该第一预测模型。在调整过程中,该初始预测模型可以逐步缩小基于该第二历史时段数据所预测出的第一待定预测数据与该测试组数据之间的差异,从而可以使该初始预测模型学习到如何较为准确的基于用户的历史时段数据预测用户在第二测试条件集合下所产生的用户数据,进而得到该第一预测模型。

除了通过实际测试获得数据来训练模型外,处理设备还可以采用一些设定好的数据来训练模型的相关参数。例如,参见图4,当该初始预测模型为回归预测(ExtremeGradient Boosting,简称XGBoost)模型时,处理设备可以设定收益值(ratio)分别为0.001、0.015和0.02,该收益值是指实验组数据相较于对照组数据的收益,例如当对照组的用户数据为1000时,实验组用户数据在收益值为0.001下为1001,来模拟实验组和对照组数据之间的差异,通过模拟出的数据对不同模型参数n_estimators和max_depth的XGBoost模型进行测试,n_estimators为XGBoost决策树的个数,max_depth表示每个决策树的最大深度,通过一二类错误率可以体现出该模型的预测准确度,由图4可见,在n_estimators为10,max_depth为7时模型错误率最低,因此可以将该参数确定为模型参数进行预测。

在另一种可能的实现方式中,处理设备可以基于实验组数据对第一用户在第一测试条件集合下的用户反应进行分析。可以理解的是,当处理设备采用第一预测模型来预测第一预测数据时,该第一预测数据中会带有模型预测所产生的数据特点,因此,为了尽可能提高对测试结果分析的准确度,处理设备可以同样采用模型预测的方式来确定该第一用户在第一测试条件集合下对应的测试数据。

上已述及,该实验组数据能够体现出用户在第一测试条件集合下的测试情况,因此,处理设备可以根据该实验组数据训练得到第二预测模型,该第二预测模型用于预测用户在第一测试条件集合下产生的测试数据。处理设备可以根据该第一历史时段数据和第二预测模型,确定该第一用户在第一测试条件集合下对应的第二预测数据,从而该第二预测数据与第一预测数据可以在数据性质上相较于实验组数据来说更为接近,都带有一定的模型预测所产生的数据特点。基于此,处理设备可以根据第一预测数据和第二预测数据的差异,确定目标测试条件的测试结果,从而消除模型预测所带来的数据差异影响,进一步提高预测的准确度。

第一测试条件集合与第一预测模型相似,在一种可能的实现方式中,第一测试条件集合在根据实验组数据训练第二预测模型时,处理设备可以将第一历史时段数据作为输入,将实验组数据作为期望输出,调整初始预测模型,得到所述第一预测模型。在调整过程中,该初始预测模型可以逐步缩小基于该第一历史时段数据所预测出的第二待定预测数据与该实验组数据之间的差异,从而可以使该初始预测模型学习到如何较为准确的基于用户的历史时段数据预测用户在第一测试条件集合下所产生的用户数据,进而得到该第二预测模型。由于该第二预测模型和第一预测模型是基于同一初始预测模型训练得到的,因此在一定程度上可以降低模型不同对测试结果带来的干扰,得到更加准确地测试结果。例如,该第一预测模型和第二预测模型都可以是基于上述XGBoost模型训练得到的。

具体的,在一种可能的实现方式中,在确定测试结果时,处理设备可以设定一个预测阈值,若该第一预测数据和第二预测数据之间的差异超过该预测阈值,说明第一用户在面对该是否具有该目标测试条件的差异时,用户体验差距较大,是否具有该目标测试条件能够给用户体验带来较为显著的改变,因此可以确定测试结果为该目标测试条件为显著条件,即能够给用户体验带来较大改变的测试条件;若该差异未超过预测阈值,处理设备可以确定该测试结果为目标测试条件为不显著条件,即不能为用户体验带来较大改变的测试条件。

为了便于理解本申请实施例提供的技术方案,接下来,将结合一种实际应用场景,对本申请实施例提供的数据处理方法进行介绍。

参见图5,图5为本申请实施例提供的一种实际应用场景中数据处理方法的示意图,在该实际应用场景中,第一测试条件集合为更新后的产品,第二测试条件集合为更新前的产品,测试数据的数据指标为人均停留时长。

1、实验后用户粒度指标计算。

假设实验中的测试时段是1月1日到1月3日,处理设备可以收集该实验影响的所有用户的人均停留时长数据(即用户在产品中所停留的时长,能够体现出用户对于产品的意向程度),产出用户粒度数据供下个模块处理,用户粒度数据即为以用户为单位的数据,每个用户包含三天的总停留时长,产出实验组数据。

2、实验用户实验前特征提取。

基于上一步产出的用户数据,处理设备可以在数据库中匹配这些用户在实验前的人均停留时长作为历史时段数据,该历史时段数据能够反映出用户自身的特征。具体周期包括三个(假设实验开始第一天为第N天),历史时段数据1:[N-1,N-3]天的停留时长,历史时段数据2:[N-4,N-10]天的停留时长,历史时段数据3:[N-11,N-20]天的停留时长。

3、核心指标模型训练。

分别基于XGboost-regression模型对实验组和对照组进行建模,把每个用户粒度的数据作为样本,输入数据为第2步获取的历史时段数据,训练目标值为第1步产生的测试数据。训练后生成实验组和对照组对应的两个XGboost-regression模型。

4、核心指标收益估计。

把第2步的数据重新按实验组和对照组分别输入到第3步生成的模型中,即将每一个用户的历史时段数据都输入到对照组和实验组对应的模型中,预测出该用户在第一测试条件集合下和第二测试条件集合下分别对应的预测数据。

每个用户产生两个个预测值y

5、平台展示。

基于第4步计算的结果,处理设备可以通过平台展示,如图6所示,图6展示了测试中对应各个数据指标的测试结果。

6、模型验证与调优:

处理设备可以通过不同的ratio对模型进行更加细致的参数调节,ratio表示模拟加到实验组数据的收益(假设ratio为0.01,对照组指标值为100,那么实验组指标值为101)。如图7所示,1000次模拟实验结果显示,本申请实施例提供的数据处理方法相对于传统的测试方式,一二类错误率均有明显下降。当然,除了采用XGboost模型,本申请用于预测的模型也可以用其他模型替代,如线性模型等,此处不做限定。

基于上述实施例提供的一种数据处理方法,本申请实施例还提供了一种一种数据处理装置,参见图8,图8为本申请实施例提供的一种数据处理装置800的结构框图,所述装置包括第一获取单元801、第二获取单元802、预测单元803和确定单元804:

所述第一获取单元801,用于获取第一用户在测试时段对应的实验组数据,所述实验组数据是所述第一用户在第一测试条件集合下产生的,所述实验组数据具有对应的数据指标;

所述第二获取单元802,用于获取所述第一用户在所述数据指标下对应的第一历史时段数据;

所述预测单元803,用于根据所述第一历史时段数据,预测所述第一用户在第二测试条件集合下对应的第一预测数据,所述第一预测数据对应所述测试时段,所述第一测试条件集合和所述第二测试条件集合的区别为目标测试条件;

所述确定单元804,用于根据所述第一预测数据和所述实验组数据之间的差异,确定所述目标测试条件的测试结果。

在一种可能的实现方式中,所述确定单元804具体用于:

根据所述第一预测数据和所述实验组数据之间的差异,确定所述目标测试条件的测试结果。

在一种可能的实现方式中,所述预测单元803具体用于:

通过所述第二测试条件集合对应的第一预测模型,根据所述第一历史时段数据,预测所述第一用户在所述第二测试条件集合下对应的第一预测数据,所述第一预测模型用于预测用户在所述第二测试条件集合下对应的测试数据。

在一种可能的实现方式中,所述确定单元804具体用于:

根据所述实验组数据训练得到第二预测模型,所述第二预测模型用于预测用户在所述第一测试条件集合下产生的测试数据;

根据所述第一历史时段数据和所述第二预测模型,确定所述第一用户在所述第一测试条件集合下对应的第二预测数据;

根据所述第一预测数据和所述第二预测数据的差异,确定所述目标测试条件的测试结果。

在一种可能的实现方式中,所述第一预测模型是通过以下方式得到的:

获取第二用户在所述测试时段对应的测试组数据,所述测试组数据是所述第二用户在所述第二测试条件集合下产生的,所述测试组数据与所述实验组数据对应相同的数据指标;

获取所述第二用户在所述数据指标下对应的第二历史时段数据,所述第一历史时段数据和所述第二历史时段数据对应相同的历史时段;

将所述第二历史时段数据作为输入,将所述测试组数据作为期望输出,调整初始预测模型,得到所述第一预测模型。第一测试条件集合在一种可能的实现方式中,所述第一测试条件集合预测单元具体用于:

将所述第一历史时段数据作为输入,将所述实验组数据作为期望输出,调整初始预测模型,得到所述第一预测模型。

在一种可能的实现方式中,所述确定单元804具体用于;

若所述差异超过预测阈值,确定所述测试结果为所述目标测试条件为显著条件;

若所述差异未超过所述预测阈值,确定所述测试结果为所述目标测试条件为不显著条件。

在一种可能的实现方式中,所述数据指标包括视频点击量、停留时长、视频观看时长、视频曝光度中的任意一种或多种的组合。

本申请实施例还提供了一种计算机设备,下面结合附图对该设备进行介绍。请参见图9所示,本申请实施例提供了一种设备,该设备还可以是终端设备,该终端设备可以为包括手机、平板电脑、个人数字助理(Personal Digital Assistant,简称PDA)、销售终端(Point of Sales,简称POS)、车载电脑等任意智能终端,以终端设备为手机为例:

图9示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图9,手机包括:射频(Radio Frequency,简称RF)电路710、存储器720、输入单元730、显示单元740、传感器750、音频电路760、无线保真(Wireless Fidelity,简称WiFi)模块770、处理器780、以及电源790等部件。本领域技术人员可以理解,图9中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图9对手机的各个构成部件进行具体的介绍:

RF电路710可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器780处理;另外,将设计上行的数据发送给基站。通常,RF电路710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,简称LNA)、双工器等。此外,RF电路710还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobile communication,简称GSM)、通用分组无线服务(GeneralPacket Radio Service,简称GPRS)、码分多址(Code Division Multiple Access,简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称WCDMA)、长期演进(Long Term Evolution,简称LTE)、电子邮件、短消息服务(Short Messaging Service,简称SMS)等。

存储器720可用于存储软件程序以及模块,处理器780通过运行存储在存储器720的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器720可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器720可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元730可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元730可包括触控面板731以及其他输入设备732。触控面板731,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板731上或在触控面板731附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板731可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器780,并能接收处理器780发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板731。除了触控面板731,输入单元730还可以包括其他输入设备732。具体地,其他输入设备732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元740可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元740可包括显示面板741,可选的,可以采用液晶显示器(Liquid CrystalDisplay,简称LCD)、有机发光二极管(Organic Light-Emitting Diode,简称OLED)等形式来配置显示面板741。进一步的,触控面板731可覆盖显示面板741,当触控面板731检测到在其上或附近的触摸操作后,传送给处理器780以确定触摸事件的类型,随后处理器780根据触摸事件的类型在显示面板741上提供相应的视觉输出。虽然在图9中,触控面板731与显示面板741是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板731与显示面板741集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器750,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板741的亮度,接近传感器可在手机移动到耳边时,关闭显示面板741和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

音频电路760、扬声器761,传声器762可提供用户与手机之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号,传输到扬声器761,由扬声器761转换为声音信号输出;另一方面,传声器762将收集的声音信号转换为电信号,由音频电路760接收后转换为音频数据,再将音频数据输出处理器780处理后,经RF电路710以发送给比如另一手机,或者将音频数据输出至存储器720以便进一步处理。

WiFi属于短距离无线传输技术,手机通过WiFi模块770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图9示出了WiFi模块770,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

处理器780是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器720内的软件程序和/或模块,以及调用存储在存储器720内的数据,执行手机的各种功能和处理数据,从而对手机进行整体检测。可选的,处理器780可包括一个或多个处理单元;优选的,处理器780可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器780中。

手机还包括给各个部件供电的电源790(比如电池),优选的,电源可以通过电源管理系统与处理器780逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。

在本实施例中,该终端设备所包括的处理器780还具有以下功能:

获取第一用户在测试时段对应的实验组数据,所述实验组数据是所述第一用户在第一测试条件集合下产生的,所述实验组数据具有对应的数据指标;

获取所述第一用户在所述数据指标下对应的第一历史时段数据;

根据所述第一历史时段数据,预测所述第一用户在第二测试条件集合下对应的第一预测数据,所述第一预测数据对应所述测试时段,所述第一测试条件集合和所述第二测试条件集合的区别为目标测试条件;

根据所述第一预测数据和所述实验组数据,确定所述目标测试条件的测试结果。

本申请实施例还提供一种服务器,请参见图10所示,图10为本申请实施例提供的服务器800的结构图,服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,简称CPU)822(例如,一个或一个以上处理器)和存储器832,一个或一个以上存储应用程序842或数据844的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器822可以设置为与存储介质830通信,在服务器800上执行存储介质830中的一系列指令操作。

服务器800还可以包括一个或一个以上电源826,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口858,和/或,一个或一个以上操作系统841,例如Windows Server

上述实施例中由服务器所执行的步骤可以基于图10所示的服务器结构。

本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行前述各个实施例所述的数据处理方法中的任意一种实施方式。

根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例各种可选实现方式中提供的数据处理方法。

可以理解的是,在本申请的具体实施方式中,涉及到用户信息(例如历史时段数据)等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

相关技术
  • 一种SDH数据处理方法、系统及相关装置
  • 一种技术评审数据处理方法及相关装置
  • 一种数据库的审计日志处理方法及相关装置
  • 一种数据处理方法以及相关装置
  • 一种数据处理方法、装置和用于数据处理的装置
  • 通过显示接口传送/接收压缩相关指示信息的数据处理装置与相关数据处理方法
  • 发送/接收图片的压缩的像素数据组和像素数据分组设定的指示信息的数据处理装置以及相关数据处理方法
技术分类

06120116499001