掌桥专利:专业的专利平台
掌桥专利
首页

一种活跃用户预测方法、装置、电子设备及可读存储介质

文献发布时间:2023-06-19 12:14:58


一种活跃用户预测方法、装置、电子设备及可读存储介质

技术领域

本申请涉及计算机数据处理技术,尤其涉及一种活跃用户预测方法、装置、电子设备及计算机可读存储介质。

背景技术

作为反映网站、互联网应用或网络游戏的运营情况的重要分析数据,日活跃用户数(DAU,Daily Active User)能够为渠道推广、成本预估提供一些数据支持和帮助,数据分析时经常会监测日活跃用户数涨跌、以及分析涨跌原因。

相关技术中,日活跃用户数只与新增用户数和历史用户留存相关,基于新增用户数和历史用户留存进行活跃用户数预测,这种方案预测得到的活跃用户数与实际的活跃用户数之间的误差较大,严重影响推广策略调整及成本预算。

发明内容

本申请实施例提供一种活跃用户预测方法、装置、电子设备及计算机可读存储介质,能够提高活跃用户数预测的准确性。

本申请实施例的技术方案是这样实现的:

本申请实施例提供一种活跃用户预测方法,包括:

获取目标应用在目标周期的应用场景,并获取所述目标周期前的每个周期的新增用户数;

从多个候选留存系数中,确定与所述目标周期的应用场景对应的目标留存系数;

基于所述目标留存系数以及所述目标周期前的每个周期的新增用户数,确定所述目标周期前的每个周期在所述目标周期的用户留存数;

基于所述目标周期前的每个周期在所述目标周期的用户留存数、以及所述目标周期的新增用户数,确定所述目标应用在所述目标周期的活跃用户数。

上述技术方案中,所述方法还包括:

显示所述目标应用的多个所述应用场景;

响应于针对多个所述应用场景的调整操作,获取并显示调整后的所述应用场景。

上述技术方案中,所述获取所述目标周期前的每个周期的新增用户数,包括:

获取所述目标周期前的每个周期的推广数据以及对应的转化率;

基于所述每个周期的推广数据以及对应的转化率调用新增用户预测模型,得到所述目标周期前的每个周期的新增用户数。

本申请实施例提供一种活跃用户预测装置,包括:

获取模块,用于获取目标应用在目标周期的应用场景,并获取所述目标周期前的每个周期的新增用户数;

第一确定模块,用于从多个候选留存系数中,确定与所述目标周期的应用场景对应的目标留存系数;

第二确定模块,用于基于所述目标留存系数以及所述目标周期前的每个周期的新增用户数,确定所述目标周期前的每个周期在所述目标周期的用户留存数;

第三确定模块,用于基于所述目标周期前的每个周期在所述目标周期的用户留存数、以及所述目标周期的新增用户数,确定所述目标应用在所述目标周期的活跃用户数。

上述技术方案中,所述第一确定模块还用于基于所述目标周期的应用场景,查询不同应用场景与候选留存系数的对应关系;

将查询到的候选留存系数作为与所述目标周期的应用场景对应的目标留存系数。

上述技术方案中,所述装置还包括:

预处理模块,用于获取每个所述应用场景分别对应的多个历史留存数据;

基于任一所述应用场景对应的多个历史留存数据进行拟合处理,得到任一所述应用场景对应的留存系数;

基于多个所述应用场景对应的留存系数,构建不同应用场景与所述候选留存系数的对应关系。

上述技术方案中,所述预处理模块还用于获取每个所述应用场景分别对应的多个候选历史留存数据的时间戳;

基于所述候选历史留存数据的时间戳,对任一所述应用场景对应的多个候选历史留存数据进行降序排序,将所述降序排序在前的部分候选历史留存数据作为任一所述应用场景对应的多个历史留存数据。

上述技术方案中,所述预处理模块还用于获取任一所述应用场景对应的多个候选历史留存数据以及对应的多个基于所述留存系数预测的留存数据;

当所述候选历史留存数据与对应的所述预测的留存数据之间的差异小于差异阈值时,将所述候选历史留存数据作为任一所述应用场景对应的历史留存数据。

上述技术方案中,所述预处理模块还用于针对任一所述应用场景构建对应的初始留存系数;

基于任一所述应用场景对应的多个历史留存数据对所述初始留存系数进行参数拟合,将得到的拟合参数作为任一所述应用场景对应的留存系数的参数。

上述技术方案中,所述预处理模块还用于显示任一所述应用场景对应的多个历史留存数据;

响应于针对所述多个历史留存数据的拟合操作,获取并显示对应的多条候选拟合曲线;

响应于针对所述多条候选拟合曲线的选择操作,将选择的所述候选拟合曲线作为任一所述应用场景对应的留存系数的拟合曲线。

上述技术方案中,所述第二确定模块还用于基于所述目标留存系数以及所述目标周期前的任一所述周期,确定所述目标周期前的任一所述周期对应的留存率;

基于所述目标周期前的任一所述周期对应的留存率以及任一所述周期的新增用户数,确定所述目标周期前的任一所述周期在所述目标周期的用户留存数。

上述技术方案中,所述第二确定模块还用于将所述目标周期与所述目标周期前的任一所述周期的差值作为留存周期;

基于所述留存周期以及所述目标留存系数,确定所述目标周期前的任一所述周期对应的留存率。

上述技术方案中,所述装置还包括:

优化模块,用于实时获取所述目标应用在所述目标周期的实际活跃用户数;

基于所述目标留存系数预测得到的活跃用户数据以及所述实际活跃用户数,对所述目标留存系数进行优化,得到优化后的所述目标留存系数。

上述技术方案中,所述优化模块还用于当所述预测得到的活跃用户数据与所述实际活跃用户数之间的差值大于差值阈值时,基于所述目标应用场景对应的多个所述实际活跃用户数进行拟合处理,得到优化后的所述目标留存系数。

上述技术方案中,所述装置还包括:

调整模块,用于显示所述目标应用的多个所述应用场景;

响应于针对多个所述应用场景的调整操作,获取并显示调整后的所述应用场景。

上述技术方案中,所述获取模块还用于基于所述目标周期前的周期的应用场景以及所述目标周期的属性调用场景识别模型,得到所述目标应用在所述目标周期的多个候选应用场景;

响应于针对所述多个候选应用场景的选择操作,将选择的所述候选应用场景作为所述目标应用在所述目标周期的应用场景。

上述技术方案中,所述获取模块还用于获取所述目标周期前的每个周期的推广数据以及对应的转化率;

基于所述每个周期的推广数据以及对应的转化率调用新增用户预测模型,得到所述目标周期前的每个周期的新增用户数。

本申请实施例提供一种用于活跃用户预测的电子设备,所述电子设备包括:

存储器,用于存储可执行指令;

处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的活跃用户预测方法。

本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本申请实施例提供的活跃用户预测方法。

本申请实施例具有以下有益效果:

通过与目标周期的应用场景对应的目标留存系数,确定目标周期前的每个周期在目标周期的用户留存数,从而通过准确的用户留存数,预测出精准的、符合实际场景的活跃用户数,以提高活跃用户数预测的准确性,进而便于后续的推广策略调整及成本预算。

附图说明

图1是相关技术提供的留存散点图;

图2是相关技术提供的基于散点拟合的曲线图;

图3是相关技术提供的日活跃用户数的示意图;

图4是相关技术提供的日活跃用户数的示意图;

图5是本申请实施例提供的活跃用户数预测系统10的应用场景示意图;

图6是本申请实施例提供的用于活跃用户预测的电子设备500的结构示意图;

图7A-图7B是本申请实施例提供的活跃用户预测方法的流程示意图;

图8是相关技术提供的日活跃用户数的示意图;

图9是本申请实施例提供的提高DAU预估准确性的技术方案的流程示意图;

图10是本申请实施例提供的每日留存人数的计算示意图;

图11是本申请实施例提供的每日留存人数的计算结果示意图;

图12是本申请实施例提供的每一天新增的后续留存数的示意图;

图13是本申请实施例提供的每天的DAU的示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。

1)人工智能(AI,Artificial Intelligence,):计算机科学的一个综合技术,过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

2)客户端:终端设备中运行的用于提供各种服务的应用程序,例如视频播放客户端、游戏客户端等。

3)响应于:用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。

4)日活跃用户数(DAU,Daily Active User):常用于反映网站、互联网应用或网络游戏的运营情况,DAU通常统计一天(以天为一个周期)之内,登录或使用了某个应用的用户数(去除重复登录的用户)。通常DAU会结合月活跃用户数量(MAU,Mouth Active User)一起使用,这两个指标一般用来衡量应用的用户粘性以及应用的衰退周期。

5)日新增用户数(DNU,Daily New User):指的是某日(以天为一个周期)新注册并登录的用户数。

6)留存用户:在互联网行业中,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户。

7)用户留存数:一定数量的用户在某段时间内开始使用应用,经过一段时间后,在某日(以天为一个周期)仍然继续使用该应用的用户数量。

8)留存率:用于反映网站、互联网应用或网络游戏的运营情况的统计指标,其具体含义为在统计周期(例如日或周或月)内,每日活跃用户数在第N日仍启动该应用的用户数占比,其中,N取大于2的正整数,例如1日留存率(即次日留存率)=(在第一天新增的用户中,在注册的第2天还登录的用户数)/第一天新增用户数、7日留存率(即周留存率)=(在第一天新增的用户中,在注册的第7天还有登录的用户数)/第一天新增用户数;30日留存率(即月留存率)=(在第一天新增的用户中,在注册的第30天还有登录的用户数)/第一天新增用户数。

9)留存系数:每日新增用户数的后续留存走势函数,可以使用幂函数公式y=a*x

10)区块链:包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。

相关技术中,每天的日活跃用户数的计算方式如下所示:

步骤1、假设已知一个产品次日留存、7日留存以及30留存,如表1所示:

表1:某产品若干日留存

步骤2、如图1所示,图1是相关技术提供的留存散点图,在excel图表中按照对应留存天数以及留存率,画出散点图。

步骤3、如图2所示,图2是相关技术提供的基于散点拟合的曲线图,在excel图表对上述散点添加趋势线,并在趋势线的选项中,选择幂函数,并选择显示幂函数公式。

基于上述步骤得到的幂函数为y=0.4861*x

步骤4、如图3所示,图3是相关技术提供的日活跃用户数的示意图,基于得到的幂函数公式,算出对应的留存率之后,就可以进行列求和得到每天的日活跃用户数。

如图4所示,图4是相关技术提供的日活跃用户数的示意图,相关技术中的每日的用户留存按照每一行计算每一天的留存(即逐日计算,相同日期的留存累加),其中,23、24、28、29、30日新增用户应用留存系数y=0.4285*x

因此,相关技术中的每天的日活跃用户数的计算方式是根据每天的新增人数,按照历史的留存走势,拟合出后续的留存人数不准确。

为了解决上述问题,本申请实施例提供了一种活跃用户预测方法、装置、电子设备及计算机可读存储介质,能够提高活跃用户数预测的准确性。

本申请实施例所提供的活跃用户预测方法,可以由终端或服务器独自实现;也可以由终端和服务器协同实现,例如终端独自承担下文所述的活跃用户预测方法,或者,终端向服务器发送针对活跃用户数的预测请求(包括目标周期),服务器根据接收的针对活跃用户数的预测请求执行活跃用户预测方法,基于与目标周期的应用场景对应的目标留存系数,预测出精准的、符合实际场景的活跃用户数,便于后续的推广策略调整及成本预算。

本申请实施例提供的用于活跃用户预测的电子设备可以是各种类型的终端或服务器,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器;终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端、智能电视等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。

参见图5,图5是本申请实施例提供的活跃用户数预测系统10的应用场景示意图,终端200通过网络300连接服务器100,网络300可以是广域网或者局域网,又或者是二者的组合。

终端(运行有客户端,例如网络游戏客户端、视频客户端、新闻客户端、车载客户端等)可以被用来获取针对活跃用户数的预测请求,例如,当用户注册并登录网络游戏客户端后,选择需要预测的目标周期,终端自动获取针对活跃用户数的预测请求。

在一些实施例中,终端200中运行的客户端中可以植入有活跃用户预测插件,用以在客户端本地实现活跃用户预测方法。例如,终端200获取针对活跃用户数的预测请求(包括目标周期)后,调用活跃用户预测插件,以实现活跃用户预测方法,基于与目标周期的应用场景对应的目标留存系数,预测出精准的、符合实际场景的活跃用户数,便于后续的推广策略调整及成本预算,例如对于网络游戏应用,当用户注册并登录网络游戏客户端后,选择需要预测的目标周期,终端自动获取针对活跃用户数的预测请求,并获取网络游戏在目标周期的应用场景(例如运营活动日),确定与应用场景对应的目标留存系数(例如运营活动期间的留存系数),基于与应用场景对应的目标留存系数,预测出精准的、符合实际场景的活跃用户数,从而基于预测的活跃用户数调整后续的网络游戏推广策略。

在一些实施例中,终端200获取针对活跃用户数的预测请求(包括目标周期)后,调用服务器100的活跃用户预测接口(可以提供为云服务的形式,即活跃用户预测服务),服务器100基于与目标周期的应用场景对应的目标留存系数,预测出精准的、符合实际场景的活跃用户数,并将活跃用户数发送至终端200,便于后续的推广策略调整及成本预算,例如,对于网络游戏应用,当用户注册并登录网络游戏客户端后,选择需要预测的目标周期,终端200自动获取针对活跃用户数的预测请求,并将针对活跃用户数的预测请求发送至服务器100,服务器100解析针对活跃用户数的预测请求,获取需要预测的目标周期,并获取网络游戏在目标周期的应用场景(例如运营活动日),确定与应用场景对应的目标留存系数(例如运营活动期间的留存系数),基于与应用场景对应的目标留存系数,预测出精准的、符合实际场景的活跃用户数,从而基于预测的活跃用户数调整后续的网络游戏推广策略以及运营成本。

在一些实施例中,终端或服务器可以通过运行计算机程序来实现本申请实施例提供的活跃用户预测方法,例如,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。

本申请实施例可以借助于云技术(Cloud Technology)实现,云技术是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、以及应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源。

在一些实施例中,多个服务器可组成为一区块链,而服务器100为区块链上的节点,区块链中的每个节点之间可以存在信息连接,节点之间可以通过上述信息连接进行信息传输。其中,本申请实施例提供的活跃用户预测方法所相关的数据(例如活跃用户预测的逻辑、留存系数、预测的活跃用户数)可保存于区块链上。

下面说明本申请实施例提供的用于活跃用户预测的电子设备的结构,参见图6,图6是本申请实施例提供的用于活跃用户预测的电子设备500的结构示意图,以电子设备500是服务器为例说明,图6所示的用于活跃用户预测的电子设备500包括:至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线系统540耦合在一起。可理解,总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图6中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。

存储器550包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。

在一些实施例中,存储器550能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。

操作系统551,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;

网络通信模块552,用于经由一个或多个(有线或无线)网络接口520到达其他计算设备,示例性的网络接口520包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;

在一些实施例中,本申请实施例提供的活跃用户预测装置可以采用软件方式实现,例如,可以是上文所述的终端中的活跃用户预测插件,可以是上文所述的服务器中活跃用户预测服务。当然,不局限于此,本申请实施例提供的活跃用户预测装置可以提供为各种软件实施例,包括应用程序、软件、软件模块、脚本或代码在内的各种形式。

图6示出了存储在存储器550中的活跃用户预测装置555,其可以是程序和插件等形式的软件,例如活跃用户预测插件,并包括一系列的模块,包括获取模块5551、第一确定模块5552、第二确定模块5553、第三确定模块5554、预处理模块5555、优化模块5556以及调整模块5557;其中,获取模块5551、第一确定模块5552、第二确定模块5553、第三确定模块5554、预处理模块5555、优化模块5556以及调整模块5557用于实现本申请实施例提供的活跃用户预测功能。

如前所述,本申请实施例提供的活跃用户预测方法可以由各种类型的电子设备实施。参见图7A,图7A是本申请实施例提供的活跃用户预测方法的流程示意图,结合图7A示出的步骤进行说明。

下面步骤中,周期表示时间间隔,以天、周、月、年为一个周期,例如第一天为第一个周期、第二天为第二个周期;第一周为第一个周期、第二周为第二个周期。

下面步骤中,应用场景表示应用(例如网络游戏应用、视频应用等)的场景,例如日常场景、运营活动场景、节假日场景、游戏比赛场景等。

在步骤101中,获取目标应用在目标周期的应用场景,并获取目标周期前的每个周期的新增用户数。

作为获取目标周期的示例,当用户注册并登录网络游戏客户端后,选择需要预测的目标周期,终端自动获取针对活跃用户数的预测请求(包括目标周期),并发送针对活跃用户数的预测请求至服务器,服务器解析针对活跃用户数的预测请求,获取需要预测的目标周期(例如2021.1.25号),获取网络游戏在目标周期的应用场景(例如运营活动日),并获取目标周期前的每个周期(例如2021.1.23-2021.1.24)的新增用户数,基于网络游戏在目标周期的应用场景以及目标周期前的每个周期的新增用户数,预测出精准的、符合实际场景的活跃用户数。

在一些实施例中,显示目标应用的多个应用场景;响应于针对多个应用场景的调整操作,获取并显示调整后的应用场景。

例如,目标应用可以有多个应用场景,例如日常场景、运营活动场景、节假日场景、游戏比赛场景等,可以根据实际应用增加、删除、修改至少部分应用场景,例如网络游戏当前只有日常场景、节假日场景,缺少运营活动场景,则在显示界面显示网络游戏的日常场景、节假日场景,并显示场景调整入口,响应于针对场景调整入口的触发操作,可以对显示的应用场景进行增加操作,以增加运营活动场景,则在显示界面显示网络游戏的日常场景、节假日场景以及运营活动场景,表明网络游戏包括日常场景、节假日场景以及运营活动场景三种应用场景。通过对应用场景的增加、删除、修改操作,灵活调节应用场景的种类,提高应用场景的准确性、多样性。

在一些实施例中,获取目标应用在目标周期的应用场景,包括:基于目标周期前的周期的应用场景以及目标周期的属性调用场景识别模型,得到目标应用在目标周期的多个候选应用场景;响应于针对多个候选应用场景的选择操作,将选择的候选应用场景作为目标应用在目标周期的应用场景。

例如,当通过场景识别模型识别出多个候选应用场景时,可以自动选择最适合的候选应用场景作为目标应用在目标周期的应用场景,还可以通过用户的选择操作从多个候选应用场景中选择最适合的候选应用场景作为目标应用在目标周期的应用场景。

例如,场景识别可以通过以下技术方案实现:通过场景识别模型结合目标周期前的周期的应用场景以及目标周期的属性(例如,具体的日期、标记等)对目标周期进行场景识别处理,得到目标应用在目标周期的多个候选应用场景的概率,将最大概率所对应的候选应用场景作为目标应用在目标周期的应用场景。其中,场景识别模型可以为经过训练的神经网络模型,神经网络模型可以是基于周期样本前的周期的应用场景以及周期样本的属性训练得到的,假设目标周期前的周期的应用场景为日常场景、目标周期的属性为非节假日,通过场景识别模型对目标周期进行场景识别处理,得到目标应用在目标周期的多个候选应用场景的概率(例如日常场景0.8、运营活动场景0.1、游戏比赛场景0.1),则目标应用在目标周期的应用场景为日常场景。

作为获取目标周期的应用场景的示例,当用户注册并登录网络游戏客户端后,选择需要预测的目标周期,并输入目标周期的应用场景,终端自动获取针对活跃用户数的预测请求(包括目标周期以及对应的应用场景),并发送针对活跃用户数的预测请求至服务器,服务器解析针对活跃用户数的预测请求,获取需要预测的目标周期以及对应的应用场景。

在一些实施例中,获取目标周期前的每个周期的新增用户数,包括:获取目标周期前的每个周期的推广数据以及对应的转化率;基于每个周期的推广数据以及对应的转化率调用新增用户预测模型,得到目标周期前的每个周期的新增用户数。

例如,新增用户预测可以通过以下技术方案实现:通过新增用户预测模型结合目标周期前的每个周期的推广数据(例如在各种视频中插入目标应用的广告、在各种新闻中插入目标应用的广告)以及对应的转化率进行新增用户预测处理,得到目标周期前的每个周期的新增用户数。其中,新增用户预测模型可以为经过训练的神经网络模型,神经网络模型可以是基于周期样本的推广数据以及对应的转化率训练得到的,假设某周期的推广数据为在各种视频中插入目标应用的广告以及对应的转化率为50%,通过新增用户预测模型进行新增用户预测处理,得到该周期的新增用户数为1000。

作为获取目标周期前的每个周期的新增用户数的示例,当用户注册并登录网络游戏客户端后,选择需要预测的目标周期,并输入目标周期前的每个周期的新增用户数,终端自动获取针对活跃用户数的预测请求(包括目标周期以及目标周期前的每个周期的新增用户数),并发送针对活跃用户数的预测请求至服务器,服务器解析针对活跃用户数的预测请求,获取需要预测的目标周期以及目标周期前的每个周期的新增用户数。

在步骤102中,从多个候选留存系数中,确定与目标周期的应用场景对应的目标留存系数。

例如,不同的应用场景,对应的留存系数不同,当确定了目标周期的应用场景后,可以从存储的多个候选留存系数中,确定与目标周期的应用场景对应的目标留存系数,以便后续基于符合应用场景的留存系数进行活跃用户数的预测,提高活跃用户数预测的准确性。

参见图7B,图7B是本申请实施例提供的活跃用户预测方法的流程示意图,图7B示出图7A还包括步骤105-步骤107:在步骤105中,获取每个应用场景分别对应的多个历史留存数据;在步骤106中,基于任一应用场景对应的多个历史留存数据进行拟合处理,得到任一应用场景对应的留存系数;在步骤107中,基于多个应用场景对应的留存系数,构建不同应用场景与候选留存系数的对应关系。

例如,对于不同的应用场景,例如工作日、节假日、运营活动日、游戏比赛、高考等,获取每个应用场景分别对应的多个历史留存数据,其中,历史留存数据包括(留存周期以及留存率)。对任一应用场景对应的多个历史留存数据,使用python进行拟合,得到任一应用场景的留存系数,并基于应用场景对应的留存系数,构建不同应用场景与候选留存系数的对应关系,例如不同应用场景与候选留存系数的对应关系如下所示:

(1)、工作日的用户留存系数:y(1)=a1*x(1)

(2)、节假日期间的用户留存系数:y(2)=a2*x(2)

(3)、运营活动期间的用户留存系数:y(3)=a3*x(3)

在一些实施例中,从多个候选留存系数中,确定与目标周期的应用场景对应的目标留存系数,包括:基于目标周期的应用场景,查询不同应用场景与候选留存系数的对应关系;将查询到的候选留存系数作为与目标周期的应用场景对应的目标留存系数。

承接上述示例,由于不同的应用场景,对应的留存系数不同,基于目标周期的应用场景,查询不同应用场景与候选留存系数的对应关系,将查询到的候选留存系数作为与目标周期的应用场景对应的目标留存系数。例如目标应用场景为运营活动场景,则将查询到的y(3)=a3*x(3)

在一些实施例中,获取每个应用场景分别对应的多个历史留存数据,包括:获取每个应用场景分别对应的多个候选历史留存数据的时间戳;基于候选历史留存数据的时间戳,对任一应用场景对应的多个候选历史留存数据进行降序排序,将降序排序在前的部分候选历史留存数据作为任一应用场景对应的多个历史留存数据。

作为获取历史留存数据的示例,获取任一应用场景对应的多个候选历史留存数据的时间戳,对任一应用场景对应的多个候选历史留存数据进行降序排序,将降序排序结果中排列在前的指定数量的候选历史留存数据作为任一应用场景对应的多个历史留存数据,从而保证历史留存数据的时新性、有效性。

在一些实施例中,获取每个应用场景分别对应的多个历史留存数据,包括:获取任一应用场景对应的多个候选历史留存数据以及对应的多个基于留存系数预测的留存数据;当候选历史留存数据与对应的预测的留存数据之间的差异小于差异阈值时,将候选历史留存数据作为任一应用场景对应的历史留存数据。

作为获取历史留存数据的示例,日常场景下实际的候选历史留存数据1(留存周期为2天、留存率为0.8)、基于留存系数预测的留存数据1(留存周期为2天、留存率为0.7),则候选历史留存数据1与对应的预测的留存数据1的留存率差异为0.1(小于设置的差异阈值0.2),则将候选历史留存数据1作为日常场景对应的历史留存数据,从而保证历史留存数据的准确性。

作为获取历史留存数据的示例,日常场景下实际的候选历史留存数据2(留存周期为2天、留存数为100)、基于留存系数预测的留存数据2(留存周期为2天、留存数为800),则候选历史留存数据2与对应的预测的留存数据2的留存数差异为200(大于设置的差异阈值100),则将候选历史留存数据2将不作为日常场景对应的历史留存数据。

在一些实施例中,基于任一应用场景对应的多个历史留存数据进行拟合处理,得到任一应用场景对应的留存系数,包括:针对任一应用场景构建对应的初始留存系数;基于任一应用场景对应的多个历史留存数据对初始留存系数进行参数拟合,将得到的拟合参数作为任一应用场景对应的留存系数的参数。

例如,构建日常场景的初始留存系数y=a*x

在一些实施例中,基于任一应用场景对应的多个历史留存数据进行拟合处理,得到任一应用场景对应的留存系数,包括:显示任一应用场景对应的多个历史留存数据;响应于针对多个历史留存数据的拟合操作,获取并显示对应的多条候选拟合曲线;响应于针对多条候选拟合曲线的选择操作,将选择的候选拟合曲线作为任一应用场景对应的留存系数的拟合曲线。

例如,网络游戏在日常场景下的次日留存、7日留存以及30留存,在excel图表中按照对应留存天数以及留存率,画出散点图,在excel图表对散点添加趋势线(幂函数y=a*x

在步骤103中,基于目标留存系数以及目标周期前的每个周期的新增用户数,确定目标周期前的每个周期在目标周期的用户留存数。

例如,在获取目标留存系数以及目标周期前的每个周期的新增用户数后,可以基于目标留存系数以及目标周期前的每个周期的新增用户数,确定目标周期前的每个周期在目标周期的用户留存数,并基于目标周期前的每个周期在目标周期的用户留存数、以及目标周期的新增用户数,确定目标应用在目标周期的活跃用户数。

在一些实施例中,基于目标留存系数以及目标周期前的每个周期的新增用户数,确定目标周期前的每个周期在目标周期的用户留存数,包括:基于目标留存系数以及目标周期前的任一周期,确定目标周期前的任一周期对应的留存率;基于目标周期前的任一周期对应的留存率以及任一周期的新增用户数,确定目标周期前的任一周期在目标周期的用户留存数。

例如,留存率的确定方法如下所示:将目标周期与目标周期前的任一周期的差值作为留存周期;基于留存周期以及目标留存系数,确定目标周期前的任一周期对应的留存率。

例如,任一周期为第1天、目标周期为第3天、任一周期的新增用户数为1000、目标留存系数为y(1)=a1*x(1)

在步骤104中,基于目标周期前的每个周期在目标周期的用户留存数、以及目标周期的新增用户数,确定目标应用在目标周期的活跃用户数。

例如,在获取目标周期前的每个周期在目标周期的用户留存数、以及目标周期的新增用户数后,可以基于目标周期前的每个周期在目标周期的用户留存数、以及目标周期的新增用户数,确定目标应用在目标周期的活跃用户数,以便基于目标应用在目标周期的活跃用户数进行后续的推广策略调整及成本预算。

在一些实施例中,实时获取目标应用在目标周期的实际活跃用户数;基于目标留存系数预测得到的活跃用户数据以及实际活跃用户数,对目标留存系数进行优化,得到优化后的目标留存系数。

承接上述示例,目标留存系数优化方法如下所示:当预测得到的活跃用户数据与实际活跃用户数之间的差值大于差值阈值时,基于目标应用场景对应的多个实际活跃用户数进行拟合处理,得到优化后的目标留存系数。

例如,当预测得到的活跃用户数据与实际活跃用户数之间的差值大于差值阈值时,说明目标留存系数不太准确,需要重新利用准确的实际活跃用户数进行拟合,以更新目标留存系数,从而保证目标留存系数的准确性。

下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。

本申请实施例可以应用于各种活跃用户数预测的应用场景中,例如项目需要根据网络游戏导流的每日新增用户数,去计算出每天的日活跃用户数,根据预估的每天的日活跃用户数,从而去申请活动奖励预算以及足够承载相应人数的服务器资源。

相关技术中的每天的日活跃用户数的计算方式是根据每天的新增人数,按照历史的留存走势,去拟合出后续的留存人数。如图8所示,图8是相关技术提供的日活跃用户数的示意图,在实际应用中,应该是在活动期间,所有留存用户都会受到活动的影响,从而引起次日留存的改变,而相关技术使用行式计算,虚线框801中处于活动期间的用户却要使用非活动期间的拟合留存公式,明显会缺少了一部分预测人数,而虚线框802中处于非活动期间的用户却依然使用更高的活动留存系数,导致留存虚高。

为了解决上述问题,本申请实施例提出一种活跃用户预测方法,将同一天留存用户,按照每一列,应用相同的留存系数去计算留存数,能够更好拟合出实际的DAU,从而提升DAU的预测准确度。

如图9所示,图9是本申请实施例提供的活跃用户预测方法的流程示意图,包括三个步骤,如下所示:

步骤11、拟合出不同情况(应用场景,例如工作日、节假日、运营活动日、游戏比赛、高考等)下的留存系数参数。

根据历史的用户留存数据,使用python进行拟合,得到{a1,a2,a3…},{b1,b2,b3…}的参数集:

(1)、工作日的用户留存系数:y(1)=a1*x(1)

(2)、节假日期间的用户留存系数:y(2)=a2*x(2)

(3)、运营活动期间的用户留存系数:y(3)=a3*x(3)

其中,y(i)表示情况i对应的留存率,x(i)表示情况i对应的留存天数。

步骤12、计算每一天新增的后续留存。

例如,每天的新增人数为{m1,m2,m3,…,m(N)},m(n)的后续第x天的留存数为m(n)(x)=m(n)*(a(i)*x

例如,1月23日的预计新增为1000人,后续的每日留存人数的示例计算过程如图10所示,图10是本申请实施例提供的每日留存人数的计算示意图,23号新增人数在23、24、28、29、30日应用留存系数y=0.4285*x

如图12所示,图12是本申请实施例提供的每一天新增的后续留存数的示意图,按照上述相同的计算方式,复用到更多的日期中,计算每一天新增的后续留存数。

步骤13、计算每一天的DAU。

例如,第n天的新增用户数为m(n),累加上历史新增用户在第n天的留存数,得到第n天的DAU,其计算公式如公式(1)所示:

其中,当n为1的时候,也就是只算1天的情况下,DAU就等于第1天的新增人数,即DAU(1)=m(1)。

如图13所示,图13是本申请实施例提供的每天的DAU的示意图,按照上述相同的计算方式,计算每一天的活跃用户数。

为了确保本申请实施例提出的活跃用户预测方法所预测的DAU的准确性,进行了DAU的误差率的验证,其验证结果如表2所示:

表2:误差率

由表2可知,在实际预测效果上,使用本申请实施例的活跃用户预测方法带来的实际预估效果更好,而通过更好的实际预测效果,可以直接带来经济资源上的节约,便于后续申请用户福利的预算资源以及足够承载用户量的服务器资源和网络带宽。

至此已经结合本申请实施例提供的电子设备的示例性应用和实施,说明本申请实施例提供的活跃用户预测方法,下面继续说明本申请实施例提供的活跃用户预测装置555中各个模块配合实现活跃用户预测的方案。

获取模块5551,用于获取目标应用在目标周期的应用场景,并获取所述目标周期前的每个周期的新增用户数;第一确定模块5552,用于从多个候选留存系数中,确定与所述目标周期的应用场景对应的目标留存系数;第二确定模块5553,用于基于所述目标留存系数以及所述目标周期前的每个周期的新增用户数,确定所述目标周期前的每个周期在所述目标周期的用户留存数;第三确定模块5554,用于基于所述目标周期前的每个周期在所述目标周期的用户留存数、以及所述目标周期的新增用户数,确定所述目标应用在所述目标周期的活跃用户数。

在一些实施例中,所述第一确定模块5552还用于基于所述目标周期的应用场景,查询不同应用场景与候选留存系数的对应关系;将查询到的候选留存系数作为与所述目标周期的应用场景对应的目标留存系数。

在一些实施例中,所述装置还包括:预处理模块5555,用于获取每个所述应用场景分别对应的多个历史留存数据;基于任一所述应用场景对应的多个历史留存数据进行拟合处理,得到任一所述应用场景对应的留存系数;基于多个所述应用场景对应的留存系数,构建不同应用场景与所述候选留存系数的对应关系。

在一些实施例中,所述预处理模块5555还用于获取每个所述应用场景分别对应的多个候选历史留存数据的时间戳;基于所述候选历史留存数据的时间戳,对任一所述应用场景对应的多个候选历史留存数据进行降序排序,将所述降序排序在前的部分候选历史留存数据作为任一所述应用场景对应的多个历史留存数据。

在一些实施例中,所述预处理模块5555还用于获取任一所述应用场景对应的多个候选历史留存数据以及对应的多个基于所述留存系数预测的留存数据;当所述候选历史留存数据与对应的所述预测的留存数据之间的差异小于差异阈值时,将所述候选历史留存数据作为任一所述应用场景对应的历史留存数据。

在一些实施例中,所述预处理模块5555还用于针对任一所述应用场景构建对应的初始留存系数;基于任一所述应用场景对应的多个历史留存数据对所述初始留存系数进行参数拟合,将得到的拟合参数作为任一所述应用场景对应的留存系数的参数。

在一些实施例中,所述预处理模块5555还用于显示任一所述应用场景对应的多个历史留存数据;响应于针对所述多个历史留存数据的拟合操作,获取并显示对应的多条候选拟合曲线;响应于针对所述多条候选拟合曲线的选择操作,将选择的所述候选拟合曲线作为任一所述应用场景对应的留存系数的拟合曲线。

在一些实施例中,所述第二确定模块5553还用于基于所述目标留存系数以及所述目标周期前的任一所述周期,确定所述目标周期前的任一所述周期对应的留存率;基于所述目标周期前的任一所述周期对应的留存率以及任一所述周期的新增用户数,确定所述目标周期前的任一所述周期在所述目标周期的用户留存数。

在一些实施例中,所述第二确定模块5553还用于将所述目标周期与所述目标周期前的任一所述周期的差值作为留存周期;基于所述留存周期以及所述目标留存系数,确定所述目标周期前的任一所述周期对应的留存率。

在一些实施例中,所述装置还包括:优化模块5556,用于实时获取所述目标应用在所述目标周期的实际活跃用户数;基于所述目标留存系数预测得到的活跃用户数据以及所述实际活跃用户数,对所述目标留存系数进行优化,得到优化后的所述目标留存系数。

在一些实施例中,所述优化模块5556还用于当所述预测得到的活跃用户数据与所述实际活跃用户数之间的差值大于差值阈值时,基于所述目标应用场景对应的多个所述实际活跃用户数进行拟合处理,得到优化后的所述目标留存系数。

在一些实施例中,所述装置还包括:调整模块5557,用于显示所述目标应用的多个所述应用场景;响应于针对多个所述应用场景的调整操作,获取并显示调整后的所述应用场景。

在一些实施例中,所述获取模块5551还用于基于所述目标周期前的周期的应用场景以及所述目标周期的属性调用场景识别模型,得到所述目标应用在所述目标周期的多个候选应用场景;响应于针对所述多个候选应用场景的选择操作,将选择的所述候选应用场景作为所述目标应用在所述目标周期的应用场景。

在一些实施例中,所述获取模块5551还用于获取所述目标周期前的每个周期的推广数据以及对应的转化率;基于所述每个周期的推广数据以及对应的转化率调用新增用户预测模型,得到所述目标周期前的每个周期的新增用户数。

本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的活跃用户预测法。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的活跃用户预测方法,例如,如图7A-图7B示出的活跃用户预测方法。

在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。

作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

相关技术
  • 一种活跃用户预测方法、装置、电子设备及可读存储介质
  • 一种用户活跃度预测方法、系统及可读存储介质
技术分类

06120113227936