掌桥专利:专业的专利平台
掌桥专利
首页

用户画像的查询处理方法、装置、设备、程序产品及介质

文献发布时间:2023-06-19 11:02:01


用户画像的查询处理方法、装置、设备、程序产品及介质

技术领域

本公开涉及计算机技术领域,具体涉及数据处理领域,尤其涉及一种用户画像的查询处理方法、装置、设备、程序产品及介质。

背景技术

近年来,各种网络应用平台发展迅速。用户可以在网络应用平台上发表内容,用于信息分享。随着电子技术的发展以及信息的共享化,网络应用平台所承载的用户量日益剧增。

然而,对于庞大的用户量,网络应用平台所具有的属性不全,无法完整地刻画用户画像。在运营或者管理者需要查询用户画像数据时,只能获取属性不全的用户画像数据,无法满足业务需求。

发明内容

本公开实施例提供了一种用户画像的查询处理方法、装置、设备、程序产品及介质。

根据本公开的一方面,提供了一种用户画像的查询处理方法,包括:

收集多张用户描述表,用户描述表中包括设定类型的用户特征数据;

对各所述用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据;

根据各维度属性下的用户画像数据,生成用户画像底层表,并根据所述用户画像底层表,形成与各查询平台分别匹配的用户画像查询数据;

响应于与目标查询平台对应的查询条件,从与所述目标查询平台匹配的用户画像查询数据中获取查询结果数据,作为所述查询条件的反馈结果。

根据本公开的另一方面,提供了一种用户画像的查询处理装置,包括:

用户描述表收集模块,用于收集多张用户描述表,用户描述表中包括设定类型的用户特征数据;

用户画像数据形成模块,用于对各所述用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据;

用户画像查询数据形成模块,用于根据各维度属性下的用户画像数据,生成用户画像底层表,并根据所述用户画像底层表,形成与各查询平台分别匹配的用户画像查询数据;

反馈结果确定模块,用于响应于与目标查询平台对应的查询条件,从与所述目标查询平台匹配的用户画像查询数据中获取查询结果数据,作为所述查询条件的反馈结果。

根据本公开的另一方面,提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所提供的用户画像的查询处理方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开所提供的用户画像的查询处理方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开所提供的用户画像的查询处理方法。

根据本公开的技术解决了用户画像的全面刻画问题,提高了用户画像刻画的全面性与准确性,可以为多维查询以及多平台查询提供依据。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开实施例的一种用户画像的查询处理方法的流程示意图;

图2是根据本公开实施例的另一种用户画像的查询处理方法的流程示意图;

图3是根据本公开实施例的一种用户画像的查询处理装置的结构示意图;

图4是用来实现本公开实施例的用户画像的查询处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1是根据本公开实施例的一种用户画像的查询处理方法的流程示意图,本实施例适用于在网络应用平台中对用户画像数据进行收集并生成用户画像的情况,该方法可以通过用户画像的查询处理装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成于电子设备中。具体的,参考图1,该方法具体包括如下步骤:

步骤110、收集多张用户描述表。

其中,用户描述表中包括设定类型的用户特征数据。用户描述表可以是对用户特征数据按照设定类型进行记录形成的。具体的,每张用户描述表可以记录一种设定类型的用户特征数据。收集的方式可以是调取各网络应用平台记录用户特征数据的记录表。对于收集到的用户描述表可以进行调整,使其与设定类型的对应性更合理,包含的信息更全面。

设定类型可以是记录用户特征数据时对数据的预设分类类别。例如,对于网络应用平台中的用户特征数据可以按照用户基本数据、用户发表文章数据以及用户成长路线数据等进行分类记录。设定类型可以是用户基本数据、用户发表文章数据以及用户成长路线数据等。

用户特征数据可以是表示用户某个特征行为下的数据。示例性的,用户特征数据可以是用户在一定时间内产生动态变化时生产的数据。例如,用户特征数据可以包括在一定时间内用户对于基本信息的修改产生的数据等。

步骤120、对各用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据。

融合和/或汇总可以是对用户特征数据的整理。例如,融合可以是将不同类别的用户特征数据进行归类。示例性的,可以设置为同一维度。汇总可以是对用户特征数据进行统计。示例性的,可以进行周期计算。

用户画像数据可以是从不同维度描述用户画像的数据。例如,用户画像数据可以是用户维度的用户基本数据,或者,也可以是用户内容维度的用户发布内容的相关数据等。各个维度属性下的用户画像数据可以构成用户画像的完整数据,可以生成全面的用户画像,提高了用户画像生成时的全面性。

步骤130、根据各维度属性下的用户画像数据,生成用户画像底层表,并根据用户画像底层表,形成与各查询平台分别匹配的用户画像查询数据。

其中,用户画像底层表可以是将各维度属性下的用户画像数据按照云数据仓库(UCloud Data Warehouse,UDW)形式进行存放生成的数据表。用户画像底层表可以通过写代码的方式实现。用户画像底层表可以是UDW表。

用户画像查询数据可以是根据UDW表确定的数据。其中,查询数据者在不同的查询平台进行数据查询时,用户画像查询数据可以具有不同的形式。例如,用户画像查询数据可以直接是UDW表中的数据;或者,用户画像查询数据可以是针对与多用户,根据UDW表中的数据按照维度属性聚合生成的批量数据;或者,用户画像查询数据可以是针对于单用户,根据UDW表中数据确定的用于生成用户画像的数据。

根据用户画像底层表可以提供多维度或者多平台的用户画像数据,便于查询数据者如运营者或者管理者等对用户画像数据的全面、多角度或者多方式的查询,便于查询数据者实现业务处理要求。

步骤140、响应于与目标查询平台对应的查询条件,从与目标查询平台匹配的用户画像查询数据中获取查询结果数据,作为查询条件的反馈结果。

其中,查询结果数据可以是根据查询数据者在查询平台中输入的查询条件,在多种形式的用户画像查询数据中确定的数据。例如,查询结果数据可以是UDW表中的数据;或者,批量数据;或者,用于生成用户画像的数据。

查询条件可以是多样的。例如,可以是获取用户画像数据对应的底层数据;或者,可以是查询全部用户的各维度属性下的用户画像数据;或者,可以是查询单个用户的用户画像等。

本公开实施例的技术方案,通过收集多张用户描述表;对各用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据;根据各维度属性下的用户画像数据,生成用户画像底层表,并根据用户画像底层表,形成与各查询平台分别匹配的用户画像查询数据;响应于与目标查询平台对应的查询条件,从与目标查询平台匹配的用户画像查询数据中获取查询结果数据,作为查询条件的反馈结果,解决了用户画像数据的查询问题,提高了用户画像刻画的全面性与准确性,为多维度查询、多平台查询提供了数据支持,从而可以使数据查询者快速全面的获取用户图像的查询结果数据,无需额外针对业务需求向研发人员发起临时的业务查询需求,实现了节省研发人员人力以及时间的效果。

图2是根据本公开实施例的另一种用户画像的查询处理方法的流程示意图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施方式结合。具体的:

在本公开实施例的一个可选实施方式中,收集多张用户描述表,包括:在检测到满足用户画像数据生成条件时,获取当前的系统时间;根据系统时间,以及与各用户描述表分别对应的时效参数,确定与各用户描述表分别对应的时效区间;在至少一个数据源平台中,收集用户特征数据更新时间在匹配的时效区间内的各用户描述表。

在本公开实施例的一个可选实施方式中,对各用户描述表中的用户特征数据进行融合,和/或汇总处理,包括:通过在大数据平台集群中执行的预先建立的至少一个并行处理任务,对各用户描述表中的用户特征数据进行融合,和/或汇总处理。

在本公开实施例的一个可选实施方式中,对各用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据包括:在用户描述表中获取多个设定类型的用户特征数据,并将获取的各用户特征数据融合为设定维度属性下的用户画像数据;和/或,从用户描述表中获取同一类型的用户特征数据,并按照数据采集时间对获取的各用户特征数据进行汇总统计,得到设定维度属性下的用户画像数据。

在本公开实施例的一个可选实施方式中,根据各维度属性下的用户画像数据,生成用户画像底层表,包括:创建与维度属性数量对应的执行线程,并将与每个维度属性分别对应的用户画像数据提供给各执行线程;触发各执行线程进行并行计算,以形成与每个维度属性分别对应的用户数据仓库底层表;将各用户数据仓库底层表中的数据进行汇总,生成用户画像底层表,其中,用户画像底层表中的数据格式为键值对形式的。

参考图2,该方法具体包括如下步骤:

步骤210、在检测到满足用户画像数据生成条件时,获取当前的系统时间。

其中,用户画像数据生成条件可以是进行用户画像数据更新的条件。例如,用户画像数据生成条件可以是达到预设时间或者预设周期时,需要对用户画像数据进行更新;或者,可以是有新用户在网络应用平台进行注册,需要更新用户画像数据,以增加新用户的用户画像数据。检测的方式可以是多样的。例如,检测的方式可以是定时器触发;或者,可以是检测是否存在新用户进行注册等。

系统时间可以是系统单独具有的时钟系统显示的时间;或者,也可以是通过互联网获取的真实地域的时间,如北京时间。获取的方式可以是直接读取时钟系统或者互联网传输的时间。

步骤220、根据系统时间,以及与各用户描述表分别对应的时效参数,确定与各用户描述表分别对应的时效区间。

其中,时效参数可以用于表示用户描述表中的用户特征数据在满足数据有效时的时间参数。例如,时效参数可以是T+2或T+3等,T可以表示当前时间。即对于稳定因素如用户基本数据可以设定为第一预设间隔进行更新,如每两天或者三天进行更新,而无需实时进行数据更新,可以保证数据有效性同时避免增加系统负担。又如,时效参数可以是每秒钟、每分钟、每刻钟、每小时或者每天等。对于动态因素如用户发文数据可以设定为第二预设间隔进行更新,如每秒钟,可以保证数据更新的实时性以及有效性。

时效区间可以系统时间以及时效参数确定的用户特征数据满足有效性时,需要收集数据时所需遵守的时间条件。例如,对于稳定因素时效区间可以是区间[t-2,t],t为当前的系统时间,区间中数据的单位可以是天。又如,对于动态因素时效区间可以是[t-1,t],区间中数据的单位可以是秒。

步骤230、在至少一个数据源平台中,收集用户特征数据更新时间在匹配的时效区间内的各用户描述表。

其中,用户描述表中包括设定类型的用户特征数据。

数据源平台可以是各网络应用平台。例如,数据源平台可以是用户发表文章所使用的网络应用平台。网络应用平台中的用户特征数据可以被收集用于形成用户画像。

收集用户特征数据更新时间在匹配的时效区间内的各用户描述表,可以是获取在时效区间内的用户特征数据形成对应的用户描述表。

可选的,各用户描述表所描述的用户为在目标内容发布平台发布文章的作者。其中,目标内容发布平台可以是用户发布文章、视频、图片、直播、动态或者付费内容等所采用的网络应用平台。

可选的,用户描述表,包括下述至少一项:

与目标内容发布平台匹配的用户基础表、文章表、智慧运营跟进信息表、用户成长路线表、用户画像表、关联账号基础表、用户行为偏好表以及动态基础表;

与目标内容发布平台的关联发布平台匹配的用户基础表以及文章表;

由目标内容发布平台和关联发布平台中的各作者共同确定的用户覆盖表。

其中,用户基础表可以用于记录用户在平台活跃的基本数据。例如,用户基础表可以记录用户的注册信息、用户状态、用户等级以及用户类型等。文章表可以用于记录用户发布内容相关的数据。例如,文章表可以记录用户发表文章的内容、发表时间以及发文章的数量等。智慧运营跟进信息表可以用于记录平台的运行效率、平台对用户的分组信息以及平台的基本属性信息等。用户成长路线表可以用于记录用户在平台成长,如等级变化的相关数据。例如,用户成长路线表可以用于记录用户的注册、转正、等级逐级变化、封禁以及解封等的状态信息和时间信息。用户画像表可以用于记录用户自身的基本数据。例如,用户画像表可以记录用户的社会职位、年龄、性别以及收入范围等数据。关联账号基础表可以用于记录用户的多频道网络信息(Multi-Channel Network,MCN)。例如,关联账号基础表可以用于记录用户在目标内容发布平台的账户,以及在关联发布平台中的关联账户(如在多个平台中注册账号的情况);或者,在目标内容发布平台中的账户以及账户的关联账户(示例性的,在一个平台中使用多个方式注册多个账号,如同一用户在一个平台中使用多个手机号注册多个账号的情况)。用户行为偏好表可以用于记录用户的行为数据,例如,用户喜欢在什么时候发布文章,或者用户发文章的方式等。动态基础表可以用于记录用户的发文章的详细数据。动态基础表可以记录用户发表文章的内容(如题目)、发表时间以及发文章的数量等。动态基础表可以是文章表的简化,例如,可以简略记录文章的内容。

关联发布平台可以是与目标内容发布平台存在关联关系的网络应用平台。例如,关联发布平台可以是与目标内容发布平台存在竞对关系的网络应用平台。

用户覆盖表可以是根据目标内容发布平台和关联发布平台中存在重叠的作者,确定的具有重叠作者相关数据的表。

通过用户描述表的设置可以获取全面的用户特征数据,并进行分类记录,可以便于后期数据查询者获取数据并进行业务处理。

步骤240、通过在大数据平台集群中执行的预先建立的至少一个并行处理任务,对各用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据。

其中,并行处理任务可以是Spark任务。Spark任务可以通过使用Scala编程语言构建实现。

现有技术中进行数据源的融合或者汇总时,使用qe任务(大数据平台集群中,使用Hadoop语言实现的任务)进行执行。其中,Hadoop为一种分布式系统基础架构,可以实现集群的高速运算和存储。但是,qe任务会导致执行时间长、产出延迟大,并且占用的资源也非常多。

在本公开实施例的技术方案中可以通过任务重构的方式。可以将qe任务重构为Spark任务(大数据平台集群中,使用Scala编程语言实现的任务),可以显著节省任务执行所需消耗的时间。通过Scala编程语言实现Spark任务可以达到应用程序接口设计优雅,从而提升用户体验;基于Scala编程语言的较强的表达能力,提升开发速度;以及基于Scala编程语言的兼容性,可以融合到Hadoop生态圈的效果。

其中,Spark任务的大致流程可以如下:执行端(Driver)可以启动Spark任务提交(Spark Submit)进程;启动后执行端可以向主设备(Master)进行通信,创建对象(SparkContext)并向主设备发送任务消息。主设备接收到任务消息后,开始资源调度,与所有的工作端(Worker)进行通信,找到空闲的工作端,并通知空闲的工作端获取任务、启动执行线程(Executor)。执行线程启动后可以开始与执行端进行反向注册,执行端可以将任务发送至相应的执行线程开始计算任务。

在本公开实施例中,任务可以是用户特征数据的融合和/或汇总处理,形成多个维度属性下的用户画像数据。

可选的,对各所述用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据包括:在所述用户描述表中获取多个设定类型的用户特征数据,并将获取的各所述用户特征数据融合为设定维度属性下的用户画像数据;和/或,从所述用户描述表中获取同一类型的用户特征数据,并按照数据采集时间对获取的各所述用户特征数据进行汇总统计,得到设定维度属性下的用户画像数据。

其中,融合可以是多种用户特征数据按照不同维度进行归类并合成一类。例如,融合可以是将多种设定类型的用户特征数据进行归类合成一类;或者,融合可以是将一种预设类型中的多种不同形态的用户特征数据进行归类合并为一类。

示例性的,用户发文的内容可以包括图文、视频、直播、动态以及付费内容等。融合可以是将上述多种形态的发文内容归类为用户发表文章数据,并确定对应的数量。

汇总可以是将各种用户特征数据按照不同维度进行设定周期内的统计。例如,可以统计天、周、月、季或者年内用户特征数据的周期数据。

维度属性可以从不同角度描述用户特征数据。例如,维度属性可以包括用户维度和用户内容维度。用户维度可以描述用户的基本数据,可以是静态属性。用户维度可以包括多个细化维度的数据。用户内容维度可以描述用户发布内容的相关数据,可以是动态属性。用户内容维度也可以包括多个细化维度的数据。

可选的,维度属性,包括:各用户在目标内容发布平台维度,和/或目标内容发布平台的关联发布平台维度下的基础属性、社会属性、行为属性、权益属性、创作属性以及覆盖属性。其中,创作属性包括:在至少一个统计区间内的发文数量、活跃度、互动数据、文章折损数据以及发文垂类分布。

其中,基础属性可以对应于用户的基础数据,如用户的注册信息、状态以及等级等。社会属性可以对应于用户具有社会层面意义的数据,如职业、行业以及收入等。行为属性可以对应于用户发文的相关数据,如发文时间、发文数量以及发文内容等。权益属性可以对应于用户在平台中享有的合法权利数据,如会员有效期等。覆盖属性可以对应于用户覆盖表中的数据。

统计区间可以是天、周、月或者季等。活跃度可以对应于用户在平台登录的时长以及频次等数据。互动数据可以对应于用户在平台中的点评、分享以及关注等数据。文章折损数据可以对应于用户在当前统计区间中发布文章数量与之前的统计区间中发布文章数量的差异数据。例如,本月相对于上月而言,用户发布直播的次数少了3次。发文垂类分布可以对应于用户发布文章的类别数据,例如求职类、生活类以及娱乐类等。

维度属性中的基础属性、社会属性、行为属性、权益属性、创作属性以及覆盖属性,可以分类。例如,可以将维度属性中的各属性分为两类。一类是用户维度,可以包括基础属性、社会属性、行为属性和权益属性;另一类是用户内容维度,可以包括创作属性以及覆盖属性。

通过维度属性的设置可以获取全面的用户特征数据,并进行分类记录,可以便于后期数据查询者获取数据并进行业务处理。

步骤250、创建与维度属性数量对应的执行线程,并将与每个维度属性分别对应的用户画像数据提供给各执行线程。

其中,执行线程可以独立地对对应的维度属性进行数据记录。各执行线程可以并行执行,可以提高执行效率。

步骤260、触发各执行线程进行并行计算,以形成与每个维度属性分别对应的用户数据仓库底层表。

其中,用户数据仓库底层表可以是UDW形式的数据表。

步骤270、将各用户数据仓库底层表中的数据进行汇总,生成用户画像底层表。

其中,用户画像底层表中的数据格式为键值对形式的。示例性的,键可以是数据名称,值可以是对应的数据。

步骤280、根据用户画像底层表,形成与各查询平台分别匹配的用户画像查询数据。

在本公开实施例的一个可选实施方式中,查询平台包括:画像基础数据查询平台;根据用户画像底层表,形成与查询平台匹配的用户画像查询数据,包括:将用户画像底层表,直接作为与查询平台匹配的用户画像查询数据。

其中,画像基础数据查询平台用于响应于用户的查询语句,从用户画像查询数据中获取匹配的查询结果数据。

画像基础数据查询平台可以是直接向研发团队提供用户画像数据。通过直接将用户画像底层表作为用户画像查询数据的方式,可以为研发团队提供用户画像底层表。可以以一种程序代码式为研发团队提供数据,研发团队可以直接对用户画像底层表式的用户画像数据进行业务处理。可以省略研发团队进行业务处理时,根据获取的具体数据进行代码化的过程,从而为研发团队提供了极大的便利。

在本公开实施例的一个可选实施方式中,查询平台包括:可视化多维查询平台;根据用户画像底层表,形成与查询平台匹配的用户画像查询数据,包括:将用户画像底层表导入至与多维查询平台匹配的多维查询引擎中,以形成与多维查询平台匹配的用户画像查询数据。

其中,可视化多维查询平台,用于根据用户在多个可视化的维度属性选项中选择的目标维度属性,从与多维查询平台匹配的用户画像查询数据中获取查询结果数据。

查询引擎可以用于根据用户输入关键词信息如目标维度属性进行内容筛选,例如可以是图灵引擎,可以提供多维度用户画像数据。可视化多维查询平台可以提供多维度的用户画像数据,可以进行批量数据的导出,可以便于数据查询者同时查询全部用户的多个维度属性的用户画像数据,可以提高数据查询速度,满足数据查询者的多样化查询需求。

在本公开实施例的一个可选实施方式中,查询平台包括:可视化的画像查询平台;根据用户画像底层表,形成与查询平台匹配的用户画像查询数据,包括:将用户画像底层表存储于与画像查询平台匹配的服务器中;建立与用户画像底层表匹配的数据查询接口,并将数据查询接口与画像查询平台进行关联。

其中,画像查询平台用于根据用户输入的目标用户的标识信息,调用数据查询接口,从与画像查询平台匹配的用户画像查询数据中获取针对于目标用户的查询结果数据。

数据查询接口可以是应用程序接口。在画像查询平台中,数据查询者可以查询单个用户的用户画像。具体的,可以是将用户画像底层表进行画像服务化,通过匹配的数据查询接口为画像查询平台提供用户画像数据。可以打通内容管理系统(CMS)平台的数据,具备单个用户的用户画像查询能力。可以便于数据查询者查询指定的目标用户的用户画像数据,可以提高数据查询速度,满足数据查询者的多样化查询需求。

步骤290、响应于与目标查询平台对应的查询条件,从与目标查询平台匹配的用户画像查询数据中获取查询结果数据,作为查询条件的反馈结果。

本公开实施例的技术方案,通过在检测到满足用户画像数据生成条件时,获取当前的系统时间;根据系统时间,以及与各用户描述表分别对应的时效参数,确定与各用户描述表分别对应的时效区间;在至少一个数据源平台中,收集用户特征数据更新时间在匹配的时效区间内的各用户描述表;通过在大数据平台集群中执行的预先建立的至少一个并行处理任务,对各用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据;创建与维度属性数量对应的执行线程,并将与每个维度属性分别对应的用户画像数据提供给各执行线程;触发各执行线程进行并行计算,以形成与每个维度属性分别对应的用户数据仓库底层表;将各用户数据仓库底层表中的数据进行汇总,生成用户画像底层表;根据用户画像底层表,形成与各查询平台分别匹配的用户画像查询数据;响应于与目标查询平台对应的查询条件,从与目标查询平台匹配的用户画像查询数据中获取查询结果数据,作为查询条件的反馈结果,解决了用户画像数据的查询问题,提高了用户画像刻画的全面性与准确性,为多维度查询、多平台查询提供了数据支持,从而可以使数据查询者快速全面的获取用户图像的查询结果数据,无需额外针对业务需求向研发人员发起临时的业务查询需求,可以节省研发人员人力以及时间;此外,可以通过任务重构的方式,提高任务执行的效率,节省系统的运行时间。

图3是根据本公开实施例的一种用户画像的查询处理装置的结构示意图,该装置可以设置于电子设备中。具体的,如图3所示,该装置包括:用户描述表收集模块310,用户画像数据形成模块320,用户画像查询数据形成模块330和反馈结果确定模块340。其中:

用户描述表收集模块310,用于收集多张用户描述表,用户描述表中包括设定类型的用户特征数据;

用户画像数据形成模块320,用于对各用户描述表中的用户特征数据进行融合,和/或汇总处理,形成多个维度属性下的用户画像数据;

用户画像查询数据形成模块330,用于根据各维度属性下的用户画像数据,生成用户画像底层表,并根据用户画像底层表,形成与各查询平台分别匹配的用户画像查询数据;

反馈结果确定模块340,用于响应于与目标查询平台对应的查询条件,从与目标查询平台匹配的用户画像查询数据中获取查询结果数据,作为查询条件的反馈结果。

可选的,用户描述表收集模块310,包括:

系统时间获取单元,用于在检测到满足用户画像数据生成条件时,获取当前的系统时间;

时效区间确定单元,用于根据系统时间,以及与各用户描述表分别对应的时效参数,确定与各用户描述表分别对应的时效区间;

用户描述表收集单元,用于在至少一个数据源平台中,收集用户特征数据更新时间在匹配的时效区间内的各用户描述表。

可选的,用户画像数据形成模块320,包括:

数据处理单元,用于通过在大数据平台集群中执行的预先建立的至少一个并行处理任务,对各用户描述表中的用户特征数据进行融合,和/或汇总处理。

可选的,用户画像数据形成模块320,包括:

融合单元,用于在用户描述表中获取多个设定类型的用户特征数据,并将获取的各用户特征数据融合为设定维度属性下的用户画像数据;和/或

汇总单元,用于从用户描述表中获取同一类型的用户特征数据,并按照数据采集时间对获取的各用户特征数据进行汇总统计,得到设定维度属性下的用户画像数据。

可选的,用户画像查询数据形成模块320,包括:

执行线程创建单元,用于创建与维度属性数量对应的执行线程,并将与每个维度属性分别对应的用户画像数据提供给各执行线程;

用户数据仓库底层表形成单元,用于触发各执行线程进行并行计算,以形成与每个维度属性分别对应的用户数据仓库底层表;

用户画像底层表生成单元,用于将各用户数据仓库底层表中的数据进行汇总,生成用户画像底层表,其中,用户画像底层表中的数据格式为键值对形式的。

可选的,查询平台包括:画像基础数据查询平台;

用户画像查询数据形成模块320,包括:

第一用户画像查询数据确定单元,用于将用户画像底层表,直接作为与查询平台匹配的用户画像查询数据;

其中,画像基础数据查询平台用于响应于用户的查询语句,从用户画像查询数据中获取匹配的查询结果数据。

可选的,查询平台包括:可视化多维查询平台;

用户画像查询数据形成模块320,包括:

第二用户画像查询数据确定单元,用于将用户画像底层表导入至与多维查询平台匹配的多维查询引擎中,以形成与多维查询平台匹配的用户画像查询数据;

其中,可视化多维查询平台,用于根据用户在多个可视化的维度属性选项中选择的目标维度属性,从与多维查询平台匹配的用户画像查询数据中获取查询结果数据。

可选的,查询平台包括:可视化的画像查询平台;

用户画像查询数据形成模块320,包括:

用户画像底层表存储单元,用于将用户画像底层表存储于与画像查询平台匹配的服务器中;

数据查询接口建立与关联单元,用于建立与用户画像底层表匹配的数据查询接口,并将数据查询接口与画像查询平台进行关联;

其中,画像查询平台用于根据用户输入的目标用户的标识信息,调用数据查询接口,从与画像查询平台匹配的用户画像查询数据中获取针对于目标用户的查询结果数据。

可选的,各用户描述表所描述的用户为在目标内容发布平台发布文章的作者;

用户描述表,包括下述至少一项:

与目标内容发布平台匹配的用户基础表、文章表、智慧运营跟进信息表、用户成长路线表、用户画像表、关联账号基础表、用户行为偏好表以及动态基础表;

与目标内容发布平台的关联发布平台匹配的用户基础表以及文章表;

由目标内容发布平台和关联发布平台中的各作者共同确定的用户覆盖表。。

可选的,维度属性,包括:

各用户在目标内容发布平台维度,和/或目标内容发布平台的关联发布平台维度下的基础属性、社会属性、行为属性、权益属性、创作属性以及覆盖属性;

其中,创作属性包括:在至少一个统计区间内的发文数量、活跃度、互动数据、文章折损数据以及发文垂类分布。

本公开实施例所提供的用户画像的查询处理装置可执行本发明任意实施例所提供的用户画像的查询处理方法,具备执行方法相应的功能模块和有益效果。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图4示出了可以用来实施本公开的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图4所示,设备400包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM 403中,还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

设备400中的多个部件连接至I/O接口405,包括:输入单元406,例如键盘、鼠标等;输出单元407,例如各种类型的显示器、扬声器等;存储单元408,例如磁盘、光盘等;以及通信单元409,例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理,例如机用户画像的查询处理方法。例如,在一些实施例中,用户画像的查询处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到RAM 403并由计算单元401执行时,可以执行上文描述的用户画像的查询处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行用户画像的查询处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 用户画像的查询处理方法、装置、设备、程序产品及介质
  • 查询方法、装置、计算机设备、存储介质和程序产品
技术分类

06120112774074