掌桥专利:专业的专利平台
掌桥专利
首页

一种用户画像方法及其系统、存储介质

文献发布时间:2023-06-19 11:42:32


一种用户画像方法及其系统、存储介质

技术领域

本发明涉及用户画像技术领域,具体涉及一种用户画像方法及其系统、存储介质。

背景技术

用户画像是用户行为及诉求信息的抽象,能够描述与勾勒服务目标对象的特征。随着大数据技术的发展,依托大数据技术收集用户信息并构建用户画像,成为公共服务行业内用户管理与用户营销的重要策略手段。这一应用对深入了解用户需求,设计用户真正需求的产品具有重要的意义。用户画像作为可以实现数据有效落地的重要应用,针对用户资料开展抽象操作,并进一步加工原始数据形成具有特殊信息定义的标签,有助于深入认知用户群体方面的属性特征、喜好以及行为方式等,从而更为高效认知现有的用户群体。

随着用户公共服务需求与日俱增,且可选择的服务渠道增多,不同用户在用水、用电、燃气及通信等相关公共服务诉求行为和渠道交互行为存在明显差异。用户表征水、电、气、交通、通讯、医疗卫生等公共服务诉求时,通常使用身份证件、产权证、银行卡等信息作为业务办理证件,并将电话号码作为主要联系方式。围绕上述证件信息和联系信息形成用户基础数据及行为诉求数据,并分散至各个公共服务行业及其自建平台,但目前不同行业中的账户体系之间未实现数据连通,众多用户行为数据和诉求数据暂未打通,未能有效融合公共服务行业内多元、多维、动态的数据,数据孤岛现象突显。

发明内容

本发明的目的在于提出一种用户画像方法及其系统、存储介质,以解决数据孤岛问题,提供更精准完善的用户画像。

为实现上述目的,根据第一方面,本发明的实施例提出一种用户画像方法,包括:

获取多个公共服务行业的用户数据;

根据所述用户数据确定多个ID实体及其标签刻画对象;

根据所述标签刻画对象构建画像体系架构;

根据所述标签刻画对象以及所述用户数据构建每一标签刻画对象所对应的用户标签;

将所述用户标签分别汇聚至对应的ID实体的画像体系架构的标签刻画对象下,生成所述ID实体对应的用户画像;

根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联。

可选地,所述方法还包括:

根据所述用户数据的动态变化更新所述多个ID实体对应的多个用户画像的用户标签。

可选地,所述画像体系架构包括自然人画像体系架构和非自然人画像体系架构。

可选地,所述自然人画像体系架构包括ID实体及其标签刻画对象和用户标签,该标签刻画对象包括用电户号、用水户号、燃气户号、有线电视户号、宽带户号、身份证号码、微信ID、支付宝ID、电话号码。

可选地,所述非自然人画像体系架构包括ID实体及其标签刻画对象和用户标签,该标签刻画对象包括用电户号、用水户号、燃气户号、宽带户号、统一社会信用代码、电话号码。

可选地,所述多个ID实体包括自然人ID实体和非自然人ID实体;

其中,所述根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联,包括:

根据所述自然人ID实体的身份证号码与所述非自然人ID实体的相关自然人的建立所述自然人ID实体与所述非自然ID实体的用户画像之间的关联;所述非自然人ID实体的法人的身份证号码根据所述用户数据获得。

可选地,所述根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联,还包括:

根据所述自然人ID实体的用电户号、用水户号、燃气户号、有线电视户号、宽带户号、身份证号码、微信ID、支付宝ID或电话号码建立多个自然人ID实体的用户画像之间的关联。

可选地,所述用户标签包括用户行为及用户诉求。

根据第二方面,本发明的实施例提出一种用户画像系统,用于实现第一方面所述的用户画像方法,包括:

数据获取单元,用于获取多个公共服务行业的用户数据;

数据处理单元,用于根据所述用户数据确定多个ID实体及其标签刻画对象;

画像架构构建单元,用于根据所述标签刻画对象构建画像体系架构;

标签构建单元,用于根据所述标签刻画对象以及所述用户数据构建每一标签刻画对象所对应的用户标签;

画像生成单元,用于将所述用户标签分别汇聚至对应的ID实体的画像体系架构的标签刻画对象下,生成所述ID实体对应的用户画像;以及

画像管理单元,用于根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联。

根据第三方面,本发明的实施例提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述用户画像方法的步骤。

本发明的实施例通过获取多个公共服务行业的用户数据,根据所述用户数据确定多个ID实体及其标签刻画对象,根据所述标签刻画对象构建画像体系架构,并根据所述标签刻画对象以及所述用户数据构建每一标签刻画对象所对应的用户标签,之后将所述用户标签分别汇聚至对应的ID实体的画像体系架构的标签刻画对象下,生成所述ID实体对应的用户画像,最后根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联;综上,本发明的实施例通过设置ID实体,将与ID实体相关的所有标签刻画对象的用户标签汇聚到画像体系架构下,生成用户画像,使得不同行业的数据能够集中显示到一个画像中,从而解决数据孤岛的问题,同时,增加了不同ID实体的用户画像之间的关联,使得用户画像所涵盖的信息内容更加的丰富。

本发明的其它特征和优点将在随后的说明书中阐述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例中一种用户画像方法的流程图。

图2为用电用户OneID构成及渠道来源示意图。

图3为自然人OneID画像体系架构示意图。

图4为非自然人OneID画像体系架构示意图。

图5为用户相同属性归类示意图。

图6为用电客户OneID关系网络拓扑图.

图7为本发明另一实施例中一种用户画像系统的流程图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。另外,为了更好的说明本发明,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的手段未作详细描述,以便于凸显本发明的主旨。

参阅图1,本发明一实施例提出一种用户画像方法,包括:

步骤S1、获取多个公共服务行业的用户数据;

具体而言,所述多个公共服务行业的用户数据涵盖了各行业内用户相关基础信息、行为数据、诉求数据等,以用电用户为例,其画像数据源具体包括营销管理系统、计量自动化系统、用户全方位平台、互联网用户服务平台、政务平台及其他外部数据渠道,各数据源中所需的数据信息如下:1)营销管理系统:用户用电档案信息、工单用户关联信息、95598客服工单等;2)计量自动化系统:电表数据、变压器数据等;3)用户全方位平台:停电信息等;4)互联网用户服务平台:渠道类别、用户账户信息、用电业务办理信息等;

步骤S1的一个示例如图2所示,可以通过网上营业厅、微信服务号、掌上营业厅、公共服务热线、支付宝生活号等渠道获得多个公共服务行业的用户数据;例如是供电服务行业;

步骤S2、根据所述用户数据确定多个ID实体及其标签刻画对象;

具体而言,ID实体即图2中的OneID;表示唯一标识;

步骤S3、根据所述标签刻画对象构建画像体系架构;

可选地,所述画像体系架构包括自然人画像体系架构和非自然人画像体系架构。

可选地,参阅图3,所述自然人画像体系架构包括ID实体及其标签刻画对象和用户标签,所述自然人画像体系架构的标签刻画对象包括用电户号、用水户号、燃气户号、有线电视户号、宽带户号、身份证号码、微信ID、支付宝ID、电话号码中的一种或多种;

具体而言,图3中为一个自然人OneID实体的画像体系架构,在以自然人OneID为核心的架构下,实现了对需要进行画像的全部对象的汇聚,不论是该自然人的基础属性,或是用户服务中涉及的电话号码,微信、支付宝等渠道的id号,办理公共服务业务中使用的用户号码(例如用电户号、用水户号、燃气户号、有线电视户号、宽带户号、油卡号、公交卡号)等不同画像维度的对象,都挂接在该OneID实体下。基于此,按照不同的需求,对不同的画像对象设计相应的标签,得到的不同对象属性特征,并最终汇集在OneID实体上。

在OneID实体下,标签刻画对象的基本表达形式以二维数组属性呈现,如在电力行业用户画像常面向的对象用电户号与手机号码中,标签刻画对象的表达形式为:[用电户号,自然人OneID],[手机号码,自然人OneID]。对于其他刻画对象,也以[标签刻画对象,自然人OneID]的形式表示标签;

可选地,参阅图4,所述非自然人画像体系架构包括ID实体及其标签刻画对象和用户标签,所述非自然人画像体系架构的标签刻画对象包括用电户号、用水户号、燃气户号、宽带户号、统一社会信用代码、电话号码中的一种或多种;

具体而言,图4为一个非自然人OneID实体的画像体系架构,非自然人用户实体的属性特征相对于自然人用户更加丰富,对自然人用户进行标签刻画与画像构建时,其对象除了非自然人自身的用户号、电话号码(非自然人的对外服务电话或联络电话)、统一社会信用代码等,还包括了该非自然人下相关联的自然人OneID实体。在非自然人OneID架构下,自然人身份角色包括用户沟通联系人、财务联系人、催费联系人、电子发票联系人及法人。

例如,针对用电户号,非自然人的标签刻画对象表达形式:[用电户号,非自然人OneID],对于其他标签刻画对象,以[其他标签刻画对象,非自然人OneID]的形式表示标签,比如[电话号码,非自然人OneID];

其中,所述多个ID实体包括自然人ID实体和非自然人ID实体;

步骤S4、根据所述标签刻画对象以及所述用户数据构建每一标签刻画对象所对应的用户标签;

举例而言,面对不同场景的用户画像需求,根据不同的应用场景构建标签,标签类型包括规则标签、统计标签、模型标签和手工标签,并以{“标签名称”-“标签描述”-“业务规则”-“标签类型”}进行统一存储与管理。如在投诉应用场景下的用电用户画像标签包括:{“近1年内有越级投诉倾向”-“语言中带有越级投诉倾向等意向升级行为的用户”-“一年内95598来电记录中带有越级投诉敏感词2次及以上的用户”-“规则标签”}、{“近7天/24小时内重复来电”-“近7天/24小时内重复来电”-“来电频次统计指标”-“统计标签”}、{“潜在投诉风险高”-“潜在投诉风险高、历史投诉次数多的用户”-“结合历史停电频率、历史停电时间长、近段时间是否停电、曾经投诉过业务办理差错、服务效率或电量异常问题等多指标进行融合”-“模型标签”}等;

步骤S5、将所述用户标签分别汇聚至对应的ID实体的画像体系架构的标签刻画对象下,生成所述ID实体对应的用户画像;

举例而言,ID之间的静态关联,静态ID-Mapping的过程是利用ID下的各个对象特征的稳定关联关系进行,也是用户分散在各个渠道的孤立数据的融通。以来电号码/身份证号码与用户号的关联性作为核心纽带,进行OneID静态关联打通,对于ID静态关联过程中的关联关系,采用以下方式进行构建;

①提取在册用户档案信息以及用户在各类线上渠道的用户绑定信息,构建出基础的“电话号码-公共服务用户号”关联关系表;

②由于存在许多非在册用户的客服交互行为,客服工单以及线上渠道工单(包括在册电话与非在册电话发起)的工单文本内容中还存在着可挖掘的关联属性,从工单文本中,挖掘出涉及的相关户号与电话号码;

③将②中提取出的信息与业扩工作单的识别号属性相关联,最终挖掘出相关“公共服务用户号”与发起诉求、线上渠道业务的“来电号码”相关联;

④将上述挖掘信息补充至原始“电话号码-公共服务用户号”关联表内;

以上的“电话号码-公共服务用户号”关联建立即可实现一个OneID下电话号码与用户号的打通,并实现了全接触渠道的数据融合。对于一个OneID下其它表征用户实体“人”标识的属性(身份证、微信id、互联网平台id等)都以这相同的方式进行打通,并逐步汇聚至一个OneID下;

ID之间的动态聚合;在静态ID-Mapping的基础上,OneID的各个属性间的关联关系形成了张关联网络,在这个关联网络中可以通过动态聚合的方式进行ID打通。如图5所示,图中小写字母(a,b,c…)表示电话号码,大写字母(A,B,C…)表示公共服务用户号码,数字(1,2,3…)表示用户的行为记录(以工作单号为记录标识,反映一条工单中的类别、诉求内容等全维度信息);按照相同属性的判定条件,对关联网络中的OneID实体属性进行初步圈定,如固定OneID标签的刻画对象来电号码、公共服务用户号码或二者的关联,将同一维度下的所有用户行为,或进一步通过机器学习等挖掘方法进行行为特征的进一步聚合;在这类动态聚合的过程中,一方面采用行为记录统计属性,业务关键词等特征,进行动态相似匹配。另一方面包括采用业务流的规则匹配,以在业务流程中的顺序、因果、并列的逻辑关系,以行为记录动态匹配的形式,挖掘数据之间的隐含信息,将存在关联可能性的OneID进行聚合;可见,对于一个新的未知ID的用户交互行为,通过新行为记录动态匹配过往的行为记录,寻找出虚拟ID的行为可能从属的已知OneID,帮助将虚拟ID聚合成明确的OneID,达到ID-Mapping的目的;

步骤S6、根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联;

其中,所述步骤S6,包括:

根据所述自然人ID实体的身份证号码与所述非自然人ID实体的相关自然人的建立所述自然人ID实体与所述非自然ID实体的用户画像之间的关联;所述非自然人ID实体的法人的身份证号码根据所述用户数据获得。

可选地,所述步骤S6,还包括:

根据所述自然人ID实体的用电户号、用水户号、燃气户号、有线电视户号、宽带户号、身份证号码、微信ID、支付宝ID或电话号码建立多个自然人ID实体的用户画像之间的关联。

可选地,所述用户标签包括用户行为及用户诉求。

具体而言,也即构建不同用户画像体系的关系网络拓扑;不同OneID的属性之间存在直接或间接的关联性,使得一个个孤立之间的OneID用户体系形成一个关联网络。如图6所示,以电力行业为分析背景,并以自然人OneID常用的电话号码与用电户号两个属性为例,由于二者间的关联关系存在多对多的情况,包括在册绑定,以及存在交互行为挖掘出的关联关系,可以连接起不同的OneID实体。

本发明实施例方法通过获取多个公共服务行业的用户数据,根据所述用户数据确定多个ID实体及其标签刻画对象,根据所述标签刻画对象构建画像体系架构,并根据所述标签刻画对象以及所述用户数据构建每一标签刻画对象所对应的用户标签,之后将所述用户标签分别汇聚至对应的ID实体的画像体系架构的标签刻画对象下,生成所述ID实体对应的用户画像,最后根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联;综上,本发明的实施例通过设置ID实体,将与ID实体相关的所有标签刻画对象的用户标签汇聚到画像体系架构下,生成用户画像,使得不同行业的数据能够集中显示到一个画像中,从而解决数据孤岛的问题,同时,增加了不同ID实体的用户画像之间的关联,使得用户画像所涵盖的信息内容更加的丰富。

可选地,所述步骤S6还包括:

根据所述用户数据的动态变化更新所述多个ID实体对应的多个用户画像的用户标签。

举例而言,在关系网络拓扑中对用电户进行标签用户与行为描述时,当发生一条关于某户号的新行为记录后,通过以下过程实现新旧标签信息的交互融通:

①调取用电户号原有标签特征属性辅助服务应用;

②新的行为记录同步转换为用电户号下的新属性;

③该行为记录将与该户号相关联的现有OneID在用电户号属性下的历史行为进行匹配:a)若从属同一ID,则进行ID聚合与行为属性特征更新;b)否则,该行为记录信息归至独立新OneID下。

关系网络拓扑在基于OneID的电力用户画像应用时具有重要作用,例如:当某电话号码致电95598供电服务热线时,用电用户画像平台可以推荐给坐席人员该电话所属的OneID的基本属性标签,并推荐与该OneID直接相关的用电户号的相关标签。同时,平台可告知坐席人员与该用电户号存在关联性的另一个电话号码此前在95598用户服务中咨询或办理的业务问题;在OneID关系网络拓扑中,各个元素的关联性间还存在着强弱的区别,在缴费、账务信息、系统在册信息、线上平台联系人信息、公共服务业务办理等多个业务流程中,通过规则打分方式,将不同自然人OneID以及法人OneID同用户号码的关联性强弱进行划分;在互联网用户服务平台联系人信息的行为交互上,新增联系人信息能够增强ID与户号的关联关系,其中,新增手机号又相对于新增邮箱账号的关联强度更大。

参阅图7,本发明的另一实施例提出一种用户画像系统,用于实现第一方面所述的用户画像方法,包括:

数据获取单元1,用于获取多个公共服务行业的用户数据;

数据处理单元2,用于根据所述用户数据确定多个ID实体及其标签刻画对象;

画像架构构建单元3,用于根据所述标签刻画对象构建画像体系架构;

标签构建单元4,用于根据所述标签刻画对象以及所述用户数据构建每一标签刻画对象所对应的用户标签;

画像生成单元5,用于将所述用户标签分别汇聚至对应的ID实体的画像体系架构的标签刻画对象下,生成所述ID实体对应的用户画像;以及

画像管理单元6,用于根据所述多个ID实体的标签刻画对象建立所述多个ID实体的用户画像之间的关联。

以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

需说明的是,上述实施例所述系统与上述实施例所述方法对应,因此,上述实施例所述系统未详述部分可以参阅上述实施例所述方法的内容得到,即上述实施例方法记载的具体步骤内容可以理解为本实施例系统的所能够实现的功能,此处不再赘述。

并且,上述实施例所述用户画像系统若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。

本发明另一实施例提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例所述用户画像方法的步骤。

具体而言,所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

相关技术
  • 一种基于图数据库的用户画像构建方法、系统及存储介质
  • 一种用户画像的生成方法、系统、设备和存储介质
技术分类

06120113023062