导航：首页> 动物或植物油、脂、脂肪物质或蜡；由此制取的脂肪酸；洗涤剂；蜡烛>一种用户画像生成方法、装置、设备及计算机存储介质

一种用户画像生成方法、装置、设备及计算机存储介质

文献发布时间：2023-06-19 10:08:35

技术领域

本申请属于数据分析领域，尤其涉及一种用户画像生成方法、装置、设备及计算机存储介质。

背景技术

随着互联网与移动终端的普及，每个人都能随时随地使用移动终端接入互联网。越来越多的人利用移动终端在电商平台完成购物活动，同时，移动终端也会留下用户购物行为的痕迹，如商家会根据用户的购物行为向用户发送购物信息确认、商品评价反馈、商品促销提醒等内容的的购物应用程序推送信息。这些推送信息一定程度上可以反映用户的购物行为。通过对用户购物行为的分析，可以获知用户的购物倾向，并根据用户购物倾向给用户推送相应的商品信息。

目前，在现有技术中，主要是通过从用户的购物浏览记录和用户的购物发票中提取用户购物行为数据，来分析用户的购物行为，生成用户画像。但是，用户的购物浏览记录只能代表用户的购物兴趣，无法检测用户是否完成购买行为，而用户的购物发票虽然可以表示用户完成了购物行为，但不是所有的用户都会找商家索要购物发票，所以，通过从用户的购物浏览记录和用户的购物发票中提取用户购物行为数据不完整，且不真实，导致最后生成的用户画像不准确。

发明内容

本申请实施例提供一种用户画像生成方法、装置、设备及计算机存储介质，能够获取到完整的，真实的用户购物行为数据，生成准确的用户画像。

一方面，本申请实施例提供了一种用户画像生成方法，方法包括：

获取由购物应用程序推送至用户帐号的推荐商品信息；从推荐商品信息中提取商品来源方信息；根据商品来源方信息，对推荐商品信息进行分类，得到对应的商品类型；根据商品类型和用户帐号对应的用户所属的至少一个用户群，确定每个用户群的购物类型分布；用户群根据用户的用户身份信息以及用户的线上操作行为数据确定；根据每个用户群的购物类型分布，生成用户的用户画像。

在上述技术方案中，从推荐商品信息中提取商品来源方信息，具体包括：

基于正则表达式遍历推荐商品信息，提取推荐商品信息对应的商品来源方信息。

在上述任一技术方案中，根据商品来源方信息，对推荐商品信息进行分类，得到对应的商品类型，具体包括：

将商品来源方信息和预先获取的商家信息表进行匹配，确定商品来源方信息对应的店铺名称和店铺名称对应的商品类型，商家信息表是根据爬取购物应用程序数据得到的；将店铺名称对应的商品类型，确定为商品来源方信息对应的商品类型；将商品来源方信息对应的商品类型，确定为推荐产品信息对应的商品类型。

在上述任一技术方案中，将商品来源方信息和预先获取的商家信息表进行匹配之前，还包括：

从商家信息表中提取满足第一预设条件的商家信息，第一预设条件包括店铺评分的分值大于预设分值和/或商品销量大于预设销量。

在上述任一技术方案中，确定商品来源方信息对应的店铺名称和店铺名称对应的商品类型，具体包括：

商品来源方信息和商家信息表的字符匹配度满足第二预设条件，得到商品来源方信息对应的店铺名称，第二预设条件包括商品来源方信息和商家信息表中店铺名称的字符匹配度大于预设百分比；根据商品来源方信息对应的店铺名称，得到店铺名称对应的商品类型。

在上述任一技术方案中，根据商品来源方信息对应的店铺名称，得到店铺名称对应的商品类型，具体包括：

在店铺名称对应多个商品类型的情况下，从商家信息表中提取店铺名称对应的店铺评分；根据店铺评分在每个商品类型对应的所有店铺中的排名比例，将排名比例最靠前的商品类型确定为所述店铺名称对应的商品类型。

在上述任一技术方案中，根据商品类型和用户帐号对应的用户所属的至少一个用户群，确定每个用户群的购物类型分布之前，还包括：

获取用户的用户身份信息以及用户的线上操作行为数据；从用户的用户身份信息以及用户的线上操作行为数据中，提取用户的特征变量；将特征变量做相关性分析，确定相互独立的连续特征变量；以连续特征变量为指标，基于GMM混合高斯模型的最大期望算法对用户进行聚类，同时应用贝叶斯信息准则选取用户的最佳分类数量，得出用户所属的至少一个用户群。

在上述任一技术方案中，根据商品类型和用户帐号对应的用户所属的至少一个用户群，确定每个用户群的购物类型分布，具体包括：

根据购买比例，绘制每个用户群在预先设定的时间段内不同商品类型的购物概率分布图；根据购物概率分布图，确定每个用户群的购物类型分布。

在上述任一技术方案中，根据每个用户群的购物类型分布，生成用户的用户画像，具体包括：

从每个用户群的购物类型分布中，选取购物类型分布百分比最大的购物类型和/或提取满足预设阈值的购物类型，确定为用户群的购物倾向标签；根据购物倾向标签和用户的所属用户群的类别特征，生成用户的用户画像。

另一方面，本申请实施例提供了一种用户画像生成装置，装置包括：

推荐商品信息获取单元：用于获取由购物应用程序推送至用户帐号的推荐商品信息；

商品来源方信息提取单元：用于从推荐商品信息中提取商品来源方信息；

商品类型匹配单元：用于根据商品来源方信息，对推荐商品信息进行分类，得到对应的商品类型；

购物类型分布统计单元：用于根据商品类型和用户帐号对应的用户所属的至少一个用户群，确定每个用户群的购物类型分布；用户群根据用户的用户身份信息以及用户的线上操作行为数据确定；

用户画像生成单元：用于根据每个用户群的购物类型分布，生成用户的用户画像。

再一方面，本申请实施例提供了一种用户画像生成设备，设备包括：处理器以及存储有计算机程序指令的存储器；处理器执行计算机程序指令时实现如上述实施方式中任意一项所述的用户画像生成方法。

再一方面，本申请实施例提供了一种计算机存储介质，计算机存储介质上存储有计算机程序指令，计算机程序指令被处理器执行时实现如上述实施方式中任意一项所述的用户画像生成方法。

本申请实施例的一种用户画像生成方法、装置、设备及计算机存储介质，根据用户所在的用户群的购物类型分布生成用户的用户画像，而用户群的购物类型分布是基于对推送到用户账号的推荐商品信息分类得到的商品类型得到的，由于推送到用户账号的推荐商品信息相较于用户的购物浏览记录和用户的购物发票信息，更为全面，因而，基于此生成的用户画像较为准确。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单的介绍，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的一种用户画像生成方法的流程示意图；

图2是本申请另一个实施例提供的另一种用户画像生成方法的流程示意图；

图3是本申请再一个实施例提供的一种用户画像生成方法的用户特征变量选取图；

图4是本申请再一个实施例提供的一种用户画像生成装置的结构示意图；

图5是本申请又一个实施例提供的一种用户画像生成设备的结构示意图。

具体实施方式

下面将详细描述本申请的各个方面的特征和示例性实施例，为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及具体实施例，对本申请进行进一步详细描述。应理解，此处所描述的具体实施例仅意在解释本申请，而不是限定本申请。对于本领域技术人员来说，本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了解决现有技术问题，本申请实施例提供了一种用户画像生成方法、装置、设备及计算机存储介质，能够获取到完整的，真实的用户购物行为数据，生成准确的用户画像。下面将结合附图对本申请的上述技术进行详细说明。

图1示出了本申请一个实施例提供的一种用户画像生成方法的流程示意图。如图1所示，包括以下步骤：

步骤S100：获取由购物应用程序推送至用户帐号的推荐商品信息；

用户在购物应用程序中完成购物操作时，购物应用程序常常会给用户账号推送相应的推荐商品信息。作为示例，推荐商品信息可以包括商品来源方信息、购物信息确认、商品评价反馈、商品促销提醒中的至少一项等。作为示例，商品来源方信息可以包括店铺名称、购物平台名称等等。

当购物应用程序向用户账号推送推荐商品信息时，本申请实施例就可以获取到由购物应用程序推送至用户帐号的推荐商品信息。

作为示例，为了获取这些推荐商品信息，首先需要通讯运营商提供一个数据接口，通过该数据接口，可以搜集购物应用程序推送至用户帐号的所有的推荐商品信息。

步骤S110：从所述推荐商品信息中提取商品来源方信息；

因商品类型通常与商品来源方信息相关，因此，为了确定出推荐商品信息中的商品类型，需要从推荐商品信息中提取出商品来源方信息。

本申请实施例，可以采用本领域常用的信息提取方式来提取商品推荐信息中的商品来源方信息，例如，通过BS4(Beautiful Soup4)的内容查找方法提取商品推荐信息中的商品来源方信息。而由于商品推荐信息中可能包括隐私信息。例如，用户购买的商品名称，购买商品的金额等，为了不侵犯用户的隐私信息，作为示例，本步骤可以采用正则表达式方式来提取商品推荐信息中的商品来源方信息，以Python为例，可以使用re.findall(“[.*]”,string)识别出购物应用程序推荐商品信息的来源方。

举例说明：在推荐商品信息的开头标注商品信息来源方的情况下，例如，购物应用程序给某用户账号发送了如下信息：“【OLAY天猫旗舰】您的光感小白瓶已发货！加赠您30元券→m.tb.cn/h.4br4xcp搭配『大红瓶』抗皱紧致！回T退”。通过正则表达式，可以识别出该条商品信息来源方是“OLAY天猫旗舰”，此商品来源方信息不涉及用户的身份信息，但根据具体的信息内容，可以明确得知用户购买了“小白瓶”，这属于侵犯用户的隐私行为。所以，在本实施例中，只需要通过正则表达式来识别推荐商品信息的商品来源方信息，即“OLAY天猫旗舰”，不会侵犯用户隐私。

步骤S120：根据所述商品来源方信息，对所述推荐商品信息进行分类，得到对应的商品类型；

一般情况下，购物应用程序推送的推荐商品信息中的商品类型可以反应用户的购物倾向，因此，需要对推荐商品信息进行分类，得出推荐商品信息对应的商品类型。

本申请实施例，可以通过步骤S110提取到的商品来源方信息对应的商品类型来确认推荐商品信息的商品类型。作为示例，可以将商品来源方信息和爬取应用程序数据得到的商家信息表进行匹配，得到商品来源方信息对应的店铺名称和店铺名称对应的商品类型，商家信息表中包含店铺名称、商品类型、店铺数量等等，例如，表1是从某个应用程序中提取的商家信息。然后，可以将店铺名称对应的商品类型，确定为商品来源方信息对应的商品类型，可以将商品来源方信息对应的商品类型，确定为推荐商品信息对应的商品类型。例如，表2是某购物应用程序推荐商品信息和表1匹配后得到的推荐商品信息对应的商品类型。

表1商家信息表

表2购物应用程序推荐商品信息对应的商品类型匹配表

步骤S130：根据所述商品类型和所述用户帐号对应的用户所属的至少一个用户群，确定每个所述用户群的购物类型分布；所述用户群根据所述用户的用户身份信息以及所述用户的线上操作行为数据确定；

消费行为学认为，具有某些共同特征的消费者所组成的群体会表现出相同或相似的消费行为。因此，可以通过用户所属用户群的购物类型分布来分析用户的购物倾向。

在本申请实施例中，可以通过统计在某个时间段内每个用户群中各个商品类型的购买比例，例如，购买比例表示所述用户群中各个商品类型购买总次数和所有商品购买次数的比值；根据购买比例，绘制每个用户群在某个时间段内不同商品类型的购物概率分布图；通过购物概率分布图，得出每个用户群的购物类型分布。

在本申请实施例中，为了使生成的用户画像更加具有代表性，还需要通过多个方面考虑用户的属性，对用户进行分类，得到具有代表性的用户群。

作为示例，如图2所示，用户在使用应用程序时需要用自己的身份信息注册账号，因此，可以从用户账号获取用户的身份信息和线上操作行为数据，从用户的用户身份信息以及用户的线上操作行为数据中，提取用户的特征变量；将特征变量做相关性分析，得到相互独立的连续特征变量；以连续特征变量为指标，基于GMM混合高斯模型的最大期望算法对所述用户进行聚类，同时应用贝叶斯信息准则选取用户的最佳分类数量，得出用户所属的至少一个用户群。然后，可以统计在某个时间段内每个用户群中各个商品类型的购买比例，例如，购买比例可以用用户群中各个商品类型购买总次数和所有商品购买次数的比值来表示。最后根据购买比例，可以绘制每个用户群在某个时间段内不同商品类型的购物概率分布图，进而可以得出每个用户群的购物类型分布。

作为示例，可以通过下述方法得到具有代表性的用户群。

消费行为学认为，具有某些共同特征的消费者所组成的群体会表现出相同或相似的消费行为。有些学者认为这些特征包括内部因素和外部因素。内部因素的生理方面有年龄、性别，心理方面有性格、心理倾向、消费习惯，外部因素则有生产力发展水平、文化背景、民族、宗教信仰、地理气候条件等。

因此，为了确定用户所属的用户群，可以从用户的身份信息以及线上操作行为数据中提取用户的特征向量来进行分析统计。使用用户所在地级市的人均GDP将教育程度、职业、收入水平、居住地这四个相互关联的特征概括起来；将用户的线上操作行为习惯来近似性格、心理倾向、行为习惯这三个特征。作为示例，对用户群体进行划分所依赖的特征变量可以设计如图3所示，从用户身份信息和用户的线上操作行为数据两个方面展开。这里对用户的线上操作行为数据的描述通过几个比值完成，分别计算用户使用视频类App(应用程序)的时长、使用游戏类App的时长、使用购物类App、社交类APP的时长占总APP时长的比值。

综上所述，可以确定7个用户特征向量，分别为性别、年龄、所在地级市人均GDP、视频类App使用时长比总时长、游戏类App使用时长比总时长、购物类App使用时长比总时长、社交类App使用时长比总时长，其中，性别为离散变量，其他均为连续变量。

通过用户账号提取用户的身份信息以及线上操作行为数据，具体获取步骤如表3所示。

表3用户特征变量的预处理详细步骤内容

在提取到用户的特征变量之后，需要将特征变量做相关性分析，确定相互独立的连续特征变量。对年龄、所在地级市人均GDP、视频类App使用时长与总时长之比、游戏类App使用时长与总时长之比、购物类App使用时长与总时长之比等用户特征变量做相关性分析，若各变量之间独立，则进行下一步，若存在相关性较强的变量，则通过因子分析聚合出相互独立的因子变量。其中，用户特征变量的相关性可以根据皮尔逊系数来确定：两两变量之间计算相关性，相关系数小于0.1，即为变量独立；相关系数小于0.5，为弱相关，可视情况接受，当做变量相对独立；相关系数为0.5到0.7为较强相关；相关系数为0.7以上，为强相关。

在确定好用户特征变量之后，接下来对用户进行聚类。将用户样本按性别分为两个子样本(男女样本分开聚类)。然后分别在两个子样本中，以最初的6个连续特征变量或因子聚合后的独立变量为指标进行聚类。用GMM混合高斯模型的EM算法对用户聚类时可用贝叶斯信息准则确定用户的最优类别数目。具体的算法步骤如下：

Step1.数据总量为N；令初始子分布数、即初始分类类数K等于15

Step2.通过k-means将数据聚类为K类

Step3.第k类数据的容量为N

Step4.估计数据x

*D是数据的维度，如果初始的6个特征变量相互独立则D＝6，否则等于因子分析后聚合出的因子变量个数

Step5.更新

Step6.通过极大似然估计求参数μ

Step7.重复Step4，Step5，Step6，直到参数收敛(不变)，进入下一步

Step8.计算似然函数值

Step9.记录当K＝15时的分类情况和贝叶斯信息量BIC＝2Kln(N)-2ln(L)

Step10.K＝K-1，重复step2～step9，直到K＝2

Step11.输出横坐标为K纵坐标为BIC的折线图；确定BIC最小的分类情形为最终分类结果，输出分类情况(包括分类数、每个样本的所在类)

设用户经过算法聚类为K类，再与性别组合，则可将用户分成2K类群体。

绘出每一类群体的各个指标的分布图，通过指标分布情况分析类别特征，对不同类别的群体进行命名。例如，若某一类群体是在女性子样本中，年龄主要分布在20～30岁、所在地级市人均GDP在各类别之间偏低、视频与社交类App使用时长高于其他两个App时长指标，则可以将该类群体命名为“经济欠发达地区视频娱乐取向的女性青年群体”或其他对应该研究目的的名称。需要注意的是，若原本设计的变量经过因子分析聚合成了因子变量，也可以使用因子变量的恰当内涵对群体进行描述。

作为示例，在得到用户所属的用户群后，统计在某个时间段内每个用户群中各个商品类型的购买比例，可以通过下述方法。

可以对上述实施例中确定好的2K类用户群体，设定一个时间段，统计分析在该时间段内每个用户群中对各个类型商品的购买比例，购买比例是用户群中每个商品类型购买总次数和所有商品购买次数的比值，具体包括以下步骤：

Step1.对每一类消费群体k＝1,2,…,2K，统计用户数N

Step2.在第k类消费群体中，对每一类产品，统计每个用户i在某段时间内(根据分析需求而定，活动期间、某月、某季度、某年均可)购买j类产品的次数t

Step3.计算第k类群体中所有用户在该段时间内购买j类产品的总次数

Step4.计算各类产品的购买次数占总浏览次数的比例

Step6.输出每类消费群体对各类产品购买量的比例P

作为示例，根据每个用户群中各个商品类型的购买比例，可以绘制出每个用户群中的用户对不同类商品的购买量占比的购物概率分布图，即可评估不同用户群体的购物类型分布，具体步骤如下：

Step1.为每一个用户群体编制浏览量分布表，列名为产品类别，表格元素为浏览量占比，消费群体k中对j类产品的浏览量占比为输出结果中的P

Step2.对每一个用户群体，降序排列其浏览量分布表中的元素，使该群体中浏览量占比最大的产品类别排在第一位

Step3.为每一个用户群体，以产品类别为横坐标，按元素值绘制直方图，并标注百分比

Step4.据此，根据大数定律利用频率来估计概率，即可得某类用户群体在某段时间有多大比例或多大可能性喜欢某类产品。

在本申请实施例中，通过统计分析在某个时间段内每个用户群中对各个类型商品的购买比例，绘制每个用户群的购物概率分布图，从而得出每个用户群的购物类型分布。在本申请实施例中，确定每个用户群的购物类型分布，自带有对应用户群的权重比例，该权重比例由用户群的实际购物数量计算得出，严谨性高，说服力足。

举例说明：某一类群体是在女性子样本中，群体特征为“经济发达地区视频娱乐取向的女性青年群体”，通过分析得知这类用户群中的消费的商品类型有护肤彩妆、女装、箱包等，那么可以通过统计护肤彩妆、女装、箱包等商品类型的购物比例，得知该用户群的购物类型分布。

步骤S140：根据每个所述用户群的购物类型分布，生成所述用户的用户画像。

因为用户画像是根据用户的属性、偏好、习惯、行为等信息而抽象出来的标签化用户模型，可以用一些高度概括的特征来描述用户。因此，需要结合用户群的购物类型分布和用户群特征，生成用户的画像。

在本申请实施例中，可以通过分析每个用户群的购物类型分布，确定每个用户群的购物倾向，然后再结合各个用户群的群体特征，生成在用户群中的各个用户的用户画像。作为示例，可以从每个用户群的购物类型分布中，选取购物类型分布百分比最大的购物类型和/或提取满足预设阈值的购物类型，作为用户群的购物倾向标签，然后根据购物倾向标签和用户的所属用户群的类别特征，生成用户的用户画像。

在本申请实施例中，根据不同的场景需要，用户群的购物倾向标签提取规则可以进行变化，在此不做详细描述。

以上为本申请实施例提供的一种用户画像生成方法的具体实现方式。根据用户所在的用户群的购物类型分布生成用户的用户画像，而用户群的购物类型分布是基于对推送到用户账号的推荐商品信息分类得到的商品类型得到的，由于推送到用户账号的推荐商品信息相较于用户的购物浏览记录和用户的购物发票信息，更为全面，因而，基于此生成的用户画像较为准确。

作为本申请的另一种实现方式，为了降低计算难度，将所述商品来源方信息和预先获取的商家信息表进行匹配之前，还可以包括以下步骤：

从所述商家信息表中提取满足第一预设条件的商家信息，所述第一预设条件包括店铺评分的分值大于预设分值和/或商品销量大于预设销量。

众所周知，一个购物应用程序中存在很多的的商家店铺，通过正则表达式提取每一条推荐商品信息的商品来源方信息时，都要遍历购物应用程序中所有的商家信息，这使得计算难度较大。

在本申请实施例中，作为示例，可行的方法是通过对店铺评分、商品销量进行限制，提取满足限制条件的商家信息，然后再将商品来源方信息和满足限制条件的商家信息进行匹配。该方法能够缩小商家样本总数，减少计算量，而且，通过购物应用程序推送商品信息进行营销的店铺，往往都是有一定销量、评分较高的店铺，因此该限制方法并不会对识别精度造成较大的影响。

作为本申请的另一种实现方式，为了节约计算成本，提高计算效率，将所述商品来源方信息和预先获取的商家信息表进行匹配，确定所述商品来源方信息对应的店铺名称和所述店铺名称对应的商品类型，具体包括以下步骤：

步骤A：商品来源方信息和所述商家信息表的字符匹配度满足预设条件，得到所述商品来源方信息对应的店铺名称，所述预设条件包括商品来源方信息和商家信息表中店铺名称的字符匹配度大于预设百分比；

同一品牌的商品可能存在不同的经销商，在购物应用程序中对应的店铺名称可能不一样，例如，品牌“耐克”对应的店铺名称可能为：“NIKE官方旗舰店”、“NIKE耐克官方旗舰店”、“耐克NIKE专卖店”。将商品来源方信息和商家信息表中的店铺名称匹配时，可能同时识别出多个店铺名称，因为这些店铺的商品类型是一样的，不会对结果造成影响。但是，在提取商品来源方信息时，都要遍历所有的商家信息，这使得计算成本增加。

在本申请实施例中，作为示例，可以设定一个条件，在将商品来源方信息和商家信息表中的店铺名称匹配时，当匹配出满足预设条件的店铺名称时，程序即停止，确定满足条件的店铺名称为商品来源方信息对应的店铺名称。

举例说明，预设条件为商品来源方信息和商家信息表中店铺名称的字符匹配度超过75％，程序即停止。例如，商品来源方为【NIKE品牌专卖店】时，商品来源方的77.77％个字符在“NIKI品牌旗舰店”这个店铺名都能匹配到，因此直接确定“NIKI品牌旗舰店”为“NIKE品牌专卖店”对应的店铺名称，不需要再继续运行程序。

步骤B：在所述店铺名称对应多个商品类型的情况下，从所述商家信息表中提取所述店铺名称对应的店铺评分；根据所述店铺评分在每个商品类型对应的所有店铺中的排名比例，将所述排名比例最靠前的商品类型确定为所述店铺名称对应的商品类型。

同一个店铺可能经营多个商品类型，在这种条件下，为了使计算快速便捷，可以通过店铺评分来确定店铺名称对应的商品类型。

在本申请的实施例中，作为示例，可行的方法为，从商家信息表中提取店铺名称对应的店铺评分，比较店铺评分在每个商品类型对应的所有店铺中的排名比例，将排名比例最靠前的商品类型确定为店铺名称对应的商品类型。

举例说明，店铺名称为“NIKI品牌旗舰店”，该店铺的商品类型有男鞋，女鞋，箱包，通过比较“NIKI品牌旗舰店”的店铺评分在男鞋，女鞋，箱包这几个商品类型对应的所有店铺中的排名比例，可以得到男鞋的排名比例为最靠前的商品类型，所以，将男鞋确定为“NIKI品牌旗舰店”的商品类型。

在本申请实施例中，通过预先设定条件，将商品来源方信息和商家信息表中店铺名称的字符匹配度大于预设百分比，来确定商品来源方信息对应的店铺名称，可以达到节约计算成本的目的。而且，通过比较店铺评分在各个商品类型的店铺中的排名比例来确定店铺名称对应的商品类型，可以使计算过程更加快速，便捷。

图4示出了本申请再一个实施例提供的一种用户画像生成装置的结构示意图。如图4所示，用户画像生成装置包括：

推荐商品信息获取单元10：用于获取由购物应用程序推送至用户帐号的推荐商品信息；

商品来源方信息提取单元20：用于从推荐商品信息中提取商品来源方信息；

商品类型匹配单元30：用于根据商品来源方信息，对推荐商品信息进行分类，得到对应的商品类型；

购物类型分布统计单元40：用于根据商品类型和用户帐号对应的用户所属的至少一个用户群，确定每个用户群的购物类型分布；用户群根据用户的用户身份信息以及用户的线上操作行为数据确定；

用户画像生成单元50：用于根据每个用户群的购物类型分布，生成所用户的用户画像。

本申请提供的一种用户画像生成装置，通过全面监控并搜集用户账号收到的购物应用程序推送的商品信息，能够获取到完整的，真实的用户购物行为数据，进而生成准确的用户画像。通过从购物应用程序推送的商品信息中提取商品来源方信息，不涉及推送信息的详细内容，还避免侵犯用户隐私。

图5示出了本申请实施例提供的一种用户画像生成设备的硬件结构示意图。

该用户画像生成设备可以包括处理器501以及存储有计算机程序指令的存储器502。

具体地，上述处理器501可以包括中央处理器(CPU)，或者特定集成电路(Application Specific Integrated Circuit，ASIC)，或者可以被配置成实施本申请实施例的一个或多个集成电路。

存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制，存储器502可包括硬盘驱动器(Hard Disk Drive，HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus，USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下，存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下，存储器502可在综合网关容灾设备的内部或外部。在特定实施例中，存储器502是非易失性固态存储器。

存储器可包括只读存储器(ROM)，随机存取存储器(RAM)，磁盘存储介质设备，光存储介质设备，闪存设备，电气、光学或其他物理/有形的存储器存储设备。因此，通常，存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如，存储器设备)，并且当该软件被执行(例如，由一个或多个处理器)时，其可操作来执行参考根据本公开的一方面的方法所描述的操作。

处理器501通过读取并执行存储器502中存储的计算机程序指令，以实现上述实施例中的任意一种用户画像生成方法。

在一个示例中，用户画像生成设备设备还可包括通信接口503和总线500。其中，如图5所示，处理器501、存储器502、通信接口503通过总线500连接并完成相互间的通信。

通信接口503，主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。

总线500包括硬件、软件或两者，将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制，总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下，总线500可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线，但本申请考虑任何合适的总线或互连。

另外，结合上述实施例中的用户画像生成方法，本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令；该计算机程序指令被处理器执行时实现上述实施例中的任意一种用户画像生成方法。

需要明确的是，本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见，这里省略了对已知方法的详细描述。在上述实施例中，描述和示出了若干具体的步骤作为示例。但是，本申请的方法过程并不限于所描述和示出的具体步骤，本领域的技术人员可以在领会本申请的精神后，作出各种改变、修改和添加，或者改变步骤之间的顺序。

以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时，其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时，本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中，或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路，等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。

还需要说明的是，本申请中提及的示例性实施例，基于一系列的步骤或者装置描述一些方法或系统。但是，本申请不局限于上述步骤的顺序，也就是说，可以按照实施例中提及的顺序执行步骤，也可以不同于实施例中的顺序，或者若干步骤同时执行。

上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解，流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器，以产生一种机器，使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解，框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合，也可以由执行指定的功能或动作的专用硬件来实现，或可由专用硬件和计算机指令的组合来实现。

以上所述，仅为本申请的具体实施方式，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。应理解，本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：曾瑞;刘国刚;于涛;张春;张辉;杨娅;邵波;
专利申请人：中国移动通信集团黑龙江有限公司;中国移动通信集团有限公司;

上一篇：一种高效的公路路基养护路面灌缝装置
下一篇：一种婴幼儿用抑菌除螨组合物及其制备方法和应用