掌桥专利:专业的专利平台
掌桥专利
首页

目标信贷用户的确定方法、装置、计算机设备及存储介质

文献发布时间:2023-06-19 09:51:02


目标信贷用户的确定方法、装置、计算机设备及存储介质

技术领域

本发明实施例涉及金融技术领域,尤其涉及一种目标信贷用户的确定方法、装置、计算机设备及存储介质。

背景技术

在互联网小额信贷平台,运营人员通常会通过数据分析将用户划分为不同群体,并对各群体制定不同的运营策略,如统计用户历史订单的利润率,通过设定阈值将其划分为高、中和低利润群体,并对不同的群体发放不同的优惠券以刺激用户消费,增加公司成交量。

但是现有技术中运营人员通常是采取这种一刀切的方式,划分人群时阈值的设定过于依赖运营人员的经验,阈值设定的好坏会直接影响到分群的好坏,而且运营人员在划分人群时通常考虑的特征属于结果型特征,如用户历史订单的利润率,这些特征只能划分出人群的利润属性,而未考虑造成利润差异的根本原因,因此,即使通过这种方式划分出了不同利润的人群,运营人员也不能从根本上了解用户的差异,也就无法制定出更合理的策略。

发明内容

本发明实施例提供一种目标信贷用户的确定方法、装置、计算机设备及存储介质,以实现根据小额信贷用户的各类特征进行针对性的群体划分,并从中寻求所需的目标信贷用户,从而帮助运营人员制定更好的运营策略。

第一方面,本发明实施例提供了一种目标信贷用户的确定方法,该方法包括:

获取每个信贷用户的多个用户特征,所述多个用户特征对应至少两个属性类型;

基于每个所述属性类型下的用户特征,利用预设聚类算法对所述信贷用户进行聚类,以分别得到基于每个所述属性类型的多个聚类群体;

获取至少两个基于不同所述属性类型的聚类群体的交集用户;

根据目标属性在所述交集用户中确定目标信贷用户。

第二方面,本发明实施例还提供了一种目标信贷用户的确定装置,该装置包括:

用户特征获取模块,用于获取每个信贷用户的多个用户特征,所述多个用户特征对应至少两个属性类型;

信贷用户聚类模块,用于基于每个所述属性类型下的用户特征,利用预设聚类算法对所述信贷用户进行聚类,以分别得到基于每个所述属性类型的多个聚类群体;

交集用户获取模块,用于获取至少两个基于不同所述属性类型的聚类群体的交集用户;

目标用户确定模块,用于根据目标属性在所述交集用户中确定目标信贷用户。

第三方面,本发明实施例还提供了一种计算机设备,该计算机设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的目标信贷用户的确定方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的目标信贷用户的确定方法。

本发明实施例提供了一种目标信贷用户的确定方法,首先获取每个信贷用户的多个用户特征,该多个用户特征对应至少两个属性类型,然后基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行多次聚类以分别得到多个聚类群体,再获取基于不同属性类型的聚类群体的交集用户,进而从获取的交集用户中根据所需的目标属性确定目标信贷用户。本发明实施例所提供的目标信贷用户的确定方法,通过基于多类特征对信贷用户分别进行聚类,再对聚类的结果进行交叉组合,实现了根据小额信贷用户的各类特征进行针对性的群体划分,清晰的反映了各个群体的不同属性,从而便于运营人员从中寻求所需的目标信贷用户,并对各种目标信贷用户制定相应的运营策略,进而有效的降低了公司的运营成本,并增加了交易额。

附图说明

图1为本发明实施例一提供的目标信贷用户的确定方法的流程图;

图2为本发明实施例二提供的目标信贷用户的确定装置的结构示意图;

图3为本发明实施例三提供的计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1为本发明实施例一提供的目标信贷用户的确定方法的流程图。本实施例可适用于互联网小额信贷平台对信贷用户进行数据分析进而制定运营策略的情况,该方法可以由本发明实施例提供的目标信贷用户的确定装置来执行,该装置可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中。如图1所示,具体包括如下步骤:

S11、获取每个信贷用户的多个用户特征,多个用户特征对应至少两个属性类型。

其中,可选的,用户特征包括基本特征和衍生特征;相应的,获取每个信贷用户的多个用户特征,包括:获取每个信贷用户的基本特征;根据基本特征获取每个信贷用户的衍生特征。进一步可选的,基本特征包括:基本信息特征、历史订单特征以及外部征信特征中的至少一种。

具体的,信贷用户的基本信息特征可以包括用户的性别、年龄以及职业等,并可以根据用户在注册信贷平台的应用程序时所填写的信息来获取。信贷用户的历史订单特征可以包括用户的历史下单金额、下单逼数、下单频率以及分期数等,并可以根据用户在使用应用程序时产生的订单日志表来获取。信贷用户的外部征信特征可以包括互金协会以及同盾征信信息等,并可以根据外部征信流水表来获取。在获取到信贷用户的基本特征之后,基于基本特征即可加工衍生出一些可以反映用户近期变化趋势的特征。示例性的,分别对用户外部借贷总金额、外部注册借贷平台个数、外部违约账户数以及在本平台的下单频率等基本特征进行加工,以得到可以反映用户近期变化的特征。如想判断用户近期的财务状况,则可先获取基本特征中的用户当月借款金额,再获取基本特征中的用户前一个月的借款金额,用当月借款金额减去上月借款金额后,再用差值除以上月借款金额,即可衍生出借款金额相对提升的特征。

获取的多个用户特征可以对应至少两个属性类型,则在获取了用户特征之后,可以根据属性类型首先对用户特征进行分类。不同属性类型的用户特征可以反映用户不同的属性,如需要反映信贷用户的活跃度时,可以通过用户近期下单笔数、下单频率以及打开信贷平台应用程序的频率等特征,如需要反映用户类型(如是否是拆借用户)时,可以通过互金协会以及同盾的外部征信特征。具体的,信贷用户的基本信息特征可以反映用户的基本情况,如用户的年龄、性别以及职业可以从侧面反映用户的借款需求。示例性的,22岁左右的刚毕业白领借款可能是为了度过从学校步入社会的过渡期,而40岁的个体经营者借款可能是为了生意周转,即基本信息特征相同或相似的人,其借款的用途可能天然的存在相似性,而基本特征差异较大的人,其借款用途可能也大不相同。信贷用户的历史订单特征可以反映用户的活跃度。示例性的,一个用户在前一个月下了十笔订单总额为5000元,在当月下了三笔订单总额为5000元,则虽然此用户近两月的下单总额相同,但下单笔数由十笔降为三笔,可以认定该用户的活跃度下降,同样的,也可以通过下单金额的相对变化以及下单频率的相对变化等特征来反映用户的活跃度变化。信贷用户的外部征信特征可以反映用户的资产状况。示例性的,一个用户外部注册的借款平台较多且外部在贷余额较多,则可认定该用户的经济状况相对较差,借款需求较大。而且外部征信特征衍生出的外部征信变化特征,也可以反映用户的资产状况的变化趋势,示例性的,一个用户当月相比上月在贷余额上升且注册的借贷平台个数增加,则可认定该用户近期较为缺钱。

S12、基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行聚类,以分别得到基于每个属性类型的多个聚类群体。

具体的,在获取了所需的用户特征并对其进行了分类之后,利用预设聚类算法针对每个属性类型下的用户特征对信贷用户分别进行聚类,每次聚类均可以将信贷用户划分成预设数量的聚类群体,且聚类群体内部的各个个体之间的特征值较为相似。同时可以为所有的用户特征赋予相同的权重,使得所有用户特征在聚类时起到的作用相同,从而避免某些特征被平均化或缩小化,而无法反映不同的群体在该特征上的差异,也就无法针对不同的群体制定差异化的运营策略。

其中,可选的,预设聚类算法包括:K-means聚类算法。K-means聚类算法是聚类算法中最为简单高效的,其核心思想是通过指定预设数量个初始质心,以作为聚类的类别,然后重复迭代直至算法收敛。在本实施例中,预设数量可以为3,即针对每个属性类型的用户特征,将信贷用户聚类为3个聚类群体。在进行聚类之前,可以首先对所有用户特征进行归一化,从而使得各个用户特征的权重相同,同时也可以提升算法的收敛速度和精度。

可选的,在基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行聚类之前,还包括:对用户特征存在缺失值的信贷用户进行过滤。具体的,基于某个属性类型进行聚类时,仅对该属性类型下的用户特征进行过滤,从而更准确的完成对信贷用户的聚类。

可选的,在基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行聚类,以分别得到基于每个属性类型的多个聚类群体之后,还包括:确定每个聚类群体对应的属性类型下的用户特征的特征均值;根据特征均值确定每个聚类群体的属性值。具体的,在完成聚类过程之后,可以将聚类结果存入spark表中,并可以将每个信贷用户的身份标识与属性类型及属性值一一对应设置,然后即可对各个聚类群体进行分析。针对每个属性类型,可以计算聚类得到的各个聚类群体在该属性类型下的用户特征的特征均值,再根据各个聚类群体之间的特征均值的差异确定各个聚类群体的属性值。示例性的,对历史订单特征进行聚类后,得出f1、f2和f3共三个聚类群体,再分别计算这三个聚类群体的历史订单特征的特征均值,得到f1群体当月下单笔数特征均值为2.5,f2群体当月下单笔数特征均值为5.6,f3群体当月下单笔数特征均值为7.2,则可以判断基于活跃度这一属性类型f1相对最不活跃,f3相对最活跃,而f2的活跃度处于两者之间,可定义为次活跃。根据上述方法即可得到各个聚类群体相对各自属性类型的属性值。

S13、获取至少两个基于不同属性类型的聚类群体的交集用户。

具体的,基于每个属性类别下的用户特征的聚类结果可以反映用户在一个维度上的属性,通过将不同属性类型下的用户特征的聚类结果进行交叉组合,即可综合反映某个群体的属性。示例性的,分别基于活跃度和资产状况这两个属性类别对信贷用户进行聚类,并且可以设置每次聚类可得到三个聚类群体,针对活跃度的各个聚类群体的属性值分别为活跃、次活跃和不活跃,针对资产状况的各个聚类群体的属性值分别为良好、一般和较差。则将两次聚类的聚类结果交叉组合,即可得到活跃且资产状况良好、活跃且资产状况一般、活跃且资产状况较差、次活跃且资产状况良好、次活跃且资产状况一般、次活跃且资产状况较差、不活跃且资产状况良好、不活跃且资产状况一般以及不活跃且资产状况较差等九种交集用户。

S14、根据目标属性在交集用户中确定目标信贷用户。

具体的,在确定了可以综合反映多个维度属性的各个交集用户之后,即可根据所需的目标属性在其中确定所需的目标信贷用户,如在上述的示例中确定出活跃度下降的缺钱类用户。

可选的,在根据目标属性在交集用户中确定目标信贷用户之后,还包括:根据目标信贷用户的属性值制定相应的运营策略。具体的,运营人员可以根据各种交集用户的属性值针对性的制定差异化的运营策略,具体可以首先对运营策略进行规划,再从交集用户中确定运营策略相应的目标信贷用户,从而将该运营策略应用在目标信贷用户上,通过不断的更新目标属性,则可以实现对所有信贷用户应用相应的运营策略。示例性的,针对活跃度下降的缺钱类用户,可以发放免息类优惠券以刺激其消费,从而提升用户的活跃度。

本发明实施例所提供的技术方案,首先获取每个信贷用户的多个用户特征,该多个用户特征对应至少两个属性类型,然后基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行多次聚类以分别得到多个聚类群体,再获取基于不同属性类型的聚类群体的交集用户,进而从获取的交集用户中根据所需的目标属性确定目标信贷用户。通过基于多类特征对信贷用户分别进行聚类,再对聚类的结果进行交叉组合,实现了根据小额信贷用户的各类特征进行针对性的群体划分,清晰的反映了各个群体的不同属性,从而便于运营人员从中寻求所需的目标信贷用户,并对各种目标信贷用户制定相应的运营策略,进而有效的降低了公司的运营成本,并增加了交易额。

实施例二

图2为本发明实施例二提供的目标信贷用户的确定装置的结构示意图,该装置可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中。如图2所示,该装置包括:

用户特征获取模块21,用于获取每个信贷用户的多个用户特征,多个用户特征对应至少两个属性类型;

信贷用户聚类模块22,用于基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行聚类,以分别得到基于每个属性类型的多个聚类群体;

交集用户获取模块23,用于获取至少两个基于不同属性类型的聚类群体的交集用户;

目标用户确定模块24,用于根据目标属性在交集用户中确定目标信贷用户。

本发明实施例所提供的技术方案,首先获取每个信贷用户的多个用户特征,该多个用户特征对应至少两个属性类型,然后基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行多次聚类以分别得到多个聚类群体,再获取基于不同属性类型的聚类群体的交集用户,进而从获取的交集用户中根据所需的目标属性确定目标信贷用户。通过基于多类特征对信贷用户分别进行聚类,再对聚类的结果进行交叉组合,实现了根据小额信贷用户的各类特征进行针对性的群体划分,清晰的反映了各个群体的不同属性,从而便于运营人员从中寻求所需的目标信贷用户,并对各种目标信贷用户制定相应的运营策略,进而有效的降低了公司的运营成本,并增加了交易额。

在上述技术方案的基础上,可选的,用户特征包括基本特征和衍生特征;

相应的,用户特征获取模块21,包括:

基本特征获取单元,用于获取每个信贷用户的基本特征;

衍生特征获取单元,用于根据基本特征获取每个信贷用户的衍生特征。

在上述技术方案的基础上,可选的,基本特征包括:基本信息特征、历史订单特征以及外部征信特征中的至少一种。

在上述技术方案的基础上,可选的,该目标信贷用户的确定装置,还包括:

用户过滤模块,用于在基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行聚类之前,对用户特征存在缺失值的信贷用户进行过滤。

在上述技术方案的基础上,可选的,该目标信贷用户的确定装置,还包括:

特征均值确定模块,用于在基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行聚类,以分别得到基于每个属性类型的多个聚类群体之后,确定每个聚类群体对应的属性类型下的用户特征的特征均值;

属性值确定模块,用于根据特征均值确定每个聚类群体的属性值。

在上述技术方案的基础上,可选的,该目标信贷用户的确定装置,还包括:

策略制定模块,用于在根据目标属性在交集用户中确定目标信贷用户之后,根据目标信贷用户的属性值制定相应的运营策略。

在上述技术方案的基础上,可选的,预设聚类算法包括:K-means聚类算法。

本发明实施例所提供的目标信贷用户的确定装置可执行本发明任意实施例所提供的目标信贷用户的确定方法,具备执行方法相应的功能模块和有益效果。

值得注意的是,在上述目标信贷用户的确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

实施例三

图3为本发明实施例三提供的计算机设备的结构示意图,示出了适于用来实现本发明实施方式的示例性计算机设备的框图。图3显示的计算机设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图3所示,该计算机设备包括处理器31、存储器32、输入装置33及输出装置34;计算机设备中处理器31的数量可以是一个或多个,图3中以一个处理器31为例,计算机设备中的处理器31、存储器32、输入装置33及输出装置34可以通过总线或其他方式连接,图3中以通过总线连接为例。

存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的目标信贷用户的确定方法对应的程序指令/模块(例如,目标信贷用户的确定装置中的用户特征获取模块21、信贷用户聚类模块22、交集用户获取模块23及目标用户确定模块24)。处理器31通过运行存储在存储器32中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的目标信贷用户的确定方法。

存储器32可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器32可进一步包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置33可用于获取每个信贷用户的多个用户特征以及产生与计算机设备的用户设置和功能控制有关的键信号输入等。输出装置34可包括显示屏等设备,可用于向用户展示所确定的目标信贷用户。

实施例四

本发明实施例四还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机处理器执行时用于执行一种目标信贷用户的确定方法,该方法包括:

获取每个信贷用户的多个用户特征,多个用户特征对应至少两个属性类型;

基于每个属性类型下的用户特征,利用预设聚类算法对信贷用户进行聚类,以分别得到基于每个属性类型的多个聚类群体;

获取至少两个基于不同属性类型的聚类群体的交集用户;

根据目标属性在交集用户中确定目标信贷用户。

存储介质可以是任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的目标信贷用户的确定方法中的相关操作。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

相关技术
  • 目标信贷用户的确定方法、装置、计算机设备及存储介质
  • 一种目标用户确定方法、装置、设备及计算机存储介质
技术分类

06120112324872