掌桥专利:专业的专利平台
掌桥专利
首页

针对借贷风险的评估方法及装置、设备、计算机可读存储介质

文献发布时间:2023-06-19 09:35:27


针对借贷风险的评估方法及装置、设备、计算机可读存储介质

技术领域

本申请涉及电子信息领域,尤其涉及一种针对借贷风险的评估方法及装置、设备、计算机可读存储介质。

背景技术

近几年市场上涌现了大量信贷机构,用户可选择的贷款渠道以及金融服务越来越多,多头借贷的情况也随之出现。多头借贷是指单个借款人同时向两家或两家以上的金融机构提出信贷需求的行为。虽然此类借贷行为在一定程度上满足了用户的资金需求,但也蕴含着较高的风险:

一般而言,信贷机构会根据用户信用、经济来源等综合情况进行授信,在其还款能力内放款。但由于借贷双方信息不对称,同一用户若获得多家金融机构授信,取得其可偿还范围之外的贷款,一旦贷款者资金链断裂,极易频繁违约,触发坏账风险。

因此有必要对个人多头信贷行为造成的违约风险进行量化评估。而现有的针对多头信贷的风险评估方法的准确性有待提高。

发明内容

申请人在研究的过程中发现,不同借贷个人的经济能力是不同的,而现有的针对多头信贷的风险评估方法,仅针对多头信贷信息进行设计,因此,对于借贷个人缺乏全面的评估,所以,准确性有待提高。

本申请提供了一种针对借贷风险的评估方法及装置、设备、计算机可读存储介质,目的在于解决如何提高多头借贷的风险评估准确性的问题。

为了实现上述目的,本申请提供了以下技术方案:

一种针对借贷风险的评估方法,包括:

获取第一用户的借贷数据,所述第一用户的借贷数据包括所述第一用户的多头借贷行为数据、所述第一用户的资产数据和所述第一用户的消费数据,任意一种所述借贷数据包括至少一个数据项;

获取所述借贷数据中的第一目标数据,所述第一目标数据包括所述借贷数据中预测能力值大于预设阈值的所述数据项,其中,所述预测能力值与所述数据项对评估结果的影响程度正相关;

将所述第一目标数据输入预设的预测模型,得到所述预测模型输出的结果,作为第一结果;

获取所述借贷数据中的第二目标数据,所述第二目标数据包括所述借贷数据中数据饱和度大于预设饱和度阈值的数据项;

将所述第二目标数据输入聚类模型,得到所述聚类模型输出的所述第一用户所属的类型,将所述第一用户所属的类型预先对应的风险等级作为第二结果,所述聚类模型通过对多个用户的借贷数据进行聚类得到多个类型;

获取所述第一用户的借贷风险的评估结果,所述评估结果依据所述第一结果和所述第二结果确定。

可选地,第一用户的多头借贷行为数据至少包括:

所述第一用户对多个借款方的还款数据项。

可选地,第一用户的多头借贷行为数据还包括以下至少一项:

所述第一用户对所述多个借款方的借款申请数据项;

所述多个借款方对所述第一用户的放款数据项;

所述多个借款方对所述第一用户的查询数据项。

可选地,第一目标数据还包括:

依据专家经验指定的数据项;

所述第二目标数据还包括:

依据专家经验指定的数据项。

可选地,预测模型的训练过程包括:

获取样本目标数据以及所述样本目标数据的标签,所述样本目标数据包括样本借贷数据中的所述预测能力值大于所述预设阈值的数据项、和依据专家经验指定的数据项;

使用一部分所述样本目标数据以及所述一部分所述样本目标数据的标签,训练所述预测模型;

使用另一部分所述样本目标数据以及所述另一部分所述样本目标数据的标签,验证经过训练的所述预测模型;

如果验证不通过,则重新选取样本目标数据训练所述预测模型,直至验证通过。

可选地,本方法还包括:

获取所述聚类模型通过对多个用户的借贷数据进行聚类得到的多个类型;

通过对比不同类型中的数据项,得到不同类型的其它属性,所述其它属性为除所述风险等级之外的属性。

可选地,预测模型为有监督模型,所述聚类模型为无监督模型。

一种针对借贷风险的评估装置,包括:

借贷数据获取模块,用于获取第一用户的借贷数据,所述第一用户的借贷数据包括所述第一用户的多头借贷行为数据、所述第一用户的资产数据和所述第一用户的消费数据,任意一种所述借贷数据包括至少一个数据项;

第一数据获取模块,用于获取所述借贷数据中的第一目标数据,所述第一目标数据包括所述借贷数据中预测能力值大于预设阈值的所述数据项,其中,所述预测能力值与所述数据项对评估结果的影响程度正相关;

第一结果获取模块,用于将所述第一目标数据输入预设的预测模型,得到所述预测模型输出的结果,作为第一结果;

第二数据获取模块,用于获取所述借贷数据中的第二目标数据,所述第二目标数据包括所述借贷数据中数据饱和度大于预设饱和度阈值的数据项;

第二结果获取模块,用于将所述第二目标数据输入聚类模型,得到所述聚类模型输出的所述第一用户所属的类型,将所述第一用户所属的类型预先对应的风险等级作为第二结果,所述聚类模型通过对多个用户的借贷数据进行聚类得到多个类型;

评估结果获取模块,用于获取所述第一用户的借贷风险的评估结果,所述评估结果依据所述第一结果和所述第二结果确定。

一种针对借贷风险的评估设备,包括存储器和处理器;

所述存储器用于存储程序,所述处理器用于运行所述程序,以实现上述针对借贷风险的评估方法。

一种计算机可读存储介质,其上存储有计算机程序,在所述计算机程序在计算机上运行时,执行上述针对借贷风险的评估方法。

本申请所述的技术方案,获取第一用户的借贷数据以及借贷数据中的第一目标数据,将第一目标数据输入预设的预测模型,得到预测模型输出的结果,作为第一结果,获取第一用户的借贷数据中的第二目标数据,将第二目标数据输入聚类模型,得到聚类模型输出的第一用户所属的类型,将第一用户所属的类型预先对应的风险等级作为第二结果。进一步获取依据第一结果和第二结果确定的第一用户的借贷风险的评估结果。因为借贷数据包括用户的多头借贷行为数据、用户的资产数据和用户的消费数据,可见,从多个角度评估用户的借贷风险,所以评估依据更为全面,从而提高评估结果的准确性,并且,第一目标数据包括借贷数据中预测能力值大于预设阈值的数据项,更有利于预测模型输出准确的结果,第二目标数据包括借贷数据中数据饱和度大于预设饱和度阈值的数据项,更有利于聚类模型输出准确的结果。进一步,评估结果依据第一结果和第二结果得到,所以提高了评估结果准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本申请实施例公开的一种针对借贷风险的评估方法的流程图;

图2为本申请实施例公开的又一种针对借贷风险的评估方法的流程图;

图3为本申请实施例公开的模型的训练方法的流程图;

图4为本申请实施例公开的一种针对借贷风险的评估装置的结构示意图。

具体实施方式

本申请实施例公开的针对借贷风险的评估方法以及装置,可以应用在但不限于银行的贷款审批平台,用于评估用户的借贷风险,具体的,从多个角度评估用户的借贷风险,尤其是多头借贷情况下的借贷风险,从而为贷款的审批提供参考。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

图1为本申请实施例公开的一种针对借贷风险的评估方法,包括以下步骤:

S101:获取第一用户的借贷数据。

本实施例中,第一用户的借贷数据包括第一用户的多头借贷行为数据、第一用户的资产数据和第一用户的消费数据。任意一种借贷数据包括至少一个数据项。

其中,多头借贷行为数据为,第一用户针对多个借贷机构的借贷行为数据,可以从多个借贷机构平台获取多头借贷行为数据。

具体的,任意一个用户的多头借贷行为数据可以包括还款数据项,还款数据项可以从多个收款渠道的代收流水信息中获取。

例如,预先设置任意一个用户的还款数据项包括但不限于以下字段:还款的接收方标识、近6月失败还款笔数、和近1年因余额不足导致的失败还款笔数。对多个收款渠道的代收流水信息进行合并整理(具体实现方式可以参见现有技术),得到预设的还款数据项字段的数值。

可选的,为了提高多头借贷行为数据与用户借贷行为的贴合度,以进一步提高评估结果的准确性,多头借贷行为数据还可以包括以下至少一项:第一用户对多个借款方的借款申请数据项、多个借款方对第一用户的放款数据项、以及多个借款方对第一用户的查询数据项。

其中,第一用户对多个借款方的借款申请数据项可以从多个借贷平台获取。

例如,预先设置任意一个用户的借款申请数据项包括但不限于以下字段:借贷方标识、用户近1月申请贷款机构数、用户成功申请笔数。对多个借贷平台的用户鉴权信息进行合并整理(用户在贷款申请前均需进行实名鉴权,在不同借贷平台的鉴权行为即可视为在多个机构进行贷款的申请操作),得到预设的借款申请数据项字段的数值。

多个借款方对第一用户的放款数据项以从多个付款渠道获取。

例如,预先设置借款方对任意一个用户的放款数据项包括但不限于以下字段:借贷方标识、所有借款方对用户近3月放款总金额、对用户放款的放款机构数。

因为代付交易即可视为借贷平台对用户的放款行为,所以将多个付款渠道的代付流水信息进行合并整理,得到放款数据项字段的数值。

多个借款方对第一用户的查询数据项可以从多个借贷平台获取。

例如,多个借款方对第一用户的查询行为数据项可以包括但不限于以下字段:近一个月内查询第一用户借贷行为数据的借贷方的标识、借贷方近一个月内查询第一用户借贷行为数据的次数、以及近一个月内第一用户被查询借贷行为数据的总次数。

任意一个用户的资产数据包括但不限于:用户的不动产资产数据。可以从不动产登记机构获取用户的资产数据。

任意一个用户的消费数据包括但不限于:用户在预设时间范围内,用于消费的金额的总量。可以从各个消费代收终端,例如POS机等获取用户的消费数据。

需要说明的是,以上各个数据项的数值,可以由从各个渠道或平台获取的原始数据经过清洗、整合、以及加工等预处理获取,具体预处理方式可以参见现有技术,这里不再赘述。

S102:获取借贷数据中的第一目标数据。

其中,第一目标数据包括借贷数据中预测能力值大于预设阈值的数据项。预测能力值与数据项对评估结果的影响程度正相关。

本实施例中,预测能力值可以为数据项的信息值(IV)。由借贷数据转换得到IV的具体过程,可以参见以下实施例。

S103:将第一目标数据输入预设的预测模型,得到预测模型输出的结果,作为第一结果。

本实施例中,预测模型可以为基于逻辑回归的评分卡模型。模型的训练过程可以参见图3所示的流程。

具体的,预测模型输出的结果可以为第一用户发生逾期还款行为的概率,从而将风险量化。

S104:获取借贷数据中的第二目标数据。

其中,第二目标数据包括借贷数据中数据饱和度大于预设饱和度阈值的数据项。具体地,数据饱和度大于预设饱和度阈值的数据项依据聚类模型的生成过程确定,具体参见以下实施例。

S105:第二目标数据输入聚类模型,得到聚类模型输出的第一用户所属的类型,将第一用户所属的类型预先对应的风险等级作为第二结果。

本实施例中,聚类模型通过对多个用户的借贷数据进行聚类得到多个类型。

每一类型预先对应的风险等级依据聚类模型的训练过程中,输出的每一类型包括的至少一个用户的数据项确定,具体参见以下实施例。

S106:获取第一用户的借贷风险的评估结果。

本实施例中,评估结果依据第一结果和第二结果确定,可选的两种确定评估结果的方法包括:

1、依据第一结果和第二结果,使用专家经验得到评估结果。

2、将第二结果依据预设的对应关系,转换为分数,并将第一结果和第二结果进行加权平均,得到评估结果。

需要说明的是,评估结果的具体获取方法还可以包括其它多种方法,在此不做赘述。

图1所示的流程具有以下有益效果:

1、第一用户的多头借贷行为数据,包括第一用户与多个借贷平台之间的借贷关系,所以,对于多头借贷的风险评估更为准确。更为重要的是,除用户的多头借贷行为数据外,还结合第一用户资产能力数据和消费行为数据,将多头借贷与还款能力以及消费能力相匹配,提升评估依据的全面性,从而提升评估结果的准确性。

2、第一用户的多头借贷行为数据,是依据第一用户真实发生的借贷行为生成的数据,不受主观因素的影响,所以,评估结果的准确性更高。

类似的,第一用户的消费行为数据,也是依据第一用户真实发生的消费行为生成的数据,能够进一步提高评估结果的准确性。

3、评估结果依据第一结果和第二结果得到,第一结果为预测模型依据第一用户自身的借贷数据,输出的将第一用户的借贷风险量化后的结果。第二结果为依据聚类模型输出的第一用户的类型,由于聚类模型通过对多个用户的借贷数据进行聚类得到多个类型,所以,第二结果指示的第一用户的类型对应的风险等级,不仅仅依据第一用户自身的借贷数据,还依据多个用户的借贷数据确定,所以,结合第一结果和第二结果得到的评估结果的准确性高。

图2为本申请实施例公开的又一种针对借贷风险的评估方法,与图1所示的流程相比,增加了数据处理的详细的步骤。图2所示的流程包括以下步骤:

S201:获取第一用户的原始借贷数据。

其中,原始借贷数据包括第一用户的多头借贷行为原始数据、第一用户的资产原始数据和第一用户的消费原始数据。任意一种原始借贷数据包括至少一个数据项。

原始借贷数据的获取方式,可以参见上述实施例。也就是说,上述实施例中的借贷数据,可以看作对原始借贷数据进行数据处理后获取的数据,但数据处理不影响数据的类型和获取的渠道。

S202:对第一用户的原始借贷数据进行数据清洗。

清洗包括但不限于以下操作:删除数值异常的数值,或者,使用同类数据项的平均值,代替数值异常的数值。将预设值作为无数值的数据项的数值。

数据的清洗处理使得数据更为规范,有利于模型输出准确性较高的评估结果。

S203:依据清洗结果中的数据项的类型,对原始借贷数据进行处理。

本实施例中,处理包括但不限于以下:

1、对属于连续变量的数据项进行分箱处理。

2、对属于名义变量的数据项进行降基处理。例如将多个名义数据项合并为一个名义数据项。

其中,分箱处理和降基处理的定义和具体实现方式,可以参见现有技术,这里不再赘述。

S204:对处理后的数据项进行证据权重转换(Weight Of Evidence,WOE)。

WOE的目的在于,使得数据项的数值能够满足逻辑回归模型对于数据格式的要求。

S205:对证据权重转换的结果进行数据均衡处理。

本实施例中,数据均衡处理包括但不限于:上采样和下采样。

需要说明的是,数据均衡处理为可选步骤,目的在于提高数据分布的均衡性,以进一步提高预测模型输出的第一结果的准确性。在不执行S205的情况下,WOE的结果即为数据均衡处理后的数据。

S206:将数据均衡处理后的数据中IV值大于预设阈值的数据,作为第一预测数据。

S207:将依据专家经验指定的数据项,作为第二预测数据。

本实施例中,将第一预测数据与第二预测数据统称为第一目标数据。

可以理解的是,第二预测数据的IV值不大于预设阈值,但实际中,存在一部分数据项,虽然IV值不大于预设阈值,但对于评估结果的影响较大,因此,将这部分数据项也作为入模数据项,以提高评估结果的准确性。

具体的,可以显示第二预测数据选择界面,专家可以在选择界面中选定第二预测数据。

S208:将第一目标数据输入基于逻辑回归的评分卡模型,得到基于逻辑回归的评分卡模型输出的第一用户的借贷风险的评估数值。

本实施例中,逻辑回归的评分卡模型为预测模型,输出的第一用户的借贷风险的评估数值即为第一结果。

图2所示的S201~S208侧重从原始借贷数据生成用于输入预测模型的数据数据(即数据均衡处理后的数据项)的过程,该过程使得预测模型的输入数据更适用于预测模型,且更为规范均衡,因此能够进一步提升预测模型输出的第一结果的准确性。并且,可以人工指定目标数据,进一步提高评估结果的准确性。

S209:在处理后的数据项中,选择数据饱和度大于预设饱和度阈值的数据项,作为第一聚类数据。

本实施例中,处理后的数据项指的是S203得到的数据,数据饱和度大于预设饱和度阈值的数据项依据聚类模型训练过程确定,具体参见S211。

S210:将依据专家经验指定的数据项,作为第二聚类数据。

本实施例中,将第一聚类数据和第二聚类数据统称为第二目标数据。

S211:将第二目标数据输入预设的聚类模型,得到聚类模型输出的第一用户所属的类型。

本实施例中,聚类模型为无监督模型,聚类模型的类型包括多种,具体结构可参见现有技术。

聚类模型依据多个用户的聚类数据训练得到,聚类模型的训练过程包括:

1、获取多个用户的聚类数据。

多个用户的聚类数据包括:多个用户的借贷数据(原始借贷数据或处理后的数据)中的数据饱和度大于预设饱和度阈值的数据项,以及专家经验指定的数据项。

任意一项数据项(记为第一数据项)的数据饱和度计算方法为:多个用户的第一数据项中,有数值的第一数据项的数量占所有第一数据项的数量的比例。例如,第一数据项为还款数据项,多个用户的原始借贷数据中,有数值的还款数据项的数量占全部还款数据项的75%,超过预设饱和度阈值70%,则,还款数据项作为聚类数据。

2、将多个用户的聚类数据属于预设的聚类模型。

3、获取聚类模型通过对多个用户的聚类数据进行聚类得到的多个类型。

基于无监督模型的聚类原理,聚类模型将基于预设的无监督聚类算法,通过不断迭代拟合模型参数,将多个用户聚类为预设数量的类型(记为N类),预设数量大于1,需要说明的是,预设数量可以为专家经验指定的数值。

其中。每一类型包括至少一个用户,其中,属于同类型的用户的聚类数据相似(即差别小),属于不同类型的用户的聚类数据相异(即差别大),其中,差别的大小通过聚类算法得到,例如,以聚类样本数据间的欧氏距离表征差别。

可以理解的是,第二目标数据包括的数据项依据聚类模型的训练过程中,多个用户的聚类数据确定,第一用户所属的类型为聚类模型对多个用户的聚类数据进行聚类得到的多个的类型中的任一种。

需要说明的是,聚类模型为有监督模型,可以依据实时借贷数据,实时更新。例如,预测模型通过不断将不同用户的聚类数据输入至聚类模型,聚类模型持续迭代调优的过程。

S212:获取第一用户所属的类型预先对应的属性,作为第二结果。

本实施例中,任意一个类型预先对应的属性至少包括风险等级,还包括其它属性。

获取每一类型预先对应的属性的过程包括:

1、获取每一类型中包括的多个用户的数据项。

可选地,任意一个类型(记为目标类型)包括的用户可以为训练聚类模型过程中,对多个用户聚类得到的目标类型中的用户。

2、通过对比不同类型中的数据项,得到不同类型的属性。

基于聚类的特性,属于同一类型的用户的数据项的属性相似,属于同一类型的用户的数据项的属性相异,所以依据预设的规则,对比对比不同类型中的数据项,依据同类型用户间相似的数据项以及不同类型用户间相异的数据项,得到不同类型的风险等级以及其它属性,例如,其它属性包括借贷意愿。

以聚类模型输出的类型包括4个类型为例。依据专家经验获取的类型的属性分别为:“高危人群”、“可疑人群”、“关注人群”及“正常人群”,其中,“高危人群”的借贷风险高,借贷意愿低。“可疑人群”和“关注人群”分别为借贷风险和借贷意愿待进一步审核的人群,“正常人群”为有强烈贷款需求且借贷风险低。将每一类型的属性作为类型预先对应的属性,当第一用户属于目标类型时,则将目标类型的风险等级和其它属性作为第二结果,例如,聚类模型输出的第一用户的类型的属性为“正常人群”,则第一用户有强烈贷款需求且借贷风险,由此,可以定向为第一用户推荐借贷项目。

图2所示的流程中,S201~S203以及S209~S212侧重于从原始借贷数据生成第二目标数据,并依据第二目标数据获取聚类模型输出的第一用户的类型对应的属性,作为第二结果。

其中,属性包括风险等级,由于多个类型由聚类模型依据多个用户的聚类数据划分得到,也即,第一用户所属于的类型,不仅与第一用户本身的借贷数据相关,也与其它用户的借贷数据相关,又因为,可以人工指定第二目标数据,所以第二结果包括的风险等级作为多头借贷的风险评估结果准确性高。

进一步,由于多个类型对应的属性依据专家经验对同类的聚类数据分析得到,所以,不仅能够获取用户的风险等级,还可以得到用户的其它属性,例如,是否有借贷意愿,也即,行为第二结果不仅能够作为多头借贷的风险评估结果,也能作为借贷意愿的参考数据,用于挖掘有贷款需求且资质优良的客户,提升客户转化率,帮助金融机构降低营销获客成本

S213:依据第一结果和第二结果确定评估结果。

本实施例中,依据第一结果和第二结果确定评估结果的方法可以包括多种,例如,由第一结果和风险等级确定评估结果,另外其他属性可以做为借贷风险的另一种参考维度。

图2所示的流程不仅通过用户自身的借贷数据,获取用户的借贷风险的评估数值(即第一结果),又可以通过用户自身的借贷数据以及其它用户的借贷数据,确定用户的类型,进一步获取类型对应的属性作为第二结果,用户的借贷风险的评估数值将用户的借贷风险量化,用于评估用户的借贷风险,用户的行为聚类结果不仅用于评估用户的借贷风险,还可以用于确定用户的其它属性,为借贷行为的分析提供依据。所以,本方法结合用户的借贷风险的评估数值以及属性,提高了借贷风险的评估的准确性。

例如,假设用户群包括的多个用户,多个用户第一结果均指示用户为借贷风险高的用户,仅依据第一结果,则用户群中所有用户的借贷请求拒绝。但是,本方法中,依据聚类模型输出的类型获取用户群中所有用户所属的类型属于同一类型,并且该类型的属性为“关注人群”,那么,说明用户的借贷风险整体提升了,借贷方可以依据第一结果数值的排序,考虑针对用户群中的部分用户放贷。

图3为本申请实施例提供的模型训练过程,包括以下步骤:

S301:获取样本目标数据以及样本目标数据的标签。

样本目标数据包括样本借贷数据中的预测能力值大于预设阈值的数据项、和依据专家经验指定的数据项。其中,样本借贷数据的获取渠道和方式,可以参见上述实施例。

S302:将样本目标数据划分为两部分。一部分作为训练数据集,一部分作为验证数据集。

S303:使用训练数据集以及标签,训练模型。

S304:使用验证数据集验证训练后的模型。

S305:如果验证不通过,返回执行S301,可以理解的是,样本目标数据要重新获取,而不再使用与上一训练过程相同的样本目标数据。

S306:如果验证通过,得到训练好的模型。

需要说明的是,模型输出给各类持牌金融机构使用,根据客户的使用反馈,评估模型效果,当模型效果下降,则对模型进行调优,即实时动态调整模型参数,确保模型始终保持最高精度。模型效果取决于三要素:自变量(训练数据集)、因变量(标签)及算法,通常自变量与因变量均保持不变,对模型进行调优的措施包括但不限于替换标签或新增标签,以确保模型始终保持最优精度。具体参见现有技术。

图4为本申请实施例公开的一种针对借贷风险的评估装置,包括:借贷数据获取模块、第一数据获取模块、第一结果获取模块、第二数据获取模块、第二结果获取模块、和评估结果获取模块。

其中,借贷数据获取模块,用于获取第一用户的借贷数据,所述第一用户的借贷数据包括所述第一用户的多头借贷行为数据、所述第一用户的资产数据和所述第一用户的消费数据,任意一种所述借贷数据包括至少一个数据项;

第一数据获取模块,用于获取所述借贷数据中的第一目标数据,所述第一目标数据包括所述借贷数据中预测能力值大于预设阈值的所述数据项,其中,所述预测能力值与所述数据项对评估结果的影响程度正相关;

第一结果获取模块,用于将所述第一目标数据输入预设的预测模型,得到所述预测模型输出的结果,作为第一结果;

第二数据获取模块,用于获取所述借贷数据中的第二目标数据,所述第二目标数据包括所述借贷数据中数据饱和度大于预设饱和度阈值的数据项;

第二结果获取模块,用于将所述第二目标数据输入聚类模型,得到所述聚类模型输出的所述第一用户所属的类型,将所述第一用户所属的类型预先对应的风险等级作为第二结果,所述聚类模型通过对多个用户的借贷数据进行聚类得到多个类型;

评估结果获取模块,用于获取所述第一用户的借贷风险的评估结果,所述评估结果依据所述第一结果和所述第二结果确定。

可选的,多头借贷行为数据至少包括:所述用户对多个借款方的还款数据项。进一步的,还可以包括:所述用户对所述多个借款方的借款申请数据项、所述多个借款方对所述用户的放款数据项、所述多个借款方对所述第一用户的查询数据项中的至少一项。

可选的,所述第一目标数据还包括:依据专家经验指定的数据项;

所述第二目标数据还包括:依据专家经验指定的数据项

可选的,所述预测模型的训练过程包括:获取样本目标数据以及所述样本目标数据的标签,所述样本目标数据包括样本借贷数据中的所述预测能力值大于所述预设阈值的数据项、和依据专家经验指定的数据项;使用一部分所述样本目标数据以及所述一部分所述样本目标数据的标签,训练所述预测模型;使用另一部分所述样本目标数据以及所述另一部分所述样本目标数据的标签,验证经过训练的所述预测模型;如果验证不通过,则重新选取样本目标数据训练所述预测模型,直至验证通过。

可选地,本装置还包括:属性确定单元,用于:

获取所述聚类模型通过对多个用户的借贷数据进行聚类得到的多个类型;

通过对比不同类型中的数据项,得到不同类型的其它属性,所述其它属性为除所述风险等级之外的属性。

可选地,预测模型为有监督模型,所述聚类模型为无监督模型。

图4所示的针对借贷风险的评估装置,因为将多头借贷行为数据、用户的资产数据和用户的消费数据均作为评估依据,所以具有较高的评估准确性。

本申请实施例还公开的一种针对借贷风险的评估设备,包括处理器和存储器。其中处理器和存储器通过总线通信。

存储器用于存储程序,处理器用于运行程序,以实现针对借贷风险的评估方法:

一种针对借贷风险的评估方法,包括:

获取第一用户的借贷数据,所述第一用户的借贷数据包括所述第一用户的多头借贷行为数据、所述第一用户的资产数据和所述第一用户的消费数据,任意一种所述借贷数据包括至少一个数据项;

获取所述借贷数据中的第一目标数据,所述第一目标数据包括所述借贷数据中预测能力值大于预设阈值的所述数据项,其中,所述预测能力值与所述数据项对评估结果的影响程度正相关;

将所述第一目标数据输入预设的预测模型,得到所述预测模型输出的结果,作为第一结果;

获取所述借贷数据中的第二目标数据,所述第二目标数据包括所述借贷数据中数据饱和度大于预设饱和度阈值的数据项;

将所述第二目标数据输入聚类模型,得到所述聚类模型输出的所述第一用户所属的类型,将所述第一用户所属的类型预先对应的风险等级作为第二结果,所述聚类模型通过对多个用户的借贷数据进行聚类得到多个类型;

获取所述第一用户的借贷风险的评估结果,所述评估结果依据所述第一结果和所述第二结果确定。

可选地,第一用户的多头借贷行为数据至少包括:

所述第一用户对多个借款方的还款数据项。

可选地,第一用户的多头借贷行为数据还包括以下至少一项:

所述第一用户对所述多个借款方的借款申请数据项;

所述多个借款方对所述第一用户的放款数据项;

所述多个借款方对所述第一用户的查询数据项。

可选地,第一目标数据还包括:

依据专家经验指定的数据项;

所述第二目标数据还包括:

依据专家经验指定的数据项。

可选地,预测模型的训练过程包括:

获取样本目标数据以及所述样本目标数据的标签,所述样本目标数据包括样本借贷数据中的所述预测能力值大于所述预设阈值的数据项、和依据专家经验指定的数据项;

使用一部分所述样本目标数据以及所述一部分所述样本目标数据的标签,训练所述预测模型;

使用另一部分所述样本目标数据以及所述另一部分所述样本目标数据的标签,验证经过训练的所述预测模型;

如果验证不通过,则重新选取样本目标数据训练所述预测模型,直至验证通过。

可选地,本方法还包括:

获取所述聚类模型通过对多个用户的借贷数据进行聚类得到的多个类型;

通过对比不同类型中的数据项,得到不同类型的其它属性,所述其它属性为除所述风险等级之外的属性。

可选地,预测模型为有监督模型,所述聚类模型为无监督模型。

本申请实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,在所述计算机程序在计算机上运行时,执行上述方法实施例所述的针对借贷风险的评估方法:

一种针对借贷风险的评估方法,包括:

获取第一用户的借贷数据,所述第一用户的借贷数据包括所述第一用户的多头借贷行为数据、所述第一用户的资产数据和所述第一用户的消费数据,任意一种所述借贷数据包括至少一个数据项;

获取所述借贷数据中的第一目标数据,所述第一目标数据包括所述借贷数据中预测能力值大于预设阈值的所述数据项,其中,所述预测能力值与所述数据项对评估结果的影响程度正相关;

将所述第一目标数据输入预设的预测模型,得到所述预测模型输出的结果,作为第一结果;

获取所述借贷数据中的第二目标数据,所述第二目标数据包括所述借贷数据中数据饱和度大于预设饱和度阈值的数据项;

将所述第二目标数据输入聚类模型,得到所述聚类模型输出的所述第一用户所属的类型,将所述第一用户所属的类型预先对应的风险等级作为第二结果,所述聚类模型通过对多个用户的借贷数据进行聚类得到多个类型;

获取所述第一用户的借贷风险的评估结果,所述评估结果依据所述第一结果和所述第二结果确定。

可选地,第一用户的多头借贷行为数据至少包括:

所述第一用户对多个借款方的还款数据项。

可选地,第一用户的多头借贷行为数据还包括以下至少一项:

所述第一用户对所述多个借款方的借款申请数据项;

所述多个借款方对所述第一用户的放款数据项;

所述多个借款方对所述第一用户的查询数据项。

可选地,第一目标数据还包括:

依据专家经验指定的数据项;

所述第二目标数据还包括:

依据专家经验指定的数据项。

可选地,预测模型的训练过程包括:

获取样本目标数据以及所述样本目标数据的标签,所述样本目标数据包括样本借贷数据中的所述预测能力值大于所述预设阈值的数据项、和依据专家经验指定的数据项;

使用一部分所述样本目标数据以及所述一部分所述样本目标数据的标签,训练所述预测模型;

使用另一部分所述样本目标数据以及所述另一部分所述样本目标数据的标签,验证经过训练的所述预测模型;

如果验证不通过,则重新选取样本目标数据训练所述预测模型,直至验证通过。

可选地,本方法还包括:

获取所述聚类模型通过对多个用户的借贷数据进行聚类得到的多个类型;

通过对比不同类型中的数据项,得到不同类型的其它属性,所述其它属性为除所述风险等级之外的属性。

可选地,预测模型为有监督模型,所述聚类模型为无监督模型。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
  • 风险评估方法、装置、计算机设备和计算机可读存储介质
技术分类

06120112227362