掌桥专利:专业的专利平台
掌桥专利
首页

催收评分方法及装置

文献发布时间:2023-06-19 12:02:28


催收评分方法及装置

技术领域

本申请涉及互联网金融行业领域,尤其涉及一种催收评分方法及装置。

背景技术

在贷后管理工作中,需要对逾期用户的催收评分,进而基于催收评分的结果确定催收策略,以对逾期用户进行贷款催收。

发明人在研究过程中发现,现有的催收评分方案,对所有的逾期用户采用相同的催收评分策略进行催收评分。然而逾期还款天数范围不同,逾期用户的风险表现不同,若都采用相同的催收评分策略,会影响催收评分的准确度,从而使得所确定的催收策略不适用,进而导致无法实现精准催收。

发明内容

本申请提供了一种催收评分方法及装置,目的在于解决现有的催收评分方案,对所有的逾期用户采用相同的催收评分策略进行催收评分,会影响催收评分的准确度,从而使得所确定的催收策略不适用,进而导致无法实现精准催收的问题。

为了实现上述目的,本申请提供了以下技术方案:

一种催收评分方法,包括:

获取目标用户的用户信息;所述目标用户为待催收评分的用户;

对所述用户信息进行解析,确定所述逾期用户的逾期还款天数所属的逾期还款天数范围;

将预先构建的各个催收评分模型中,与所述逾期还款天数范围对应的催收评分模型确定为目标催收评分模型;

将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

上述的方法,可选的,所述将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果,包括:

获取所述目标催收评分模型的多个变量属性;

从所述用户信息中提取每个变量属性各自对应的信息;

将每个变量属性各自对应的信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

上述的方法,可选的,所述将每个变量属性各自对应的信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果,包括:

计算每个变量属性各自对应的信息的特征向量;

将每个变量属性各自对应的信息的特征向量输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

上述的方法,可选的,每个催收评分模型的构建过程,包括:

采集多个逾期用户的样本数据,每个样本数据中包括多个变量;

按照逾期还款天数,对各个样本数据进行归类,得到多个样本集;

针对每个样本集,按照预设的与所述样本集对应的变量筛选策略,对所述样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据,将各个目标样本数据组成所述样本集对应的目标样本集;

针对每个目标样本集,从所述目标样本集中选取多个目标样本数据组成训练数据集,并从所述目标样本集中选取多个目标样本数据组成测试数据集,并依据所述训练数据集中包括的各个目标样本数据,对预先构建的逻辑回归模型进行训练,并依据所述测试数据集中包括的各个目标样本数据,对应已训练的逻辑回归模型进行测试,在所述已训练的逻辑回归模型通过所述测试后,将通过测试的逻辑回归模型确定为所述目标样本集的初始催收评分模型;

针对每个初始催收评分模型,采集所述初始催收评分模型的跨时间验证样本集,依据所述跨时间验证样本集中包括的各个跨时间验证样本数据对所述初始催收评分模型进行验证,在所述初始催收评分模型通过所述验证后,将所述初始催收评分模型确定为催收评分模型。

上述的方法,可选的,所述按照预设的与所述样本集对应的变量筛选策略,对所述样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据,包括:

针对所述样本集中每一个样本数据中的每一个变量,计算所述变量的缺失率和信息值,若所述缺失率小于预设缺失阈值,且所述信息值在预设范围内,则将所述变量确定为第一变量;

针对每一个第一变量,判断所述第一变量是否符合预设的与所述第一变量对应的第一业务逻辑规则,若符合,则将所述第一变量确定为第二变量;

对各个第二变量进行分箱处理,得到多个变量箱;

针对每个变量箱,若所述变量箱的占比结果小于预设占比阈值,则将所述变量箱中的每一个第二变量确定为第三变量;其中,所述变量箱的占比结果用于指示所述变量箱中包括的第二变量的数量与所有的第二变量的数量总和之间的占比;

针对每个第三变量,计算所述第三变量与每个其他第三变量之间的多重共线性指标VIF,将VIF大于预设阈值的其他第三变量进行剔除,其中,其他变量为各个第三变量中除所述第三变量外的第三变量;

将剩余的各个第三变量中,满足预设的与所述样本集对应的第二业务逻辑规则的第三变量确定为目标变量;

将各个目标变量组成所述样本集对应的目标样本集。

一种催收评分装置,包括:

获取单元,用于获取目标用户的用户信息;所述目标用户为待催收评分的用户;

第一确定单元,用于对所述用户信息进行解析,确定所述逾期用户的逾期还款天数所属的逾期还款天数范围;

第二确定单元,用于将预先构建的各个催收评分模型中,与所述逾期还款天数范围对应的催收评分模型确定为目标催收评分模型;

输入单元,用于将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

上述的装置,可选的,所述输入单元用于将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果,包括所述输入单元具体用于:

获取所述目标催收评分模型的多个变量属性;

从所述用户信息中提取每个变量属性各自对应的信息;

将每个变量属性各自对应的信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

上述的装置,可选的,所述输入单元用于将每个变量属性各自对应的信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果,包括所述输入单元具体用于:

计算每个变量属性各自对应的信息的特征向量;

将每个变量属性各自对应的信息的特征向量输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

上述的装置,可选的,还包括:

采集单元,用于采集多个逾期用户的样本数据,每个样本数据中包括多个变量;

分类单元,用于按照逾期还款天数,对各个样本数据进行归类,得到多个样本集;

筛选单元,用于针对每个样本集,按照预设的与所述样本集对应的变量筛选策略,对所述样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据,将各个目标样本数据组成所述样本集对应的目标样本集;

训练单元,用于针对每个目标样本集,从所述目标样本集中选取多个目标样本数据组成训练数据集,并从所述目标样本集中选取多个目标样本数据组成测试数据集,并依据所述训练数据集中包括的各个目标样本数据,对预先构建的逻辑回归模型进行训练,并依据所述测试数据集中包括的各个目标样本数据,对应已训练的逻辑回归模型进行测试,在所述已训练的逻辑回归模型通过所述测试后,将通过测试的逻辑回归模型确定为所述目标样本集的初始催收评分模型;

验证单元,用于针对每个初始催收评分模型,采集所述初始催收评分模型的跨时间验证样本集,依据所述跨时间验证样本集中包括的各个跨时间验证样本数据对所述初始催收评分模型进行验证,在所述初始催收评分模型通过所述验证后,将所述初始催收评分模型确定为催收评分模型。

上述的装置,可选的,所述训练单元用于按照预设的与所述样本集对应的变量筛选策略,对所述样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据,包括所述训练单元具体用于:

针对所述样本集中每一个样本数据中的每一个变量,计算所述变量的缺失率和信息值,若所述缺失率小于预设缺失阈值,且所述信息值在预设范围内,则将所述变量确定为第一变量;

针对每一个第一变量,判断所述第一变量是否符合预设的与所述第一变量对应的第一业务逻辑规则,若符合,则将所述第一变量确定为第二变量;

对各个第二变量进行分箱处理,得到多个变量箱;

针对每个变量箱,若所述变量箱的占比结果小于预设占比阈值,则将所述变量箱中的每一个第二变量确定为第三变量;其中,所述变量箱的占比结果用于指示所述变量箱中包括的第二变量的数量与所有的第二变量的数量总和之间的占比;

针对每个第三变量,计算所述第三变量与每个其他第三变量之间的多重共线性指标VIF,将VIF大于预设阈值的其他第三变量进行剔除,其中,其他变量为各个第三变量中除所述第三变量外的第三变量;

将剩余的各个第三变量中,满足预设的与所述样本集对应的第二业务逻辑规则的第三变量确定为目标变量;

将各个目标变量组成所述样本集对应的目标样本集。

一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的催收评分方法。

一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行上述的催收评分方法。

与现有技术相比,本申请包括以下优点:

本申请提供了一种催收评分方法及装置,该方法包括:获取目标用户的用户信息,对用户信息进行解析,确定目标用户的逾期还款天数所属的逾期还款天数范围,将预先构建的各个催收评分模型中,与逾期还款天数范围对应的催收评分模型确定为目标催收评分模型,将用户信息输入至目标催收评分模型中,得到目标用户的催收评分结果。可见,本技术方案中,预先构建不同逾期还款天数范围对应的催收评分模型,基于目标用户的逾期还款天数所属的逾期还款天数范围,从各个预先构建的催收评分模型中确定目标催收评分模型,基于目标催收评分模型,对目标用户进行催收评分,实现了针对不同逾期还款天数范围,利用不同的催收模型进行催收评分,提高催收评分的准确度,从而可基于催收评分结果,确定出适用的催收策略,实现精准催收。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请提供的一种催收评分方法的方法流程图;

图2为本申请提供的一种催收评分方法的又一方法流程图;

图3为本申请提供的一种催收评分方法的再一方法流程图;

图4为本申请提供的一种催收评分方法的另一方法流程图;

图5为本申请提供的一种催收评分装置的结构示意图;

图6为本申请提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。

本申请实施例提供了一种催收评分方法,该方法可以应用在多种系统平台,其执行主体可以运行在计算机终端或各种移动设备的处理器,所述催收评分方法的方法流程图如图1所示,具体包括:

S101、获取目标用户的用户信息。

本实施例中,响应于催收评分请求,获取目标用户的用户信息,其中,目标用户为待催收评分的用户,用户信息包括但不限于账户信息、对账单信息、交易流水信息、信用卡还款信息和消费信息。

本实施例中,催收评分请求为银行工作人员在需要对目标用户进行催收评分的情况下,发送的请求。

S102、对用户信息进行解析,确定目标用户的逾期还款天数所属的逾期还款天数范围。

本实施例中,预设逾期还款天数范围,可选的,预设的逾期还款天数范围为逾期还款天数0-30天,和逾期还款天数31-60天。

本实施例中,对逾期用户的用户信息进行解析,获取用户信息中包括的逾期用户的逾期日期,基于逾期日期,计算逾期用户的逾期还款天数,基于预设的逾期还款天数范围,确定目标用户的逾期还款天数所属的逾期还款天数范围。

S103、将预先构建的各个催收评分模型中,与逾期还款天数范围对应的催收评分模型确定为目标催收评分模型。

本实施例中,预先构建不同逾期天数范围对应的催收评分模型,不同催收评分模型对应不同的逾期天数范围。

本实施中,确定逾期还款天数对应的逾期还款天数范围,也就是确定是属于逾期还款天数范围为1到30天的,还是属于逾期还款天数范围为31天到60天的,进而确定出与该逾期还款天数对应的催收评分模型,将预先构建的各个催收评分模型中,与该逾期还款天数对应的催收评分模型确定为目标模型。

本实施例中,参阅图2,每个催收评分模型的构建过程,包括以下步骤:

S201、采集多个逾期用户的样本数据,每个样本数据中包括多个变量数据。

采集多个逾期用户的样本数据,需要说明的是样本数据为逾期用户历史所产生的数据,每个样本数据中包括多个变量。

S202、按照逾期还款天数,对各个样本数据进行归类,得到多个样本集。

本实施例中,确定每个样本数据对应的逾期还款天数,按照逾期还款天数,对各个样本数据进行归类,得到多个样本集,可选的,可以将各个样本数据归为两类,得到两个样本集,分别为第一样本集和第二样本集,第一样本集中包括的样本数据对应的逾期还款天数属于第一逾期还款天数范围,第二样本集中包括的样本数据对应的逾期还款天数属于第二逾期还款天数范围,可选的,第一逾期还款天数范围为1到30天,第二逾期还款天数范围为31到60天;也就是说,不同样本集对应不同的逾期还款天数范围。

S203、针对每个样本集,按照预设的与样本集对应的变量筛选策略,对样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据,将各个目标样本数据组成样本集对应的目标样本集。

本实施例中,预设多个变量筛选策略,不同变量筛选策略对应不同的逾期还款天数范围。

本实施例中,针对每个样本集,获取预设的与该样本集对应的变量筛选策略,具体的,依据该样本集对应的逾期还款天数范围,确定预设的与该逾期还款天数范围对应的变量筛选策略。

本实施例中,针对每个样本集,依据该样本集对应的变量筛选策略,对样本集中的每一个样本数据进行变量筛选,将每一个样本数据中变量筛选得到的结果确定为该样本数据的目标样本数据。

需要说明的是,同一样本集中的各个样本数据按照相同的变量筛选策略进行变量筛选,不同样本集中的样本数据按照不同的变量筛选策略进行变量筛选。

参阅图3,按照预设的与样本集对应的变量筛选策略,对样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据的过程,具体包括以下步骤:

S301、针对样本集中每一个样本数据中的每一个变量,计算变量的缺失率和信息值,若缺失率小于预设缺失阈值,且信息值在预设范围内,则将变量确定为第一变量。

本实施例中,针对样本集中每一个样本数据中的每一个变量,计算该变量的缺失率和信息值,具体的缺失率和信息值的计算方式请参照现有技术。

本实施例中,针对样本集中每一个样本数据中的每一个变量,判断该变量的缺失率是否小于预设缺失阈值,且信息值是否在预设范围内,可选的,缺失阈值可以是80%,预设范围可以是大于0.01且小于10的范围。

本实施例中,针对样本集中每一个样本数据中的每一个变量,若该变量的缺失率小于预设缺失阈值,且信息值在预设范围内,则将变量确定为第一变量,否则,不将该变量确定为第一变量,也就是当该变量的缺失率不小于预设缺失阈值,或信息值不在预设范围内时,不将该变量确定为第一变量。

S302、针对每一个第一变量,判断第一变量是否符合预设的与第一变量对应的第一业务逻辑规则,若符合,则将第一变量确定为第二变量。

本实施例中,预设不同变量对应的第一业务逻辑规则。

本实施例中,针对每一个第一变量,获取该第一变量对应的第一业务逻辑规则,判断该第一变量是否符合其对应的第一业务逻辑规则,若该第一变量符合其对应的第一业务逻辑规则,则将该第一变量确定为第二变量,若该第一变量不符合对应的第一业务逻辑规则,则不将该第一变量确定为第二变量。

S303、对各个第二变量进行分箱处理,得到多个变量箱。

对各个第二变量进行分箱处理,具体的,按照第二变量的数据类型,对各个第二变量进行分箱处理,得到多个变量箱,其中,数据类型包括但不限于数值型和文本型。

S304、针对每个变量箱,若变量箱的占比结果小于预设占比阈值,则将变量箱中的每一个第二变量确定为第三变量。

本实施例中,针对每个变量箱,计算该变量箱的占比结果,具体的,将该变量箱中的包括的第二变量的数量,除以所有第二变量的数量总和,得到该变量的占比结果,也就是说,该变量箱的占比结果用于指示该变量箱中包括的第二变量的数量与所有第二变量的数量总和之间的占比。

本实施例中,针对每个变量箱,判断该变量箱的占比结果是否小于预设占比阈值,若该变量箱的占比结果小于预设占比阈值,则将该变量箱中的每一个第二变量确定为第三变量,若该变量箱的占比结果不小于预设占比阈值,则不将该变量箱中的中任意一个第二变量确定为第三变量。

S305、针对每个第三变量,计算第三变量与其他每个第三变量之间的多重共线性指标VIF,将VIF大于预设阈值的其他第三变量进行剔除,其中,其他变量为各个第三变量中除所述第三变量外的第三变量。

本实施例中,针对每个第三变量,计算该第三变量与每个其他第三变量之间的多重共线性指标VIF,多重共线性指标VIF的具体计算方式请参照现有技术,此处不再赘述。其中,其他第三变量为各个第三变量中除该第三变量外的第三变量。

本实施例中,针对每个第三变量,判断该第三变量与每个其他第三变量之间的多重共线性指标VIF是否大于预设阈值,将VIF大于预设阈值的每个其他变量进行剔除。可选的,预设阈值可以是10。

本实施例中,为控制变量中的多重共线性,运用线性回归计算方差膨胀系数(VIF)。VIF的计算是通过每个第三变量对其他第三变量的回归方法,计算R

其中,VIF=1/(1-R^2),VIF越大,第三变量和其他第三变量出现多重共线性的可能越大。

需要说明的是,已经剔除的第三变量不再用于计算的多重共线性指标VIF。

对上述提及的针对每个第三变量,计算第三变量与其他每个第三变量之间的多重共线性指标VIF,将VIF大于预设阈值的其他第三变量进行剔除的过程进行举例说明如下:

第三变量为A、B、C、D、和E,针对第三变量A,分别计算AB、AC、AD、AE之间的多重共线性VIF,其中,AB之间的VIF大于预设阈值、AE之间的VIF大于预设阈值,则将第三变量B和E进行剔除,然后针对第三变量C,计算CD之间的多重共线性VIF,若CD之间的VIF大于预设阈值,则将第三变量D进行剔除。

S306、将剩余的各个第三变量中,满足预设的与样本集对应的第二业务逻辑规则的第三变量确定为目标变量。

本实施例中,针对剩余的每个第三变量,判断该第三变量是否满足预设的与该第三变量所属样本集对应的第二业务逻辑规则,若该第三变量满足预设的与该第三变量所属样本集对应的第二业务逻辑规则,则将该第三变量确定为目标变量。

本实施例中,通过第二业务逻辑规则,对剩余的各个第三变量进行进一步的筛选,筛选出符合业务意义且特征显著的变量。

S307、将各个目标变量组成样本集对应的目标样本集。

本实施例中,将各个目标变量组成样本集对应的目标样本集。

可选的,针对第一样本集中的每一个样本数据,按照第一样本集对应的变量筛选规则,从每一个样本数据包括的各个变量中筛选出16个变量;针对第二样本集中的每一个样本数据,按照第二样本集对应的变量筛选规则,从每一个第二样本数据包括的各个变量中筛选出9个变量。

本实施例中,通过对样本集中每一个样本数据中的每一个变量,进行缺失率判断、信息值判断、第一业务逻辑规则判断、分箱处理、多重共线性指标VIF判断和第二业务逻辑规则判断,实现对各个变量进行筛选,以筛选出目标变量。

S204、针对每个目标样本集,从目标样本集中选取多个目标样本数据组成训练数据集,并从目标样本集中选取多个目标样本数据组成测试数据集,依据训练数据集中包括的各个目标样本数据,对预先构建的逻辑回归模型进行训练,并依据测试数据集中包括的各个目标样本数据,对应已训练的逻辑回归模型进行测试,在已训练的逻辑回归模型通过测试后,将通过测试的逻辑回归模型确定为目标样本集的初始催收评分模型。

本实施例中,针对每个目标样本集,从目标样本集中选取多个目标样本数据组成训练数据集,并从目标样本集中选取多个目标样本数据组成测试数据集;可选的,可以从目标样本集中选取70%的目标样本数据做成训练数据集,可以从目标样本集中选取30%的目标样本数据组成测试数据集;需要说明的是,训练数据集中包括的目标样本数据的数量和测试数据集中包括的目标样本数据的数量之和,等于目标样本集中包括的目标样本数据的数量。

本实施例中,针对每个目标样本集,依据该目标样本集对应的训练数据集中的各个目标样本数据,对预先构建的逻辑回归模型进行训练,具体的,可以采用逻辑回归的方法,对逻辑回归模型进行训练,在完成训练后,依据该目标样本数据集对应的测试数据集中的各个目标样本数据,对已训练的逻辑回归模型进行测试,具体的,获取以训练的逻辑回归模型的ROC曲线,KS值,其中,ROC曲线:接受者操作特征(Receiver OperatingCharacteristic)曲线是一种比较两个分类模型有用的可视化工具。ROC曲线显示了给定模型的真正例率(TPR)和假正例率(FPR)之间的权衡。KS(Kolmogorov-Smirnov):指标衡量的是好坏样本累计分部之间的差值,KS值范围在0%-100%,判别标准如下:

KS值:<20%;差;

KS值:20%-40%;一般;

KS值:41%-50%;好;

KS值:51%-75%;非常好;

KS值:>75%;过高,需要谨慎的验证模型。

本实施例中,基于ROC曲线和KS值,判断已训练的逻辑回归模型是都通过测试,若通过测试,则将通过测试的逻辑回归模型确定为目标样本集的初始催收评分模型。

S205、针对每个初始催收评分模型,采集初始催收评分模型的跨时间验证样本集,依据跨时间验证样本集中包括的各个跨时间验证样本数据对初始催收评分模型进行验证,在初始催收评分模型通过验证后,将初始催收评分模型确定为催收评分模型。

本实施例中,针对每个初始催收评分模型,采集初始催收评分模型的跨时间验证样本集,跨时间验证集为逾期用户在表现期内的还款行为信息,表现期为观察点后推N天的时间,观察点为采集逾期用户的样本数据的采集时间点,需要说明的是,对于不同初始催收模型,N是不同的;对于逾期还款天数范围为1到30天对应的初始催收评分模型,N可以设置为90,对于逾期还款天数范围为31到60天对应的初始催收评分模型,N可以设置为60。

其中,还款行为信息中包括逾期用户在表现期内的表现,可选的,可以以好或坏,体现逾期用户在表现期内的表现。本实施例中,针对不同逾期还款天数,设置第一表现分类表和第二表现分类表,用于定义用户在表现期内的表现,第一表现分类表用于定义逾期还款天数范围为1到30天对应的逾期用户在表现期内的表现分类,如表1所示,第二表现分类表用于定义逾期还款天数范围为31到60天对应的逾期用户在表现期内的表现分类,如表2所示。

表1第一表现分类表

表2第二表现分类表

S104、将用户信息输入至目标催收评分模型中,得到目标用户的催收评分结果。

本实施例中,将用户信息输入至目标催收评分模型中,得到目标催收评分模型输出的该目标用户的催收评分结果,以便于基于催收评分结果确定对应的催收策略,实现精准催收。其中,催收评分结果可以以“好”或“坏”表示,也就是目标催收评分模型输出好或坏的催收评分结果。

参阅图4,将用户信息输入至目标催收评分模型中,得到目标用户的催收评分结果的过程,包括:

S401、获取目标催收评分模型的多个变量属性。

本实施例中,每个催收评分模型对应的变量属性是确定的,也就是说需要筛选出哪些变量作为催收评分模型的输入是确定的。

本实施例中,获取目标催收评分模型的多个变量属性,变量属性用于指示待输入模型的变量的类型。

S402、从用户信息中提取每个变量属性各自对应的信息。

对用户信息进行解析,确定用户信息中包括的每一个变量的类型,从而基于用户信息中包括的每一个变量的类型,从用户信息中提取每个变量属性各自对应的信息,也就是针对每个变量属性,从用户信息中提取类型与该变量属性对应的变量。

S403、将每个变量属性各自对应的信息输入至目标催收评分模型中,得到目标用户的催收评分结果。

本实施例中,将所提取的每个变量属性各自对应的信息输入至目标催收评分模型中,得到目标用户的催收评分结果。

具体的,将每个变量属性各自对应的信息输入至目标催收评分模型中,得到目标用户的催收评分结果的过程,具体包括以下步骤:

计算每个变量属性各自对应的信息的特征向量;

将每个变量属性各自对应的信息的特征向量输入至所述目标催收评分模型中,得到目标用户的催收评分结果。

本实施例中,对每个变量属性各自对应的信息进行特征向量,得到每个变量属性各自对应的信息的特征向量,将每个变量属性各自对应的信息的特征向量输入至所述目标催收评分模型中,得到目标用户的催收评分结果。

本申请实施例提供的催收评分方法,获取目标用户的用户信息,对用户信息进行解析,确定目标用户的逾期还款天数所属的逾期还款天数范围,将预先构建的各个催收评分模型中,与逾期还款天数范围对应的催收评分模型确定为目标催收评分模型,将用户信息输入至目标催收评分模型中,得到目标用户的催收评分结果。应用本申请实施例提供的催收评分方法,预先构建不同逾期还款天数范围对应的催收评分模型,基于目标用户的逾期还款天数所属的逾期还款天数范围,从各个预先构建的催收评分模型中确定目标催收评分模型,基于目标催收评分模型,对目标用户进行催收评分,实现了针对不同逾期还款天数范围,利用不同的催收模型进行催收评分,提高催收评分的准确度,从而可基于催收评分结果,确定出适用的催收策略,实现精准催收。

与图1所述的方法相对应,本申请实施例还提供了一种催收评分装置,用于对图1中方法的具体实现,其结构示意图如图5所示,具体包括:

获取单元501,用于获取目标用户的用户信息;所述目标用户为待催收评分的用户;

第一确定单元502,用于对所述用户信息进行解析,确定所述逾期用户的逾期还款天数所属的逾期还款天数范围;

第二确定单元503,用于将预先构建的各个催收评分模型中,与所述逾期还款天数范围对应的催收评分模型确定为目标催收评分模型;

输入单元504,用于将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

本申请实施例提供的催收评分装置,还款天数所属的逾期还款天数范围,从各个预先构建的催收评分模型中确定目标催收评分模型,基于目标催收评分模型,对目标用户进行催收评分,实现了针对不同逾期还款天数范围,利用不同的催收模型进行催收评分,提高催收评分的准确度,从而可基于催收评分结果,确定出适用的催收策略,实现精准催收。

在本申请的一个实施例中,基于前述方案,输入单元504用于将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果,包括输入单元504具体用于:

获取所述目标催收评分模型的多个变量属性;

从所述用户信息中提取每个变量属性各自对应的信息;

将每个变量属性各自对应的信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

在本申请的一个实施例中,基于前述方案,输入单元504用于将每个变量属性各自对应的信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果,包括所述输入单元504具体用于:

计算每个变量属性各自对应的信息的特征向量;

将每个变量属性各自对应的信息的特征向量输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

在本申请的一个实施例中,基于前述方案,还可以配置为:

采集单元,用于采集多个逾期用户的样本数据,每个样本数据中包括多个变量;

分类单元,用于按照逾期还款天数,对各个样本数据进行归类,得到多个样本集;

筛选单元,用于针对每个样本集,按照预设的与所述样本集对应的变量筛选策略,对所述样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据,将各个目标样本数据组成所述样本集对应的目标样本集;

训练单元,用于针对每个目标样本集,从所述目标样本集中选取多个目标样本数据组成训练数据集,并从所述目标样本集中选取多个目标样本数据组成测试数据集,并依据所述训练数据集中包括的各个目标样本数据,对预先构建的逻辑回归模型进行训练,并依据所述测试数据集中包括的各个目标样本数据,对应已训练的逻辑回归模型进行测试,在所述已训练的逻辑回归模型通过所述测试后,将通过测试的逻辑回归模型确定为所述目标样本集的初始催收评分模型;

验证单元,用于针对每个初始催收评分模型,采集所述初始催收评分模型的跨时间验证样本集,依据所述跨时间验证样本集中包括的各个跨时间验证样本数据对所述初始催收评分模型进行验证,在所述初始催收评分模型通过所述验证后,将所述初始催收评分模型确定为催收评分模型。

在本申请的一个实施例中,基于前述方案,训练单元用于按照预设的与所述样本集对应的变量筛选策略,对所述样本集中的每一个样本数据进行变量筛选,得到每个样本数据对应的目标样本数据,包括训练单元具体用于:

针对所述样本集中每一个样本数据中的每一个变量,计算所述变量的缺失率和信息值,若所述缺失率小于预设缺失阈值,且所述信息值在预设范围内,则将所述变量确定为第一变量;

针对每一个第一变量,判断所述第一变量是否符合预设的与所述第一变量对应的第一业务逻辑规则,若符合,则将所述第一变量确定为第二变量;

对各个第二变量进行分箱处理,得到多个变量箱;

针对每个变量箱,若所述变量箱的占比结果小于预设占比阈值,则将所述变量箱中的每一个第二变量确定为第三变量;其中,所述变量箱的占比结果用于指示所述变量箱中包括的第二变量的数量与所有的第二变量的数量总和之间的占比;

针对每个第三变量,计算所述第三变量与每个其他第三变量之间的多重共线性指标VIF,将VIF大于预设阈值的其他第三变量进行剔除,其中,其他变量为各个第三变量中除所述第三变量外的第三变量;

将剩余的各个第三变量中,满足预设的与所述样本集对应的第二业务逻辑规则的第三变量确定为目标变量;

将各个目标变量组成所述样本集对应的目标样本集。

申请实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行以下操作:

获取目标用户的用户信息;所述目标用户为待催收评分的用户;

对所述用户信息进行解析,确定所述逾期用户的逾期还款天数所属的逾期还款天数范围;

将预先构建的各个催收评分模型中,与所述逾期还款天数范围对应的催收评分模型确定为目标催收评分模型;

将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

本申请实施例还提供了一种电子设备,其结构示意图如图6所示,具体包括存储器601,以及一个或者一个以上的指令602,其中一个或者一个以上指令602存储于存储器601中,且经配置以由一个或者一个以上处理器603执行所述一个或者一个以上指令602进行以下操作:

获取目标用户的用户信息;所述目标用户为待催收评分的用户;

对所述用户信息进行解析,确定所述逾期用户的逾期还款天数所属的逾期还款天数范围;

将预先构建的各个催收评分模型中,与所述逾期还款天数范围对应的催收评分模型确定为目标催收评分模型;

将所述用户信息输入至所述目标催收评分模型中,得到所述目标用户的催收评分结果。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

以上对本申请所提供的一种催收评分方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 催收评分方法及装置
  • 基于预定催收系统的账单催收方法、装置及电子设备
技术分类

06120113147269