掌桥专利:专业的专利平台
掌桥专利
首页

风控模型构建方法和装置、风险识别方法、计算机设备

文献发布时间:2023-06-19 13:49:36


风控模型构建方法和装置、风险识别方法、计算机设备

技术领域

本申请涉及计算机技术领域,特别是涉及一种风控模型构建方法和装置、风险识别方法、计算机设备和存储介质。

背景技术

随着物流行业在金融领域的不断深入扩展,基于物流行业内客群的金融产品不断在增加。根据业务的需求以及为了避免造成不必要的损失,通常需要对客群进行一定的风险判断。传统通常利用基于用户数据进行风控建模得到的风控模型实现客群风险的判断。

然而,由于目前物流领域内金融产品的风控建模大多采用的数据还是征信数据,缺乏一定的物流行业特色,导致物流行业产品风险识别的准确率降低。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高识别准确率的风控模型构建方法和装置、风险识别方法、计算机设备和存储介质。

一种风控模型构建方法,其特征在于,所述方法包括:

根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流模型;

评估各所述征信模型和各所述物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型;

确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型;

融合所述主融合征信模型和所述辅融合物流模型,得到评分模型,以及融合所述主融合物流模型与所述辅融合征信模型,得到风险分类模型;

组合所述评分模型和所述风险分类模型,得到风控模型。

在其中一个实施例中,所述确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型,包括:

评估各所述物流模型作为所述主融合征信模型的模型变量时的信息价值,选取信息价值与所述主融合征信模型的原始变量的信息价值最接近的物流模型作为辅融合物流模型;

评估各所述征信模型作为所述主融合物流模型的模型变量时的信息价值,选取信息价值与所述主融合物流模型的原始变量的信息价值最接近的征信模型作为辅融合征信模型。

在其中一个实施例中,所述融合所述主融合征信模型和所述辅融合物流模型,得到评分模型,包括:

将所述辅融合物流模型作为模型变量添加至所述主融合征信模型的模型变量中,得到更新征信模型;

对所述更新征信模型进行评分训练,得到评分模型。

在其中一个实施例中,所述融合所述主融合物流模型与所述辅融合征信子模型,得到风险分类模型,包括:

将所述辅融合征信模型作为模型变量添加至所述主融合物流模型的模型变量中,得到更新物流模型;

对所述更新物流模型进行风险分类训练,得到风险分类模型。

在其中一个实施例中,所述根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流子模型,包括:

从所述征信数据中获取预设数量的目标征信数据,以及从所述物流数据中获取预设数量的目标物流数据;

基于各所述目标征信数据对所述征信数据进行分类,得到预设数量的征信数据集合,以及基于各所述目标物流数据对所述物流数据进行分类,得到预设数量的物流数据集合;

根据各所述征信数据集合分别进行逻辑回归建模,得到预设数量的征信模型,以及根据各所述物流数据集合分别进行逻辑回归建模,得到预设数量的物流模型。

在其中一个实施例中,所述评估各所述征信模型和各所述物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型,包括:

分别对各所述征信模型和各所述物流模型进行分布检验,得到各所述征信模型和各所述物流模型的分布检验值;

根据各所述征信模型的所述分布检验值,确定区分能力最高的征信模型作为主融合征信模型;

根据各所述物流模型的所述分布检验值,确定区分能力最高的物流模型作为主融合物流模型。

一种风险识别方法,所述方法包括:

利用上述任一项所述风控模型构建方法中的所述风控模型中的所述评分模型对客群数据进行筛选,确定高风险客群;

利用上述任一项所述风控模型构建方法中的所述风控模型中的所述风险分类模型对所述高风险客群进行风险分类,确定所述高风险客群的风险类别。

一种风控模型构建装置,所述装置包括:

建模模块,用于根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流模型;

评估模块,用于评估各所述征信模型和各所述物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型;

确定模块,用于确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型;

融合模块,用于融合所述主融合征信模型和所述辅融合物流模型,得到评分模型,以及融合所述主融合物流模型与所述辅融合征信模型,得到风险分类模型;

组合模块,用于组合所述评分模型和所述风险分类模型,得到风控模型。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项风控模型构建方法和风险识别方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项风控模型构建方法和风险识别方法的步骤。

上述风控模型构建方法和装置、风险识别方法、计算机设备和存储介质,在利用征信数据和物流数据分别建模得到征信模型和物流模型之后,基于模型的区分能力和信息价值确定主融合征信模型、主融合物流模型、辅融合征信模型和辅融合物流模型,进而融合主融合征信模型和辅融合物流模型得到评分模型,以及融合主融合物流模型和辅融合征信模型得到风险分类模型,从而得到以征信数据为主的、物流数据为辅的评分模型,以及物流数据为主、征信数据为辅的风险分类模型,在保证得到的风控模型不失风险识别能力的同时具备物流行业的固有特征,提高物流行业产品风险识别的准确率。

附图说明

图1为一个实施例中风控模型构建方法的应用环境图;

图2为一个实施例中风控模型构建方法的流程示意图;

图3为一个实施例中根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流模型步骤的流程示意图;

图4为一个实施例中风控模型构建装置的结构框图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的风控模型构建方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。当终端102获取到征信数据和物流数据之后,可以由终端102单独实现上述风控模型构建方法。也可以由终端102将征信数据和物流数据发送给通信的服务器104,由服务器104实现风控模型构建方法。

以服务器104为例,具体地,服务器104根据获取的征信数据建模得到预设数量的征信模型,以及服务器104根据获取的物流数据建模得到预设数量的物流模型;服务器104评估各征信模型和各物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型;服务器104确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型;服务器104融合主融合征信模型和辅融合物流模型,得到评分模型,以及服务器104融合主融合物流模型与所述辅融合征信模型,得到风险分类模型;服务器104组合评分模型和风险分类模型,得到风控模型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种风控模型构建方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤S202,根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流模型。

其中,物流数据是用户进行物流活动所产生的数据,包括但不限于运费、重量、托寄物名称、地址、寄件类型、寄件目的地数量等等。征信数据是反映用户或企业的信用信息。

具体地,当服务器获取到征信数据和物流数据之后,根据配置的预设数量将征信数据和物流数据进行分类。分别得到预设数量的征信数据集合和预设数量的物流数据类。例如,预设数量为3,则服务器分别将征信数据分为3类,得到3个征信数据类。同理,将物流数据分为3类,得到3个物流数据类。然后,服务器根据每一个征信数据类、物流数据类进行建模,得到每一个征信数据类对应的征信模型,以及得到每一个物流数据类对应的物流模型。例如,3个征信数据类对应3个征信模型,3个物流数据类对应的3个物流模型,一共6个模型。

步骤S204,评估各征信模型和各物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型。

其中,区分能力是用于衡量模型准确性的指标。主融合征信模型和主融合物流模型是进行模型融合时作为主模型进行融合的模型,可以理解为是接收其他模型融入到本模型的模型。

在一个实施例中,步骤S204包括:分别对各征信模型和各物流模型进行分布检验,得到各征信模型和各所述物流模型的分布检验值;根据各征信模型的分布检验值,确定区分能力最高的征信模型作为主融合征信模型;根据各物流模型的分布检验值,确定区分能力最高的物流模型作为主融合物流模型。

具体地,为了保证融合后的模型具备良好的区分能力,服务器分别评估各征信模型和各物流模型的区分能力。模型区分能力的评估可以通过对模型进行分布检验确定,分布检验是指检验模型是否符合某种分布的检验过程,包括但不限于柯尔莫可洛夫-斯米洛夫检验(Kolmogorov-smirnov test,KS检验)、t-检验等。本实施例优选利用KS检验去检验征信模型和物流模型的区分能力。

然后,服务器根据分布检验的结果选取区分能力最高的征信模型作为主融合征信模型,以及选取区分能力最高的物流模型作为主融合物流模型。例如,以KS检验为例,由于KS检验最终的检验结果为具体地KS值,KS值越高区分能力越好。因此,服务器即可通过比较各征信模型或物流模型的KS值,KS值最高的征信模型或物流模型为区分能力最高的征信模型或物流模型。

步骤S206,确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型。

其中,信息价值(Information Value,IV值)主要用来对输入变量进行编码和预测能力评估,特征变量IV值的大小即表示该变量预测能力的强弱。

具体地,为了确保融合模型的稳定性,当服务器确定主融合征信模型和主融合物流模型之后,应当选取对于主融合征信模型来说信息价值比较稳定的物流模型作为辅融合物流模型。同理,应当选取对于主融合物流模型来说信息价值比较稳定的征信模型作为辅融合征信模型。

在一个实施例中,步骤S206,包括:评估各物流模型作为主融合征信模型的模型变量时的信息价值,选取信息价值与主融合征信模型的原始变量的信息价值最接近的物流模型作为辅融合物流模型;评估各征信模型作为主融合物流模型的模型变量时的信息价值,选取信息价值与主融合物流模型的原始变量的信息价值最接近的征信模型作为辅融合征信模型。

具体地,当选取对于主融合模型来说信息价值最稳定的辅融合模型时,为了符合实际情况,可以是将候选的辅融合模型直接作为主融合模型的模型变量时,该候选的辅融合模型的信息价值。具体到本实施例,即将各物流模型作为主融合征信模型的模型变量时,计算该物流模型的信息价值。同理,将各征信模型作为主融合物流模型的模型变量时,计算该征信模型的信息价值。信息价值的计算可以采用现有任意一种方法,例如通过WOE(Weight of Evidence,证据权重)计算信息价值。

然后,由于对于主融合模型来说最稳定的辅融合模型,应当是辅融合模型融合到主融合模型之后不会对该主融合模型产生过大的影响的模型。所以,根据信息价值选取最稳定的辅融合模型时,将各候选的辅融合模型的信息价值与主融合模型中的原始变量(主融合原本所包括的模型变量)的信息价值进行比较。信息价值最接近原始变量的信息价值的模型表示其作为模型变量与原始变量的预测能力强弱程度相差不大,即最稳定。因此,选取信息能力与主融合模型的原始变量的信息价值最接近的模型作为辅融合模型。具体到本实施例,即从所有的物流模型中选取作为主融合征信模型的模型变量时,其信息价值与主融合征信模型的原始变量的信息价值最接近的物流模型作为辅融合物流模型。同理,即从所有的征信模型中选取作为主融合物流模型的模型变量时,其信息价值与主融合物流模型的原始变量的信息价值最接近的征信模型作为辅融合征信模型。

步骤S208,融合主融合征信模型和辅融合物流模型,得到评分模型,以及融合主融合物流模型与所述辅融合征信模型,得到风险分类模型。

步骤S210,组合评分模型和风险分类模型,得到风控模型。

具体地,当服务器根据区分能力和信息价值确定好主融合征信模型、主融合物流模型、辅融合征信模型和辅融合物流模型之后,即可开始进行模型融合阶段。服务器将主融合征信模型与辅融合物流模型进行模型融合,构建以征信数据为主物流数据为辅的评分模型。以及,服务器将主融合物流模型与辅融合征信模型进行模型融合,构建以物流数据为主征信数据为辅的风险分类模型。

然后,服务器将得到的评分模型和风险分类模型组合成为风控模型,即最终构建得到的风控模型中包括以征信数据为主物流数据为辅的评分模型和以物流数据为主征信数据为辅的风险分类模型。由于该风控模型包括以征信数据为主的评分模型,使得风控模型具备良好的风险识别能力。同时包括以物流数据为主的风险分类模型,进行风险分类的时候还能同时从物流行业的维度进行,使得风控模型不失风险识别能力的同时还能物流行业的固有特征,从而提高风控模型的准确性。

另外,后续针对不同的业务需求,可以根据风险分类模型的输出结果进行不同的业务处理。例如,业务人员可以根据风险分类模型对客群所输出的风险类别为该客群进行利率定价,针对不同风险类别的客群完成不同利率的配置。

上述风控模型构建方法,在利用征信数据和物流数据分别建模得到征信模型和物流模型之后,基于模型的区分能力和信息价值确定主融合征信模型、主融合物流模型、辅融合征信模型和辅融合物流模型,进而融合主融合征信模型和辅融合物流模型得到评分模型,以及融合主融合物流模型和辅融合征信模型得到风险分类模型,从而得到以征信数据为主的、物流数据为辅的评分模型,以及物流数据为主、征信数据为辅的风险分类模型,在保证得到的风控模型不失风险识别能力的同时具备物流行业的固有特征,提高物流行业产品风险识别的准确率。

在一个实施例中,融合主融合征信模型和辅融合物流模型,得到评分模型,包括:将辅融合物流模型作为模型变量添加至主融合征信模型的模型变量中,得到更新征信模型;对更新征信模型进行评分训练,得到评分模型。

具体地,当服务器确定主融合征信模型和辅融合物流模型之后,将辅融合物流模型作为模型变量融合到主融合征信模型中。即,将辅融合物流模型作为模型变量加入到主融合征信模型的模型变量中,从而得到更新征信模型。更新征信模型即可以理解为模型变量有更新的主融合征信模型。例如,主融合征信模型原本包括的模型变量有3个,将辅融合物流变量模型作为模型变量加入到主融合征信模型中之后得到的更新征信模型中就包括4个模型变量。

当得到更新征信模型之后,基于更新征信模型所包括的模型变量重新对更新征信模型进行训练。而该以征信数据为主物流数据为辅的融合模型目的在于进行评分,即训练该模型时以评分为目标进行训练。例如,假设模型为逻辑回归模型,即根据更新征信模型所包括的模型变量,以评分为目标重新进行逻辑回归建模。

另外,经过实际风控建模操作,所得评分模型中包括的物流变量包括:运费、寄件类型、寄件目的地数量及包裹数量加工的特征。具体为:最近2-4个月运费折人民币总和的和、最近10个月一级分类的不同种类数、最近1个月目的地经营本部的不同种类数、最近11个月计费总重量的变异系数、最近3个月中总费用折人民币(除代收货款外)总和最大值与最近3-6个月中总和最大值的比值、最近9个月中运费折人民币总和最大的月份距现在的月份数、最近3个月包裹总件数的最小值。应当理解的是,上述提供的物流变量仅供参考,评分模型中具体包括的物流变量由实际进行风控建模时所选物流数据决定。

在一个实施例中,融合主融合物流模型与辅融合征信子模型,得到风险分类模型,包括:将辅融合征信模型作为模型变量添加至主融合物流模型的模型变量中,得到更新物流模型;对更新物流模型进行风险分类训练,得到风险分类模型。

具体地,当服务器确定主融合物流模型和辅融合征信模型之后,将辅融合征信模型作为模型变量融合到主融合物流模型中。即,将辅融合征信模型作为模型变量加入到主融合物流模型的模型变量中,从而得到更新物流模型。更新物流模型即可以理解为模型变量有更新的主融合物流模型。例如,主融合物流模型原本包括的模型变量有3个,将辅融合征信变量模型作为模型变量加入到主融合物流模型中之后得到的更新物流模型中就包括4个模型变量。

当得到更新物流模型之后,基于更新物流模型所包括的模型变量重新对更新物流模型进行训练。而该以物流数据为主、物流数据为辅的融合模型目的在于进行分类,即训练该模型时以分类为目标进行训练。例如,假设模型为逻辑回归模型,即根据更新物流模型所包括的模型变量,以分类为目标重新进行逻辑回归建模。

另外,经过实际风控建模的操作,所得风险分类模型中包括的物流变量包括:运费、寄件目的地、单号等加工的特征,具体为:最近8个月中运费折人民币去重总次数等于0的最近月份距现在的月份数、最近11个月原单号的不同种类数、最近1个月区域标识的不同种类数、最近9个月中运费折人民币总和最大的月份距现在的月份数、最近9个月中运费折人民币去重总次数最大的月份距现在的月份数。应当理解的是,上述提供的物流变量仅供参考,风险分类模型中具体包括的物流变量由实际进行风控建模时所选物流数据决定。

在一个实施例中,如图3所示,步骤S202包括:

步骤302,从征信数据中获取预设数量的目标征信数据,以及从物流数据中获取预设数量的目标物流数据。

其中,目标征信数据是上传征信数据的用户从征信数据中预选的用于作为分类标准的征信数据。目标物流数据是上传物流数据的用户从物流数据中预选的用于作为分类标准的物流数据。

具体地,当服务器获取到征信数据和物流数据后,从征信数据中获取用户指定的目标征信数据。从物流数据中获取用户指定的目标物流数据。

步骤304,基于各目标征信数据对征信数据进行分类,得到预设数量的征信数据集合,以及基于各目标物流数据对物流数据进行分类,得到预设数量的物流数据集合。

具体地,当服务器获取到目标征信数据和目标物流数据之后,根据目标征信数据对所有的征信数据进行分类,以及根据目标物流数据对所有的物流数据进行分类。以一个目标征信数据A为例,基于目标征信数据A对所有的征信数据进行相关性分析和共性分析,确定与目标征信数据A相关性高和共性高的征信数据。将与目标征信数据A相关性高和共性高的征信数据删除,得到剩余与目标征信数据A相关性低和共性低的征信数据。然后,对剩余的征信数据进行逐步回归,进一步筛除与目标征信数据A引起多重共线性的征信数据。最终剩余的征信数据与目标征信数据分为一类,组成征信数据集合。物流数据分类与征信数据分类原理相同,同样经过相关性分析、共性分析和逐步回归得到与目标物流数据一类的物流数据组成物流数据集合。因此,预设数量的目标征信数据即能够得到预设数量的征信数据集合,预设数量的目标物流数据能够得到预设数量的物流数据集合。例如,3个目标征信数据能够将所有的征信数据分为3个征信数据集合。

步骤306,根据各征信数据集合分别进行逻辑回归建模,得到预设数量的征信模型,以及根据各物流数据集合分别进行逻辑回归建模,得到预设数量的物流模型。

具体地,当服务器得到预设数量的征信数据集合和物流数据集合之后,每一个数据集合单独进行建模,得到每一数据集合对应的模型。即,预设数量的征信数据集合能够建模得到预设数量的征信模型。预设数量的物流数据建模能够建模得到预设数量的物流模型。本实施例中,建模优选逻辑回归建模。

本实施例中,通过目标征信数据和目标物流数据对数据分类,进而建模得到多个不同类型的模型,为后续选择确定融合模型提供充足的模型类型,确保最终能够选择合适的模型进行融合,提高风控模型的准确性。

在一个实施例中,提供一种风险识别方法,包括:利用上述任一实施例记载的风控模型中的评分模型对客群数据进行筛选,确定高风险客群;利用上述任一实施例记载的风控模型中的风险分类模型对高风险客群进行筛选,确定高风险客群的风险类别。

具体地,当通过风控构建方法构建得到包括评分模型和风险分类模型的风控模型之后,服务器可以将该风控模型部署到本地。当接收到风险识别任务之后,调用该风控模型。将接收到的客群数据输入到风控模型中的评分模型,通过该评分模型对客群数据进行预测评分,确定客群数据对应的客群是否为高风险客群。然后,将高风险客群对应的客群数据再输入到风控模型中的风险分类模型中,通过风险分类模型对高风险客群进行风险分类。并且,服务器还可以基于具体地风险识别任务根据风险分类模型输出的风险类别进行后续处理。例如,假设本次风险识别任务是为用户进行利率定价,当服务器获取到客群的风险分类之后,服务器即可根据预设的风险类别与利率的映射关系确定不同风险类别的客群对应的利率。

本实施例中,通过使用征信数据和物流数据构建好的风控模型,能够加强物流行业金融产品的风控水平,提高物流行业金融产品风控的准确率。

应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图4所示,提供了一种风控模型构建装置,包括:建模模块402、评估模块404、确定模块406、融合模块408和组合模块410,其中:

建模模块402,用于根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流模型。

评估模块404,用于评估各征信模型和各物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型。

确定模块406,用于确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型。

融合模块408,用于融合主融合征信模型和辅融合物流模型,得到评分模型,以及融合主融合物流模型与辅融合征信模型,得到风险分类模型。

组合模块410,用于组合评分模型和风险分类模型,得到风控模型。

在一个实施例中,确定模块406还用于评估各物流模型作为主融合征信模型的模型变量时的信息价值,选取信息价值与主融合征信模型的原始变量的信息价值最接近的物流模型作为辅融合物流模型;评估各征信模型作为主融合物流模型的模型变量时的信息价值,选取信息价值与主融合物流模型的原始变量的信息价值最接近的征信模型作为辅融合征信模型。

在一个实施例中,融合模块408还用于将辅融合物流模型作为模型变量添加至主融合征信模型的模型变量中,得到更新征信模型;对更新征信模型进行评分训练,得到评分模型

在一个实施例中,融合模块408还用于将辅融合征信模型作为模型变量添加至主融合物流模型的模型变量中,得到更新物流模型;对更新物流模型进行风险分类训练,得到风险分类模型。

在一个实施例中,建模模块402还用于从征信数据中获取预设数量的目标征信数据,以及从物流数据中获取预设数量的目标物流数据;基于各目标征信数据对征信数据进行分类,得到预设数量的征信数据集合,以及基于各目标物流数据对物流数据进行分类,得到预设数量的物流数据集合;根据各征信数据集合分别进行逻辑回归建模,得到预设数量的征信模型,以及根据各物流数据集合分别进行逻辑回归建模,得到预设数量的物流模型。

在一个实施例中,评估模块404还用于分别对各征信模型和各物流模型进行分布检验,得到各征信模型和各所述物流模型的分布检验值;根据各征信模型的分布检验值,确定区分能力最高的征信模型作为主融合征信模型;根据各物流模型的分布检验值,确定区分能力最高的物流模型作为主融合物流模型。

关于风控模型构建装置的具体限定可以参见上文中对于风控模型构建方法的限定,在此不再赘述。上述风控模型构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储征信数据、物流数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种风控模型构建方法。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流模型;

评估各征信模型和各物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型;

确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型;

融合主融合征信模型和辅融合物流模型,得到评分模型,以及融合主融合物流模型与辅融合征信模型,得到风险分类模型;

组合评分模型和风险分类模型,得到风控模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:评估各物流模型作为主融合征信模型的模型变量时的信息价值,选取信息价值与主融合征信模型的原始变量的信息价值最接近的物流模型作为辅融合物流模型;评估各征信模型作为主融合物流模型的模型变量时的信息价值,选取信息价值与主融合物流模型的原始变量的信息价值最接近的征信模型作为辅融合征信模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:将辅融合物流模型作为模型变量添加至主融合征信模型的模型变量中,得到更新征信模型;对更新征信模型进行评分训练,得到评分模型

在一个实施例中,处理器执行计算机程序时还实现以下步骤:将辅融合征信模型作为模型变量添加至主融合物流模型的模型变量中,得到更新物流模型;对更新物流模型进行风险分类训练,得到风险分类模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:从征信数据中获取预设数量的目标征信数据,以及从物流数据中获取预设数量的目标物流数据;基于各目标征信数据对征信数据进行分类,得到预设数量的征信数据集合,以及基于各目标物流数据对物流数据进行分类,得到预设数量的物流数据集合;根据各征信数据集合分别进行逻辑回归建模,得到预设数量的征信模型,以及根据各物流数据集合分别进行逻辑回归建模,得到预设数量的物流模型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:分别对各征信模型和各物流模型进行分布检验,得到各征信模型和各所述物流模型的分布检验值;根据各征信模型的分布检验值,确定区分能力最高的征信模型作为主融合征信模型;根据各物流模型的分布检验值,确定区分能力最高的物流模型作为主融合物流模型。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

根据获取的征信数据建模得到预设数量的征信模型,以及根据获取的物流数据建模得到预设数量的物流模型;

评估各征信模型和各物流模型的区分能力,选取区分能力最高的征信模型作为主融合征信模型和选取区分能力最高的物流模型作为主融合物流模型;

确定信息价值最稳定的物流模型作为辅融合物流模型和确定信息价值最稳定的征信模型作为辅融合征信模型;

融合主融合征信模型和辅融合物流模型,得到评分模型,以及融合主融合物流模型与辅融合征信模型,得到风险分类模型;

组合评分模型和风险分类模型,得到风控模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:评估各物流模型作为主融合征信模型的模型变量时的信息价值,选取信息价值与主融合征信模型的原始变量的信息价值最接近的物流模型作为辅融合物流模型;评估各征信模型作为主融合物流模型的模型变量时的信息价值,选取信息价值与主融合物流模型的原始变量的信息价值最接近的征信模型作为辅融合征信模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将辅融合物流模型作为模型变量添加至主融合征信模型的模型变量中,得到更新征信模型;对更新征信模型进行评分训练,得到评分模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将辅融合征信模型作为模型变量添加至主融合物流模型的模型变量中,得到更新物流模型;对更新物流模型进行风险分类训练,得到风险分类模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从征信数据中获取预设数量的目标征信数据,以及从物流数据中获取预设数量的目标物流数据;基于各目标征信数据对征信数据进行分类,得到预设数量的征信数据集合,以及基于各目标物流数据对物流数据进行分类,得到预设数量的物流数据集合;根据各征信数据集合分别进行逻辑回归建模,得到预设数量的征信模型,以及根据各物流数据集合分别进行逻辑回归建模,得到预设数量的物流模型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:分别对各征信模型和各物流模型进行分布检验,得到各征信模型和各所述物流模型的分布检验值;根据各征信模型的分布检验值,确定区分能力最高的征信模型作为主融合征信模型;根据各物流模型的分布检验值,确定区分能力最高的物流模型作为主融合物流模型。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

技术分类

06120113821182