掌桥专利:专业的专利平台
掌桥专利
首页

信贷风险预警方法和装置

文献发布时间:2023-06-19 11:35:49


信贷风险预警方法和装置

技术领域

本发明涉及人工智能技术领域,尤其涉及一种信贷风险预警方法和装置。

背景技术

信贷风险一直是商业银行在经营活动中防范的重点,信贷业务也是商业银行内部审计部门分析监测的重点。当前处于信息化的爆发时代,数据已经成为商业银行经营活动中的重要因素。要提前发现并预测信贷客户风险状况,就需要收集存储在各类业务系统中的信贷客户交易数据,然后使用一些统计工具对这些业务数据进行风险分析,从而得出相应的定量风险分析结果,及早提示被审计机构采用相应的措施防范并化解该风险。

在现有技术中,大多是基于人工处理的方法进行信贷风险评估,包括问卷调查法、座谈询问法、查阅法等偏向于人工调查访谈形式的方法。或者,由审计专业人员手工导入需要分析的信贷数据,然后使用excel等工具自行选取信度分析法、熵值法等数据方法对数据进行分析,暂无专用的信贷风险自动分析系统。

在实现本发明的过程中,本发明的发明人发现现有的信贷风险评估方法至少存在以下缺点:在现有的信贷风险评估方法中,人工参与成本极高,对分析者的门槛要求较高,评估结果的好坏往往依赖于分析者的技术水平,而且,由于人工进行信贷数据分析的过程出错概率较大,降低了信贷风险评估结果的准确率,与此同时,人工进行信贷数据分析和处理的过程比较耗时,降低了信贷风险评估的工作效率。

发明内容

有鉴于此,本发明提供了一种信贷风险预警方法和装置,能够提高信贷风险评估工作的效率和信贷风险评估结果的准确率,进而有助于相关机构及时、有效地发现信贷风险客户,提前预警以化解信贷风险。

为实现上述目的,根据本发明的第一个方面,提供了一种信贷风险预警方法。

本发明的信贷风险预警方法包括:获取用户的基础指标数据;所述用户的基础指标数据包括多个用于信贷风险评估的一级指标;基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值;对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值;根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值。

可选地,所述基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值包括:对于所述用户的每个一级指标,计算该一级指标在各个风险分类下的概率密度函数值,根据所述一级指标在各个风险分类下的概率密度函数值计算所述一级指标的信贷风险影响值。

可选地,根据所述一级指标在各个风险分类下的概率密度函数值计算所述一级指标的信贷风险影响值包括:将所述各个风险分类聚合成正常类、关注类和不良类这三个聚类;计算所述一级指标在不良类下的概率密度函数值与该一级指标在所有聚类下的概率密度函数值之和的比值,并将所述比值作为所述一级指标的信贷风险影响值。

可选地,在所述基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值之前,所述方法还包括:对用户的基础指标数据进行归一化处理,以及,对用户的基础指标数据进行正态化处理。

可选地,所述对用户的基础指标数据进行归一化处理包括:对于分析统计量类型为绝对斜率的一级指标,根据如下公式对所述用户的一级指标进行归一化处理:

其中,k′表示所述用户归一化后的一级指标值,k

可选地,所述对用户的基础指标数据进行归一化处理还包括:对于分析统计量类型为离散系数的一级指标,根据如下公式对所述用户的一级指标进行归一化处理:

其中,V′表示所述用户归一化后的一级指标值,V表示所述用户的一级指标的离散系数,V

可选地,所述对用户的基础指标数据进行正态化处理包括:根据预先构建的正态化处理函数对所述用户的一级指标进行正态化处理;

其中,x′表示正态化处理后的一级指标值,x表示正态化处理之前的一级指标值,a为常数。

可选地,所述对用户的基础指标数据进行正态化处理包括:采用BOX-COX方法对用户的基础指标数据进行正态化处理。

可选地,所述对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值包括:按照各个一级指标的权重系数,对隶属于同一二级指标的一级指标的信贷风险影响值进行加权求和,以得到所述二级指标的信贷风险影响值。

可选地,根据如下方式确定各个一级指标的权重系数:对于每个一级指标,计算基础数据表中该一级指标在统计周期内的全部取值为非空的用户数与总用户数的比值,并将该比值作为所述一级指标的权重系数。

可选地,所述根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值包括:将所述用户各个二级指标的信贷风险影响值代入信贷风险评估函数,以得到所述用户的信贷风险评估值;其中,所述信贷风险评估函数是通过对多元线性回归模型进行训练得到的。

可选地,所述方法还包括:在根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值之后,对所述用户的信贷风险评估值进行展示。

可选地,所述方法还包括:在根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值之后,根据所述用户的信贷风险评估值判断是否需要对所述用户进行预警,并在判断结果为是的情况下触发相应的预警操作。

为实现上述目的,根据本发明的第二个方面,提供了一种信贷风险预警装置。

本发明的信贷风险预警装置包括:获取模块,用于获取用户的基础指标数据;所述用户的基础指标数据包括多个用于信贷风险评估的一级指标;确定模块,用于基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值;聚合模块,用于对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值;评估模块,用于根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值。

为实现上述目的,根据本发明的第三个方面,提供了一种电子设备。

本发明的电子设备,包括:一个或多个处理器;以及,存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明的信贷风险预警方法。

为实现上述目的,根据本发明的第四个方面,提供了一种计算机可读介质。

本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明的信贷风险预警方法。

上述发明中的一个实施例具有如下优点或有益效果:通过获取用户的基础指标数据,基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值,对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合以得到所述用户各个二级指标的信贷风险影响值,根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值这些步骤,能够提高信贷风险评估工作的效率和信贷风险评估结果的准确率,进而有助于相关机构及时、有效地发现信贷风险客户,提前预警以化解信贷风险。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是本发明实施例可以应用于其中的示例性系统架构图;

图2是根据本发明第一实施例的信贷风险预警方法的主要流程示意图;

图3是根据本发明第二实施例的信贷风险预警方法的主要流程示意图;

图4是根据本发明第三实施例的信贷风险预警装置的主要模块示意图;

图5是根据本发明第四实施例的信贷风险预警装置的主要模块示意图;

图6是适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

需要指出的是,在不影响本发明实施的情况下,本发明中的各个实施例以及实施例中的技术特征可以相互组合。

图1示出了可以应用本发明实施例的信贷风险预警方法或信贷风险预警装置的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如金融审计类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的金融审计类网站提供支持的后台管理服务器。例如,后台管理服务器可以对终端设备通过网络发送的信贷风险评估请求等进行处理,并将处理结果反馈给终端设备。

需要说明的是,本发明实施例所提供的信贷风险预警方法一般由服务器105执行,相应地,信贷风险预警装置一般设置于服务器105中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2是根据本发明第一实施例的信贷风险预警方法的主要流程示意图。如图2所示,本发明实施例的信贷风险预警方法包括:

步骤S201:获取用户的基础指标数据;所述用户的基础指标数据包括多个用于信贷风险评估的一级指标。

在该步骤中,可通过一种或多种方式获取用户的基础指标数据。例如,可根据审计人员确定的数据结构自定义上传用户的基础指标数据,或者通过接口方式从数据库服务器等数据源中获取用户的基础指标数据等等。

其中,所述用户的基础指标数据除了包括多个用于信贷风险评估的一级指标之外,还可包括诸如用户编号等用户基本信息。示例性地,所述用于信贷风险评估的一级指标包括但不限于:员工数量、总交易金额、总贷方发生额、总借方发生额、薪酬支出金额、电费支出金额、总销售收入金额、采购支出客户数、销售收入客户数等。具体实施时,用户的基础指标数据中每个一级指标可具有多个不同时段下的指标值。例如,对于员工数量这个一级指标,其取值可包括1月份的员工数量、2月份的员工数量、3月份的员工数量。

步骤S202:基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值。

贝叶斯分类器原理,是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率。在本发明中,在贝叶斯分类器原理的基础上观察特征,通过似然函数建立观察指标与信贷风险之间的联系。

示例性地,步骤S202具体包括:对于所述用户的每个一级指标,计算该一级指标在各个风险分类下的概率密度函数值,根据所述一级指标在各个风险分类下的概率密度函数值计算所述一级指标的信贷风险影响值。

在一个可选实施方式中,所述根据所述一级指标在各个风险分类下的概率密度函数值计算所述一级指标的信贷风险影响值包括:将所述各个风险分类聚合成正常类、关注类和不良类这三个聚类;计算所述一级指标在不良类下的概率密度函数值与该一级指标在所有聚类下的概率密度函数值之和的比值,并将所述比值作为所述一级指标的信贷风险影响值。

例如,假设共设置了12级风险分类,对于用户的每个一级指标,可计算该一级指标在各级风险分类下的概率密度函数值,然后将12级风险分类聚合成正常类、关注类和不良类这三个聚类,并通过对概率密度函数值进行累加得到各个聚类的概率密度函数值,再根据如下公式计算所述一级指标的信贷风险影响值:

其中,Y表示一级指标的信贷风险影响值,P

进一步,在步骤S202之前,本发明实施例的方法还可包括以下步骤:预先基于风险分类标签将训练用信贷客户样本数据拆分为多个子样本组,比如,假设训练用信贷客户样本数据的风险分类标签共有12级,则可按照风险分类标签将样本数据拆分为12个子样本组;基于训练用信贷客户样本数据,计算出各个风险分类下每个一级指标的期望和标准差,从而确定出各个风险分类下一级指标的分布。进而,在步骤S202中,可基于各个风险分类下一级指标的分布计算该一级指标在各个风险分类下的概率密度函数值。

步骤S203:对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值。

用户的基础指标数据包括多个一级指标,这些一级指标又可被进一步归类至多个二级指标之下。在一个可选示例中,用户的基础指标数据包括16个一级指标,这些一级指标又可被进一步归类至“经营活动规模、经营稳定性、业务成长性、短期偿债能力、市场拓展能力”这五个二级指标之下。比如,“员工数量”、“总交易金额”等7个一级指标隶属于“经营活动规模”这个二级指标,“总销售收入金额”等2个一级指标隶属于“业务成长性”这个二级指标。

示例性地,在步骤S203中,可按照各个一级指标的权重系数,对隶属于同一二级指标的一级指标的信贷风险影响值进行加权求和,以得到所述二级指标的信贷风险影响值。

在一个可选实施方式中,各个一级指标的权重系数可根据如下方式确定:对于每个一级指标,计算基础数据表中该一级指标在统计周期内的全部取值为非空的用户数与总用户数的比值,并将该比值(即指标有效客户占比)作为所述一级指标的权重系数。例如,假设对于“员工数量”这个一级指标来说,基础数据表中该一级指标在统计周期内的全部取值为非空的用户数为900,基础数据表中共有1000个用户的信贷数据,则可将两者的比值0.9作为该一级指标的权重。在另一个可选实施方式中,在计算出各个一级指标的指标有效客户占比之后,对一级指标的指标有效客户占比进行归一化处理,并将归一化处理结果作为一级指标的权重系数。此外,在具体实施时,还可由用户根据经验设置各个一级指标的权重系数。

步骤S204:根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值。

示例性地,在步骤S204中,将所述用户各个二级指标的信贷风险影响值代入信贷风险评估函数,以得到所述用户的信贷风险评估值。其中,所述信贷风险评估函数是通过对多元线性回归模型进行训练得到的。

在本发明实施例中,通过获取用户的基础指标数据,基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值,对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合以得到所述用户各个二级指标的信贷风险影响值,根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值这些步骤,能够提高信贷风险评估工作的效率和信贷风险评估结果的准确率,进而有助于相关机构及时、有效地发现信贷风险客户,提前预警以化解信贷风险。

图3是根据本发明第二实施例的信贷风险预警方法的主要流程示意图。如图3所示,本发明实施例的信贷风险预警方法包括:

步骤S301:获取用户的基础指标数据。

在该步骤中,可通过一种或多种方式获取用户的基础指标数据。例如,考虑到获取数据的渠道比较广泛,基础数据表结构也不尽相同,因此,可根据审计人员确定的数据结构自定义上传用户的基础指标数据;或者通过接口方式从数据库服务器等数据源中获取用户的基础指标数据等等。

其中,所述用户的基础指标数据除了包括多个用于信贷风险评估的一级指标之外,还可包括诸如用户编号等用户基本信息。示例性地,所述用于信贷风险评估的一级指标包括但不限于:员工数量、总交易金额、总贷方发生额、总借方发生额、薪酬支出金额、电费支出金额、总销售收入金额、采购支出客户数、销售收入客户数等。具体实施时,用户的基础指标数据中每个一级指标可具有多个不同时段下的指标值。例如,对于员工数量这个一级指标,其取值可包括1月份的员工数量、2月份的员工数量、3月份的员工数量。

步骤S302:对用户的基础指标数据进行归一化处理。

示例性地,在该步骤中,可按照一级指标的分析统计量类型进行相应的归一化处理。

具体来说,对于分析统计量类型为绝对斜率的一级指标,根据如下公式对所述用户的一级指标进行归一化处理:

其中,k′表示所述用户归一化后的一级指标值,k

对于分析统计量类型为离散系数的一级指标,根据如下公式对所述用户的一级指标进行归一化处理:

其中,V′表示所述用户归一化后的一级指标值,V表示所述用户的一级指标的离散系数,V

进一步,在按照一级指标的分析统计量类型进行相应的归一化处理之前,可根据如下方式计算各个一级指标的分析统计量:对用户的各个一级指标按照其所属的分析统计量类型进行绝对斜率或者离散系数的计算。具体来说,绝对斜率可通过计算用户的一级指标在统计周期内数据变动的绝对量得出;离散系数可通过计算用户的一级指标在统计周期内的标准差和期望的比值得出。

在本发明实施例中,通过对用户的基础指标数据进行归一化处理,能够将各个一级指标的原始采样数据转换为位于0到1之间的修正数据,从而便于后续进行风险评估。

步骤S303:对用户的基础指标数据进行正态化处理。

本发明的发明人发现,用户的基础指标数据大多满足尖峰厚尾分布,该分布符合大多数金融数据特点。若直接基于用户的基础指标数据进行后续处理,则存在线性和方差齐性不足的问题,很难在观测指标与风险概率之间建立联系,影响信贷风险评估结果的准确性。鉴于此,在本发明中,通过步骤S303对用户的基础指标数据进行了正态化处理。

在本发明中,通过步骤S303对用户的基础指标数据进行了正态化处理,使得处理后的数据呈正态化分布,大大改善了指标数据的质量,提高了观测指标对信贷风险的预测能力。

在一个可选示例中,可根据如下预先构建的正态化处理函数对所述用户的一级指标进行正态化处理;

其中,x′表示正态化处理后的一级指标值,x表示正态化处理之前的一级指标值,a为常数。

在本发明实施例中,上述正态化处理函数是经过长期实践确定的,通过上述正态化处理函数对用户的一级指标进行正态化处理,能够明显改善数据质量,显著提高观测指标对信贷风险的预测能力。

进一步,在步骤S303之前,可根据如下方式确定上述正态化处理函数中a的最优值:对正态化处理函数中的参数a赋初始值,根据当前正态化处理函数对训练样本数据中的一级指标进行正态化处理,统计每个一级指标的实际分布区间内信贷客户数量,并计算其与理想分布的区间内信贷客户数量的差值,通过用户事先设定的步长不断调整参数a的值,以逐步调整实际分布区间范围,实现实际分布的客户数能够逼近理想分布的客户数,从而确定参数a的最优值。

在另一个可选示例中,可根据BOX-COX方法对用户的基础指标数据进行正态化处理。BOX-COX方法,是统计建模中常用的一种数据变换,用于连续的响应变量不满足正态分布的情况,通过BOX-COX变换可以明显地改善数据的正态性分布情况,提高观测指标对信贷风险的预测能力。

步骤S304:基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值。

示例性地,步骤S304具体包括:对于所述用户的每个一级指标,计算该一级指标在各个风险分类下的概率密度函数值,将所述各个风险分类聚合成正常类、关注类和不良类这三个聚类;计算所述一级指标在不良类下的概率密度函数值与该一级指标在所有聚类下的概率密度函数值之和的比值,并将所述比值作为所述一级指标的信贷风险影响值。

进一步,在步骤S304之前,本发明实施例的方法还可包括:预先基于风险分类标签将训练用信贷客户样本数据拆分为多个子样本组,比如,假设训练用信贷客户样本数据的风险分类标签共有12级,则可按照风险分类标签将样本数据拆分为12个子样本组;基于训练用信贷客户样本数据,计算出各个风险分类下每个一级指标的期望和标准差,从而确定出各个风险分类下一级指标的分布。进而,在步骤S303中,可基于各个风险分类下一级指标的分布计算该一级指标在各个风险分类下的概率密度函数值。

步骤S305:对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值。

示例性地,步骤S305具体包括:按照各个一级指标的权重系数,对隶属于同一二级指标的一级指标的信贷风险影响值进行加权求和,以得到所述二级指标的信贷风险影响值。

在一个可选实施方式中,所述各个一级指标的权重系数可根据如下方式确定:对于每个一级指标,计算基础数据表中该一级指标在统计周期内的全部取值为非空的用户数与总用户数的比值,并将该比值(即指标有效客户占比)作为所述一级指标的权重系数。例如,假设对于“员工数量”这个一级指标来说,基础数据表中该一级指标在统计周期内的全部取值为非空的用户数为900,基础数据表中共有1000个用户的信贷数据,则可将两者的比值0.9作为该一级指标的权重。在另一个可选实施方式中,在计算出各个一级指标的指标有效客户占比之后,对一级指标的指标有效客户占比进行归一化处理,并将归一化处理结果作为一级指标的权重系数。此外,在具体实施时,还可由用户根据经验设置各个一级指标的权重系数。

步骤S306:根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值。

示例性地,步骤S306具体包括:将所述用户各个二级指标的信贷风险影响值代入信贷风险评估函数,以得到所述用户的信贷风险评估值。

其中,所述信贷风险评估函数是通过对多元线性回归模型进行训练得到的。具体实施时,可用训练样本中客户的当前风险分类作为因变量,通过多元线性回归的方法对各个二级指标进行拟合,并对拟合效果进行统计检验,以确定多元线性回归模型中的最优参数,从而得到信贷风险评估函数。

步骤S307:对所述用户的信贷风险评估值进行展示。

在通过步骤S306得到用户的信贷风险评估值之后,可对用户的信贷风险评估值进行展示,以便于相关人员及时了解该用户是否存在信贷风险。

可选地,在通过步骤S306得到用户的信贷风险评估值之后,还可根据所述用户的信贷风险评估值判断是否需要对所述用户进行预警,并在判断结果为是的情况下触发相应的预警操作。具体实施时,可针对信贷风险设置多级预警机制,比如,当用户的信贷风险评估值位于第一取值区间时,不触发预警操作;当用户的信贷风险评估值位于第二取值区间时,触发一级预警操作;当用户的信贷风险评估值位于第三取值区间时,触发二级预警操作。其中,所述预警操作可以为向相关人员对应的终端发送针对该用户的信贷风险提示信息,降低该用户的信用等级,或者其他预警操作。

在本发明实施例中,通过对基础指标数据进行归一化处理,能够得到便于后续处理的标准数据,有助于提高后续信贷风险评估的处理效率和准确率;通过对基础指标数据进行正态化处理,使得处理后的数据质量得到改善,解决了信贷用户数据由于尖峰厚尾分布难以在观测指标和信贷风险概率之间建立联系的问题,明显提高了观测指标对风险概率的预测能力;通过基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值,对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合以得到所述用户各个二级指标的信贷风险影响值,根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值,能够提高信贷风险评估工作的效率和信贷风险评估结果的准确率,进而有助于相关机构及时、有效地发现隐藏的信贷风险客户,提前预警以化解信贷风险。

图4是根据本发明第三实施例的信贷风险预警装置的主要模块示意图。如图4所示,本发明实施例的信贷风险预警装置400包括:获取模块401、确定模块402、聚合模块403、评估模块404。

获取模块401,用于获取用户的基础指标数据。

示例性地,获取模块401可通过一种或多种方式获取用户的基础指标数据。例如,考虑到获取数据的渠道比较广泛,基础数据表结构也不尽相同,因此,获取模块401可接收相关人员自定义上传的用户基础指标数据;或者通过接口方式从数据库服务器等数据源中获取用户的基础指标数据等等。

其中,所述用户的基础指标数据除了包括多个用于信贷风险评估的一级指标之外,还可包括诸如用户编号等用户基本信息。示例性地,所述用于信贷风险评估的一级指标包括但不限于:员工数量、总交易金额、总贷方发生额、总借方发生额、薪酬支出金额、电费支出金额、总销售收入金额、采购支出客户数、销售收入客户数等。具体实施时,用户的基础指标数据中每个一级指标可具有多个不同时段下的指标值。例如,对于员工数量这个一级指标,其取值可包括1月份的员工数量、2月份的员工数量、3月份的员工数量。

确定模块402,用于基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值。

贝叶斯分类器原理,是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率。在本发明中,在贝叶斯分类器原理的基础上观察特征,通过似然函数建立观察指标与信贷风险之间的联系。

示例性地,确定模块402基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值具体包括:对于所述用户的每个一级指标,确定模块402计算该一级指标在各个风险分类下的概率密度函数值,确定模块402根据所述一级指标在各个风险分类下的概率密度函数值计算所述一级指标的信贷风险影响值。

在一个可选实施方式中,确定模块402根据所述一级指标在各个风险分类下的概率密度函数值计算所述一级指标的信贷风险影响值包括:确定模块402将所述各个风险分类聚合成正常类、关注类和不良类这三个聚类;确定模块402计算所述一级指标在不良类下的概率密度函数值与该一级指标在所有聚类下的概率密度函数值之和的比值,并将所述比值作为所述一级指标的信贷风险影响值。

例如,假设共设置了12级风险分类,对于用户的每个一级指标,可计算该一级指标在各级风险分类下的概率密度函数值,然后将12级风险分类聚合成正常类、关注类和不良类这三个聚类,并通过对概率密度函数值进行累加得到各个聚类的概率密度函数值,再根据如下公式计算所述一级指标的信贷风险影响值:

其中,Y表示一级指标的信贷风险影响值,P

具体来说,在上述可选实施方式中,确定模块402可基于各个风险分类下一级指标的分布计算该一级指标在各个风险分类下的概率密度函数值。其中,各个风险分类下一级指标的分布可根据如下方式确定:预先基于风险分类标签将训练用信贷客户样本数据拆分为多个子样本组,比如,假设训练用信贷客户样本数据的风险分类标签共有12级,则可按照风险分类标签将样本数据拆分为12个子样本组;基于训练用信贷客户样本数据,计算出各个风险分类下每个一级指标的期望和标准差,从而确定出各个风险分类下一级指标的分布。

聚合模块403,用于对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值。

用户的基础指标数据包括多个一级指标,这些一级指标又可被进一步归类至多个二级指标之下。在一个可选示例中,用户的基础指标数据包括16个一级指标,这些一级指标又可被进一步归类至“经营活动规模、经营稳定性、业务成长性、短期偿债能力、市场拓展能力”这五个二级指标之下。比如,“员工数量”、“总交易金额”等7个一级指标隶属于“经营活动规模”这个二级指标,“总销售收入金额”等2个一级指标隶属于“业务成长性”这个二级指标。

示例性地,聚合模块403对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合包括:聚合模块403可按照各个一级指标的权重系数,对隶属于同一二级指标的一级指标的信贷风险影响值进行加权求和,以得到所述二级指标的信贷风险影响值。

在一个可选实施方式中,各个一级指标的权重系数可根据如下方式确定:对于每个一级指标,计算基础数据表中该一级指标在统计周期内的全部取值为非空的用户数与总用户数的比值,并将该比值(即指标有效客户占比)作为所述一级指标的权重系数。例如,假设对于“员工数量”这个一级指标来说,基础数据表中该一级指标在统计周期内的全部取值为非空的用户数为900,基础数据表中共有1000个用户的信贷数据,则可将两者的比值0.9作为该一级指标的权重。在另一个可选实施方式中,在计算出各个一级指标的指标有效客户占比之后,对一级指标的指标有效客户占比进行归一化处理,并将归一化处理结果作为一级指标的权重系数。此外,在具体实施时,还可由用户根据经验设置各个一级指标的权重系数。

评估模块404,用于根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值。

示例性地,评估模块404根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值包括:评估模块404将所述用户各个二级指标的信贷风险影响值代入信贷风险评估函数,以得到所述用户的信贷风险评估值。其中,所述信贷风险评估函数是通过对多元线性回归模型进行训练得到的。

在本发明实施例的装置中,通过获取模块获取用户的基础指标数据,通过确定模块基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值,通过聚合模块对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合以得到所述用户各个二级指标的信贷风险影响值,通过评估模块根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值,能够提高信贷风险评估工作的效率和信贷风险评估结果的准确率,进而有助于相关机构及时、有效地发现信贷风险客户,提前预警以化解信贷风险。

图5是根据本发明第四实施例的信贷风险预警装置的主要模块示意图。如图5所示,本发明实施例的信贷风险预警装置500包括:获取模块501、清洗模块502、确定模块503、聚合模块504、评估模块505、结果预览模块506。

获取模块501,用于获取用户的基础指标数据。

其中,所述用户的基础指标数据除了包括多个用于信贷风险评估的一级指标之外,还可包括诸如用户编号等用户基本信息。示例性地,所述用于信贷风险评估的一级指标包括但不限于:员工数量、总交易金额、总贷方发生额、总借方发生额、薪酬支出金额、电费支出金额、总销售收入金额、采购支出客户数、销售收入客户数等。具体实施时,用户的基础指标数据中每个一级指标可具有多个不同时段下的指标值。例如,对于员工数量这个一级指标,其取值可包括1月份的员工数量、2月份的员工数量、3月份的员工数量。

清洗模块502,用于对用户的基础指标数据进行归一化处理。

示例性地,清洗模块502可按照一级指标的分析统计量类型进行相应的归一化处理。

具体来说,对于分析统计量类型为绝对斜率的一级指标,清洗模块502可根据如下公式对所述用户的一级指标进行归一化处理:

其中,k′表示所述用户归一化后的一级指标值,k

对于分析统计量类型为离散系数的一级指标,清洗模块502可根据如下公式对所述用户的一级指标进行归一化处理:

其中,V′表示所述用户归一化后的一级指标值,V表示所述用户的一级指标的离散系数,V

在本发明实施例中,通过清洗模块502对用户的基础指标数据进行归一化处理,能够将各个一级指标的原始采样数据转换为位于0到1之间的修正数据,从而便于后续进行风险评估。

清洗模块502,还用于对用户的基础指标数据进行正态化处理。

本发明的发明人发现,用户的基础指标数据大多满足尖峰厚尾分布,该分布符合大多数金融数据特点。若直接基于用户的基础指标数据进行后续处理,则存在线性和方差齐性不足的问题,很难在观测指标与风险概率之间建立联系,影响信贷风险评估结果的准确性。鉴于此,在本发明中,清洗模块502对用户的基础指标数据进行了正态化处理。

在本发明中,通过清洗模块502对用户的基础指标数据进行了正态化处理,使得处理后的数据呈正态化分布,大大改善了指标数据的质量,提高了观测指标对信贷风险的预测能力。

在一个可选示例中,清洗模块502可根据如下预先构建的正态化处理函数对所述用户的一级指标进行正态化处理;

其中,x′表示正态化处理后的一级指标值,x表示正态化处理之前的一级指标值,a为常数。

在本发明实施例中,上述正态化处理函数是经过长期实践确定的,通过上述正态化处理函数对用户的一级指标进行正态化处理,能够明显改善数据质量,显著提高观测指标对信贷风险的预测能力。

在另一个可选示例中,清洗模块502可根据BOX-COX方法对用户的基础指标数据进行正态化处理。BOX-COX方法,是统计建模中常用的一种数据变换,用于连续的响应变量不满足正态分布的情况,通过BOX-COX变换可以明显地改善数据的正态性分布情况,提高观测指标对信贷风险的预测能力。

确定模块503,用于基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值。

示例性地,确定模块503基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值具体包括:对于所述用户的每个一级指标,确定模块503计算该一级指标在各个风险分类下的概率密度函数值,确定模块503将所述各个风险分类聚合成正常类、关注类和不良类这三个聚类;确定模块503计算所述一级指标在不良类下的概率密度函数值与该一级指标在所有聚类下的概率密度函数值之和的比值,并将所述比值作为所述一级指标的信贷风险影响值。

例如,假设共设置了12级风险分类,对于用户的每个一级指标,确定模块503可计算该一级指标在各级风险分类下的概率密度函数值,然后将12级风险分类聚合成正常类、关注类和不良类这三个聚类,并通过对概率密度函数值进行累加得到各个聚类的概率密度函数值,再根据如下公式计算所述一级指标的信贷风险影响值:

其中,Y表示一级指标的信贷风险影响值,P

具体来说,在上述可选实施方式中,确定模块503可基于各个风险分类下一级指标的分布计算该一级指标在各个风险分类下的概率密度函数值。其中,各个风险分类下一级指标的分布可根据如下方式确定:预先基于风险分类标签将训练用信贷客户样本数据拆分为多个子样本组,比如,假设训练用信贷客户样本数据的风险分类标签共有12级,则可按照风险分类标签将样本数据拆分为12个子样本组;基于训练用信贷客户样本数据,计算出各个风险分类下每个一级指标的期望和标准差,从而确定出各个风险分类下一级指标的分布。

聚合模块504,用于对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值。

示例性地,聚合模块504对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合具体包括:聚合模块504按照各个一级指标的权重系数,对隶属于同一二级指标的一级指标的信贷风险影响值进行加权求和,以得到所述二级指标的信贷风险影响值。

在一个可选实施方式中,所述各个一级指标的权重系数可根据如下方式确定:对于每个一级指标,计算基础数据表中该一级指标在统计周期内的全部取值为非空的用户数与总用户数的比值,并将该比值(即指标有效客户占比)作为所述一级指标的权重系数。例如,假设对于“员工数量”这个一级指标来说,基础数据表中该一级指标在统计周期内的全部取值为非空的用户数为900,基础数据表中共有1000

评估模块505,用于根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值。

示例性地,评估模块505根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值具体包括:将所述用户各个二级指标的信贷风险影响值代入信贷风险评估函数,以得到所述用户的信贷风险评估值。其中,所述信贷风险评估函数是通过对多元线性回归模型进行训练得到的。具体实施时,可用训练样本中客户的当前风险分类作为因变量,通过多元线性回归的方法对各个二级指标进行拟合,并对拟合效果进行统计检验,以确定多元线性回归模型中的最优参数,从而得到信贷风险评估函数。

结果预览模块506,用于对所述用户的信贷风险评估值进行展示。

在得到用户的信贷风险评估值之后,可通过结果预览模块506对用户的信贷风险评估值进行展示,以便于相关人员及时了解该用户是否存在信贷风险。

在本发明实施例中,通过清洗模块对基础指标数据进行归一化处理,能够得到便于后续处理的标准数据,有助于提高后续信贷风险评估的处理效率和准确率;通过清洗模块对基础指标数据进行正态化处理,使得处理后的数据质量得到改善,解决了信贷用户数据由于尖峰厚尾分布难以在观测指标和信贷风险概率之间建立联系的问题,明显提高了观测指标对风险概率的预测能力;通过确定模块基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值,通过聚合模块对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合以得到所述用户各个二级指标的信贷风险影响值,通过评估模块根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值,能够提高信贷风险评估工作的效率和信贷风险评估结果的准确率,进而有助于相关机构及时、有效地发现隐藏的信贷风险客户,提前预警以化解信贷风险。

下面参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的计算机系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、确定模块、聚合模块和评估模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取用户的基础指标数据的模块”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行以下流程:获取用户的基础指标数据;所述用户的基础指标数据包括多个用于信贷风险评估的一级指标;基于贝叶斯分类器原理确定所述用户各个一级指标的信贷风险影响值;对隶属于同一二级指标的一级指标的信贷风险影响值进行聚合,以得到所述用户各个二级指标的信贷风险影响值;根据所述用户各个二级指标的信贷风险影响值确定所述用户的信贷风险评估值。

根据本发明实施例的技术方案,能够提高信贷风险评估工作的效率和信贷风险评估结果的准确率,进而有助于相关机构及时、有效地发现信贷风险客户,提前预警以化解信贷风险。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

相关技术
  • 信贷风险预警方法和装置
  • 一种基于图规则引擎的信贷风险预警方法、系统及存储介质
技术分类

06120112984459