掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度学习的个人信用征信模型及方法

文献发布时间:2024-04-18 19:58:26


一种基于深度学习的个人信用征信模型及方法

技术领域

本发明涉及个人信用征信技术领域,具体为一种基于深度学习的个人信用征信模型及方法。

背景技术

个人信用评估是指对个人的信用状况进行评估和分析,以便于金融机构、企业等在与该个人进行交易时能够更好地了解其信用风险和还款能力。目前,个人信用评估已经成为金融行业的重要领域之一,在贷款、信用卡、租房、就业等方面都有着广泛的应用。

在申请公布号为CN104103010A的中国发明申请中,公开了一种基于个人信用报告生成信用风险指数的方法,将单一信贷产品的逾期还款记录分为不同等级后转化为一个马尔科夫链数学模型并计算其转移状态矩阵,通过转移状态矩阵的回溯运算得到期末单一信贷产品的逾期等级指数的数学期望,根据借贷人的资产配比得到该借款人的综合风险指数。

在以上发明申请中,克服了以往单一考虑信用违约的做法,最大限度的利用了信用记录中的还款信息,构建了一个体现信用风险的综合指数。但在实际应用中仅仅只考虑信用记录是不全面的,还需考虑个人资产收入等,并且随着经济的发展,例如在发生通货膨胀和通货紧缩时,相同数据的信用评估划分可能会发生变化。

为此,提供了一种基于深度学习的个人信用征信模型及方法。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种基于深度学习的个人信用征信模型及方法,本发明在基于深度学习构建了一个标准个人信用征信模型,综合考虑贷款情况和个人资产情况,更加全面客观地评估个人信用状况,并且实时对模型进行误差分析检验,依据样本和实时新增数据对模型进行实时校验,可以及时调整和改进模型参数及算法等因素,促进信用体系的建设。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:一种基于深度学习的个人信用征信方法,包括如下步骤:

通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额

将每个贷款或信用卡的透支金额

将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De;

使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级;

获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差

进一步的,通过银行和消费金融机构收集个人信用相关数据,包括个人信息、贷款记录及信用卡记录,并对收集到的原始数据进行清洗、去重及缺失值填充的预处理操作,以确保数据质量和完整性。

进一步的,将每个贷款或信用卡的透支金额

其中,i表示每个贷款或信用卡的顺序编号,i=1、2、3、4、…、n,n为正整数。

进一步的,获取每个贷款或信用卡的透支金额

其中,

进一步的,获取每个贷款或信用卡的信用分数

对应的第一信用评价指数Dy的关联公式如上。

进一步的,获取年龄Nl,月收入Sr,存款Ck及名下资产Zc,关联形成第二信用评价指数De,关联公式如下:

其中,参数意义为:年龄影响因子

进一步的,使用深度学习算法构建初步个人信用征信模型,将第一信用评价指数

进一步的,使用标准个人信用征信模型对需要进行信用评估的相关数据进行评估,确定对应的信用等级并输出,其中信用等级划分具体为:

当Zh≤第二阈值<第一阈值时,表示个人信用记录较差,还款能力较差;

当第二阈值<Zh≤第一阈值时,表示个人信用记录良好,还款能力一般;

当第二阈值<第一阈值时<Zh时,表示个人信用记录优秀,还款能力强。

进一步的,获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,将所有的综合信用评价指标进行顺序编号,记为

实际综合信用评价指标的方差

其中,y=1、2、3、4、……、s,s为正整数,且

进一步的,将样本方差

当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。

一种基于深度学习的个人信用征信模型,包括:

数据采集模块,通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额

第一数据分析模块,将每个贷款或信用卡的透支金额

第二数据分析模块,将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De;

综合评估模块,使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级;

误差分析模块,获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差

(三)有益效果

本发明提供了一种基于深度学习的个人信用征信模型及方法,具备以下有益效果:

1、通过对收集到的原始数据进行预处理操作和特征提取,可以减少无关信息的干扰,提取出与问题相关的有效信息。有助于将不同领域、不同类型、不同来源的数据进行比较、融合和交叉验证等操作,从而实现跨领域、跨平台、跨任务等通用性应用。

2、通过综合考虑贷款情况和个人资产情况,构建个人信用的深度学习模型,可以更加全面客观地评估个人信用状况,可以避免因单一指标不足而导致的评估偏差,提高信用评估的准确性和公正性。

3、通过对标准个人信用征信模型进行误差分析,可以根据误差情况及时调整和改进模型参数及算法等因素,促进信用体系的建设,提高预测能力,为金融机构和客户之间建立起更加稳定、可靠的信任关系。

附图说明

图1为本发明一种基于深度学习的个人信用征信方法的流程示意图;

图2为本发明一种基于深度学习的个人信用征信模型的结构示意图;

图中:10、数据采集模块;20、第一数据分析模块;30、第二数据分析模块;40、综合评估模块;50、误差分析模块。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供一种基于深度学习的个人信用征信方法,包括如下步骤:

步骤一、通过银行和消费金融机构收集个人信用相关数据,使用自编码器对贷款记录和信用卡记录进行特征提取和转换,获得每个贷款或信用卡的透支金额

所述步骤一包括如下内容:

步骤101、通过银行和消费金融机构收集个人信用相关数据,包括个人信息、贷款记录及信用卡记录,并对收集到的原始数据进行清洗、去重及缺失值填充的预处理操作,以确保数据质量和完整性。

步骤102、使用自编码器对清洗后的贷款记录和信用卡记录进行特征提取和转换,获得每个贷款或信用卡的透支金额

其中,i表示每个贷款或信用卡的顺序编号,i=1、2、3、4、…、n,n为正整数。

使用时,结合步骤101及102中的内容:

通过对收集到的原始数据进行预处理操作和特征提取,可以减少无关信息的干扰,提取出与问题相关的有效信息。有助于将不同领域、不同类型、不同来源的数据进行比较、融合和交叉验证等操作,从而实现跨领域、跨平台、跨任务等通用性应用。

步骤二、将每个贷款或信用卡的透支金额

所述步骤二包括如下内容:

步骤201、将每个贷款或信用卡的透支金额

对应的每个贷款或信用卡的信用分数

步骤202、获取每个贷款或信用卡的透支金额

其中,

步骤203、获取每个贷款或信用卡的信用分数

对应的第一信用评价指数Dy的关联公式如上。

使用时,结合步骤201至203中的内容:

通过对个人信用卡和贷款的相关数据进行计算获得第一信用评价指数Dy,对个人信用卡和贷款使用情况进行评估,可以识别出潜在的风险客户,预测他们可能发生违约的概率,并采取相应的风险控制措施,如限制额度、提高利率、调整还款方式等,从而降低贷款违约率和损失。

步骤三、对清洗后的个人信息数据进行特征提取和转换,获得年龄Nl,月收入Sr,存款Ck及名下资产Zc,并进一步关联形成第二信用评价指数De。

所述步骤三包括如下内容:

步骤301、使用自编码器对清洗后的个人信息数据进行特征提取和转换,获得年龄Nl,月收入Sr,存款Ck及名下资产Zc。

步骤302、获取年龄Nl,月收入Sr,存款Ck及名下资产Zc,关联形成第二信用评价指数De,关联公式如下:

其中,参数意义为:年龄影响因子

使用时,结合步骤301及302中的内容:

通过对个人资产、收入情况进行评估,可以了解个人的风险承受能力,从而更好地为其提供相应的金融产品和服务,并且可以制定出合理的信贷方案,避免过度借贷和不良贷款,也能够根据客户经济状况选择适合其的还款方式和期限。

步骤四、使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级。

所述步骤四包括如下内容:

步骤401、使用深度学习算法构建初步个人信用征信模型,将第一信用评价指数

根据中心极限定理,当样本容量足够大时,随机变量的分布将近似为正态分布,故将综合信用评价指标

步骤402、使用标准个人信用征信模型对需要进行信用评估的相关数据进行评估,确定对应的信用等级并输出,其中信用等级划分具体为:

当Zh≤第二阈值<第一阈值时,表示个人信用记录较差,还款能力较差,在过去一段时间内有多次逾期或欠款记录,对应地,向外输出信用差的个人信用报告,不建议再次提供贷款或银行卡服务,并且需要提供更多的担保或抵押物。

当第二阈值<Zh≤第一阈值时,表示个人信用记录良好,还款能力一般,在过去一段时间内有少量逾期或欠款记录,对应地,向外输出信用一般的个人信用报告,建议在贷款方面需要提供更多担保材料,并且在审批过程中需要进行更为严格的审核。

当第二阈值<第一阈值时<Zh时,表示个人信用记录优秀,还款能力强,无逾期或欠款记录,对应地,向外输出信用优秀的个人信用报告,建议提高其贷款和信用卡的额度,并给予更低的贷款利率或信用卡利率。

使用时,结合步骤401及402中的内容:

通过综合考虑贷款情况和个人资产情况,构建个人信用的深度学习模型,可以更加全面客观地评估个人信用状况,可以避免因单一指标不足而导致的评估偏差,提高信用评估的准确性和公正性。

步骤五、获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差

所述步骤五包括如下内容:

步骤501、获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,将所有的综合信用评价指标进行顺序编号,记为

其中,y=1、2、3、4、……、s,s为正整数,且

步骤502、依据所有的综合信用评价指标

对应的实际综合信用评价指标的方差

步骤503、将样本方差

当个人信用征信模型的误差Wc超出预设阈值时,向外发出预警信号。

使用时,结合步骤501至503中的内容:

通过对标准个人信用征信模型进行误差分析,可以根据误差情况调整和改进模型参数及算法等因素,促进信用体系的建设,提高预测能力,为金融机构和客户之间建立起更加稳定、可靠的信任关系。

请参阅图2,本发明提供一种基于深度学习的个人信用征信模型,包括:

数据采集模块10,通过银行和消费金融机构收集个人信用相关数据,使用自编码器对数据进行特征提取和转换,获得每个贷款或信用卡的透支金额

第一数据分析模块20,将每个贷款或信用卡的透支金额

第二数据分析模块30,将年龄Nl,月收入Sr,存款Ck及名下资产Zc进一步关联形成第二信用评价指数De。

综合评估模块40,使用深度学习算法构建初步个人信用征信模型,在经过样本数据训练及测试后,获得标准个人信用征信模型,并使用标准个人信用征信模型对需要进行信用评估的相关数据进行分析,确定对应的信用等级。

误差分析模块50,获取标准个人信用征信模型样本中所有的综合信用评价指标和实时计算新增的综合信用评价指标,计算分析后获得实际综合信用评价指标的方差

上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于爬虫和模型评分的征信报告生成方法及系统
  • 一种基于大数据模型的电力征信评估方法
技术分类

06120116491136