掌桥专利:专业的专利平台
掌桥专利
首页

一种基于集成学习的互联网金融风控预测系统和方法

文献发布时间:2024-04-18 19:58:30


一种基于集成学习的互联网金融风控预测系统和方法

技术领域

本发明涉及互联网金融风控预测系统技术领域,尤其涉及一种基于集成学习的互联网金融风控预测系统和方法。

背景技术

随着互联网金融的快速发展,各种金融创新和风险管理问题也随之而来。其中,风控问题是互联网金融领域中最为重要的问题之一。传统的风控方法主要依赖于人工经验和规则制定,存在一定的局限性和不足之处。因此,开发一种高效、准确、可靠的互联网金融风控预测系统和方法具有重要意义。

经检索,中国专利申请号为CN201621131142.2的专利,公开了互联网金融交易信息处理系统,包括用户端,所述用户端与连接模块双向电连接,所述连接模块与信息传输模块双向电连接,所述信息传输模块的输入端与加密模块的输出端相连,所述信息传输模块与应用防火墙双向电连接,本互联网金融交易信息处理系统通过连接模块和信息传输模块使用户端和处理模块进行信息交互。上述专利中的交易信息处理系统存在以下不足:其虽然能够一定程度的防止木马等病毒,但是对于风险的预测和分析能力还有所不足,还有待改进。

发明内容

本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于集成学习的互联网金融风控预测系统和方法。

为了实现上述目的,本发明采用了如下技术方案:

一种基于集成学习的互联网金融风控预测系统,包括:

信息采集模块,信息采集模块用于采集金融信息;

信息分析模块,信息分析模块用于分析采集到的金融信息,并提取出其中的风险特征;

风控信息库模块,风控信息库模块中按类存储各风险特征,并针对各风险特征赋有相应的权重值;

风控分类模块,风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

匹配模块,匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

风控计算模块,风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

风控管理模块,风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

展示模块,展示模块用于展示计算结果和风控管理方案。

优选的:所述互联网金融风控预测系统的预测管理方法,具体包括如下步骤:

S1:信息采集模块采集金融信息;

S2:信息分析模块对采集到的金融信息进行分析,并提取出其中的风险特征;

S3:风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

S4:匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

S5:风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

S6:风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

S7:展示模块展示计算结果和风控管理方案。

优选的:所述互联网金融风控预测系统还包括:

模型训练模块,模型训练模块使用机器学习算法或深度学习算法对提取出的特征进行训练,以构建预测模型。

优选的:所述数据采集模块包括:

信息收集单元,信息收集单元负责从互联网金融平台、第三方数据源等渠道收集与风险评估相关的信息;

信息过滤单元,信息过滤单元负责对收集到的信息进行去重、筛选和过滤,以提高数据的准确性和可用性;

数据标准化单元,数据标准化单元负责对数据进行标准化处理,以消除不同数据源之间的差异性,提高模型的稳定性和可靠性;

数据整合单元,数据整合单元负责将数据整合到一个统一的数据仓库中,以便后续分析和建模。

优选的:所述模型训练模块包括:

特征选择单元,特征选择单元根据业务需求和特征属性选择合适的特征子集,以提高模型的预测性能;

模型训练单元,模型训练单元使用机器学习算法或深度学习算法对提取出的特征进行训练,以构建预测模型;

模型评估单元,模型评估单元对训练出的模型进行评估,包括精度、召回率、F1值指标的计算和比较,以确定模型的优劣性和适用性。

优选的:所述模型评估单元中,评估准确率采用如下公式进行:

其中,TP表示真正例,即分类器正确预测为正类的样本数;TN表示真反例,即分类器正确预测为负类的样本数;FP表示假正例,即分类器错误地将正类预测为负类的样本数;FN表示假反例,即分类器错误地将负类预测为正类的样本数。

优选的:所述模型评估单元中,召回率指标采用如下公式进行:

所述模型评估单元中,F1值指标采用如下公式进行:

其中,Precision表示精度,即分类器正确预测为正类的样本数占实际正类样本数的比例;Recall表示召回率。

优选的:所述模型训练模块使用深度学习算法来训练分类器,具体使用反向传播算法来计算梯度,并更新权重矩阵W,其中,具体采用多层感知机作为分类器,其损失函数采用如下公式表示:

其中,

S11:初始化权重矩阵W为随机值;

S12:于每个样本i,计算出其预测为正类的概率

S13:根据

S14:计算出梯度

S15:重复以上步骤,直到满足停止条件为止。

优选的:所述风控计算模块包括:

信用评分计算单元,信用评分计算单元负责根据用户的个人信息、交易记录、行为习惯等因素计算用户信用评分;

违约概率计算单元,违约概率计算单元负责根据用户的信用评分和历史违约记录等因素计算用户违约的概率。

优选的:所述风控管理模块包括:

限制交易额度单元,限制交易额度单元根据用户的信用评分和历史违约记录等因素,限制用户的交易额度,以降低风险;

提高贷款利率单元,提高贷款利率单元根据用户的信用评分和历史违约记录等因素,提高用户的贷款利率,以增加收益;

身份验证单元,身份验证单元采用多种手段对客户身份进行验证,以减少欺诈行为的发生。

本发明的有益效果为:

1.本发明基于集成学习的方法,可以利用多种不同的模型来分析金融数据,从而提高预测的准确性和可靠性;同时,该系统可以自动根据不同风险特征进行分类,减轻了人工干预的负担;此外,该系统还可以为金融机构提供有效的风控管理方案,以更好地控制风险。

2.本发明可以帮助金融机构更好地识别和管理风险,提高其风险管理能力;通过有效控制风险,以促进互联网金融行业的健康发展,保护投资者的利益;通过有效的风控管理方案,为投资者提供更加安全的投资环境,降低投资风险。

附图说明

图1为本发明提出的一种基于集成学习的互联网金融风控预测系统的预测管理方法的流程图。

具体实施方式

下面结合具体实施方式对本专利的技术方案作进一步详细地说明。

实施例1:

一种基于集成学习的互联网金融风控预测系统,包括:

信息采集模块,信息采集模块用于采集金融信息;

信息分析模块,信息分析模块用于分析采集到的金融信息,并提取出其中的风险特征;

风控信息库模块,风控信息库模块中按类存储各风险特征,并针对各风险特征赋有相应的权重值;

风控分类模块,风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

匹配模块,匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

风控计算模块,风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

风控管理模块,风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

展示模块,展示模块用于展示计算结果和风控管理方案。

其中,所述互联网金融风控预测系统的预测管理方法,具体包括如下步骤:

S1:信息采集模块采集金融信息;

S2:信息分析模块对采集到的金融信息进行分析,并提取出其中的风险特征;

S3:风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

S4:匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

S5:风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

S6:风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

S7:展示模块展示计算结果和风控管理方案。

其中,所述数据采集模块包括:

信息收集单元,信息收集单元负责从互联网金融平台、第三方数据源等渠道收集与风险评估相关的信息;

信息过滤单元,信息过滤单元负责对收集到的信息进行去重、筛选和过滤,以提高数据的准确性和可用性;

数据标准化单元,数据标准化单元负责对数据进行标准化处理,以消除不同数据源之间的差异性,提高模型的稳定性和可靠性;

数据整合单元,数据整合单元负责将数据整合到一个统一的数据仓库中,以便后续分析和建模。

其中,所述风控计算模块包括:

信用评分计算单元,信用评分计算单元负责根据用户的个人信息、交易记录、行为习惯等因素计算用户信用评分;

违约概率计算单元,违约概率计算单元负责根据用户的信用评分和历史违约记录等因素计算用户违约的概率。

其中,所述风控管理模块包括:

限制交易额度单元,限制交易额度单元根据用户的信用评分和历史违约记录等因素,限制用户的交易额度,以降低风险;

提高贷款利率单元,提高贷款利率单元根据用户的信用评分和历史违约记录等因素,提高用户的贷款利率,以增加收益;

身份验证单元,身份验证单元采用多种手段对客户身份进行验证,以减少欺诈行为的发生。

实施例2:

一种基于集成学习的互联网金融风控预测系统和方法,包括:

信息采集模块,信息采集模块用于采集金融信息;

信息分析模块,信息分析模块用于分析采集到的金融信息,并提取出其中的风险特征;

风控信息库模块,风控信息库模块中按类存储各风险特征,并针对各风险特征赋有相应的权重值;

风控分类模块,风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

匹配模块,匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

模型训练模块,模型训练模块使用机器学习算法或深度学习算法对提取出的特征进行训练,以构建预测模型;

风控计算模块,风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

风控管理模块,风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

展示模块,展示模块用于展示计算结果和风控管理方案。

其中,所述互联网金融风控预测系统的预测管理方法,具体包括如下步骤:

S1:信息采集模块采集金融信息;

S2:信息分析模块对采集到的金融信息进行分析,并提取出其中的风险特征;

S3:风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

S4:匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

S5:风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

S6:风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

S7:展示模块展示计算结果和风控管理方案。

其中,所述数据采集模块包括:

信息收集单元,信息收集单元负责从互联网金融平台、第三方数据源等渠道收集与风险评估相关的信息;

信息过滤单元,信息过滤单元负责对收集到的信息进行去重、筛选和过滤,以提高数据的准确性和可用性;

数据标准化单元,数据标准化单元负责对数据进行标准化处理,以消除不同数据源之间的差异性,提高模型的稳定性和可靠性;

数据整合单元,数据整合单元负责将数据整合到一个统一的数据仓库中,以便后续分析和建模。

其中,所述模型训练模块包括:

特征选择单元,特征选择单元根据业务需求和特征属性选择合适的特征子集,以提高模型的预测性能;

模型训练单元,模型训练单元使用机器学习算法或深度学习算法对提取出的特征进行训练,以构建预测模型;

模型评估单元,模型评估单元对训练出的模型进行评估,包括精度、召回率、F1值等指标的计算和比较,以确定模型的优劣性和适用性。

所述模型评估单元中,评估准确率采用如下公式进行:

其中,TP表示真正例,即分类器正确预测为正类的样本数;TN表示真反例,即分类器正确预测为负类的样本数;FP表示假正例,即分类器错误地将正类预测为负类的样本数;FN表示假反例,即分类器错误地将负类预测为正类的样本数。

所述模型评估单元中,召回率指标采用如下公式进行:

所述模型评估单元中,F1值指标采用如下公式进行:

其中,Precision表示精度,即分类器正确预测为正类的样本数占实际正类样本数的比例;Recall表示召回率。

其中,所述风控计算模块包括:

信用评分计算单元,信用评分计算单元负责根据用户的个人信息、交易记录、行为习惯等因素计算用户信用评分;

违约概率计算单元,违约概率计算单元负责根据用户的信用评分和历史违约记录等因素计算用户违约的概率。

其中,所述风控管理模块包括:

限制交易额度单元,限制交易额度单元根据用户的信用评分和历史违约记录等因素,限制用户的交易额度,以降低风险;

提高贷款利率单元,提高贷款利率单元根据用户的信用评分和历史违约记录等因素,提高用户的贷款利率,以增加收益;

身份验证单元,身份验证单元采用多种手段对客户身份进行验证,以减少欺诈行为的发生。

实施例3:

一种基于集成学习的互联网金融风控预测系统和方法,包括:

信息采集模块,信息采集模块用于采集金融信息;

信息分析模块,信息分析模块用于分析采集到的金融信息,并提取出其中的风险特征;

风控信息库模块,风控信息库模块中按类存储各风险特征,并针对各风险特征赋有相应的权重值;

风控分类模块,风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

匹配模块,匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

模型训练模块,模型训练模块使用机器学习算法或深度学习算法对提取出的特征进行训练,以构建预测模型;

风控计算模块,风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

风控管理模块,风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

展示模块,展示模块用于展示计算结果和风控管理方案。

其中,所述互联网金融风控预测系统的预测管理方法,具体包括如下步骤:

S1:信息采集模块采集金融信息;

S2:信息分析模块对采集到的金融信息进行分析,并提取出其中的风险特征;

S3:风控分类模块根据信息分析模块分析出的风险特征进行分类,赋予一个类别代码;

S4:匹配模块根据类别代码,将风险特征在风控信息库模块中进行匹配,获取相应的权重值;

S5:风控计算模块根据权重值计算风险值,并根据设定的阈值得出计算结果;

S6:风控管理模块根据风控计算模块的计算结果,生成风控管理方案;

S7:展示模块展示计算结果和风控管理方案。

其中,所述模型训练模块使用深度学习算法来训练分类器,具体使用反向传播算法来计算梯度,并更新权重矩阵W,其中,具体采用多层感知机作为分类器,其损失函数采用如下公式表示:

其中,

S11:初始化权重矩阵W为随机值;

S12:于每个样本i,计算出其预测为正类的概率

S13:根据

S14:计算出梯度

S15:重复以上步骤,直到满足停止条件为止。

其中,所述数据采集模块包括:

信息收集单元,信息收集单元负责从互联网金融平台、第三方数据源等渠道收集与风险评估相关的信息;

信息过滤单元,信息过滤单元负责对收集到的信息进行去重、筛选和过滤,以提高数据的准确性和可用性;

数据标准化单元,数据标准化单元负责对数据进行标准化处理,以消除不同数据源之间的差异性,提高模型的稳定性和可靠性;

数据整合单元,数据整合单元负责将数据整合到一个统一的数据仓库中,以便后续分析和建模。

其中,所述模型训练模块包括:

特征选择单元,特征选择单元根据业务需求和特征属性选择合适的特征子集,以提高模型的预测性能;

模型训练单元,模型训练单元使用机器学习算法或深度学习算法对提取出的特征进行训练,以构建预测模型;

模型评估单元,模型评估单元对训练出的模型进行评估,包括精度、召回率、F1值等指标的计算和比较,以确定模型的优劣性和适用性。

其中,所述风控计算模块包括:

信用评分计算单元,信用评分计算单元负责根据用户的个人信息、交易记录、行为习惯等因素计算用户信用评分;

违约概率计算单元,违约概率计算单元负责根据用户的信用评分和历史违约记录等因素计算用户违约的概率。

其中,所述信用评分计算单元的计算方式采用如下公式:

其中,f(x

其中,所述违约概率计算单元的计算方式采用如下公式:

其中,D

其中,所述风控管理模块包括:

限制交易额度单元,限制交易额度单元根据用户的信用评分和历史违约记录等因素,限制用户的交易额度,以降低风险;

提高贷款利率单元,提高贷款利率单元根据用户的信用评分和历史违约记录等因素,提高用户的贷款利率,以增加收益;

身份验证单元,身份验证单元采用多种手段对客户身份进行验证,以减少欺诈行为的发生。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

相关技术
  • 一种基于集成学习的线上内容热度预测方法
  • 基于集成学习的互联网金融风控预测方法
  • 一种基于深度集成学习的AD预测方法、系统及装置
技术分类

06120116498857