一种信用评估模型的数据处理方法及终端
文献发布时间:2023-06-19 10:29:05
技术领域
本发明涉及信用评估技术领域,尤其涉及一种信用评估模型的数据处理方法及终端。
背景技术
目前,市面上的个人借贷软件较多,不同软件面向的目标人群不同。为了降低风险,需要对用户的还款能力进行评估,为了准确锁定目标客户,需要对用户的借贷倾向进行评估。
但是,在实际应用过程中,借贷平台大数据适合数据分析师的应用。如果在信用评估模型中发生了一些缺失,该模型可能无法成功检测,然后对借款人产生偏倚的估计。对于初期样本少,若用户数据信息不全、数据缺失,则无法构建合适的评估模型进行评估,且前期数据没有进行处理,在后期评估过程中需要非常复杂的运算,导致评估结果的精度无法得到保证。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种信用评估模型的数据处理方法及终端,能够提前对用户数据进行处理,保证后续评估结果的精度。
(二)技术方案
为了达到上述目的,本发明采用的一种技术方案为:一种信用评估模型的数据处理方法,包括:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
本发明采用的另一种技术方案为:一种信用评估模型的数据处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
(三)有益效果
本发明的有益效果是:能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
附图说明
图1为本发明的信用评估模型的数据处理方法的流程图;
图2为本发明的信用评估模型的数据处理方法的结构示意图;
【附图标记说明】
1、一种信用评估模型的数据处理终端;2、存储器;3、处理器。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
请参照图1所示,一种信用评估模型的数据处理方法,包括:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
从上述描述可知,本发明的有益效果在于:能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
进一步地,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
进一步地,所述S2包括:
若X
若X
其中,X
从上述描述可知,经过上述的归一化处理,方便后续构建的评估模型进行运算。
进一步地,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
从上述描述可知,例如第一非数值类型的第一非数值数据为判断有无网贷记录,若有,则将该第一非数值数据转化的离散变量为1,若无,第一非数值数据转化的离散变量为0,以便于后续构建的评估模型进行运算。
进一步地,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
从上述描述可知,例如,定义的数据存储时间段为13个月,则保持更新13个月内的用户数据,避免数据库内的历史存储数据过多导致数据库出现冗余问题,另外,用户可根据需求自行选择多长时间的数据进行评估,灵活性高。
请参照图2所示,一种信用评估模型的数据处理终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
从上述描述可知,本发明的有益效果在于:能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
进一步地,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
进一步地,所述S2包括:
若X
若X
其中,X
从上述描述可知,经过上述的归一化处理,方便后续构建的评估模型进行运算。
进一步地,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
从上述描述可知,例如第一非数值类型的第一非数值数据为判断有无网贷记录,若有,则将该第一非数值数据转化的离散变量为1,若无,第一非数值数据转化的离散变量为0,以便于后续构建的评估模型进行运算。
进一步地,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
从上述描述可知,例如,定义的数据存储时间段为13个月,则保持更新13个月内的用户数据,避免数据库内的历史存储数据过多导致数据库出现冗余问题,另外,用户可根据需求自行选择多长时间的数据进行评估,灵活性高。
实施例一
请参照图1所示,一种信用评估模型的数据处理方法,包括:
S1、将第一数值类型的第一数值数据转化为第二数值类型的第二数值数据;
S2、对所述第二数值数据进行归一化处理得到第三数值数据;
S3、将第一非数值类型的第一非数值数据转化为离散变量;
S4、获取缺失数据,判断所述缺失数据的数据类型;
若所述缺失数据的数据类型为第一数值类型,获取所述缺失数据的第一众数,将所述第一众数替换所述缺失数据,返回S1;
若所述缺失数据的数据类型为第一非数值类型,获取所述缺失数据的第二众数,将所述第二众数替换所述缺失数据,返回S3。
其中,所述S1包括:
将百分比型的第一数值数据转化为浮点型的第二数值数据,并且统一所述第二数值数据的有效数字位数至预设位数。
其中,所述S2包括:
若X
若X
其中,X
其中,所述S3包括:
若第一非数值类型的第一非数值数据包含“有”字,则将所述第一非数值数据转化的离散变量为1;
若第一非数值类型的第一非数值数据包含“无”字,则将所述第一非数值数据转化的离散变量为0。
其中,所述S1之前包括:
定义数据存储时间段,根据所述数据存储时间段存储所有数据。
实施例二
请参照图2,一种信用评估模型的数据处理终端1,包括存储器2、处理器3及存储在存储器2上并可在处理器3上运行的计算机程序,所述处理器3执行所述计算机程序时实现实施例一中的步骤。
综上所述,本发明提供的一种信用评估模型的数据处理终端,能够提前将第一数值类型的第一数值数据统一转化为第二数值类型的第二数值数据,保证第一数值类型的统一性,且将第二数值数据进行归一化处理,方便后续构建的评估模型进行运算;另外,能够将第一非数值类型的非数值数据转化为离散变量,也方便后续构建的评估模型进行运算;而且,根据缺失数据的数据类型根据其众数分别进行补填,并对补填后的数据进行处理,保证评估模型能够成功检测并且进行评估。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
- 一种信用评估模型的数据处理方法及终端
- 一种信用评估模型训练、评估方法与装置