掌桥专利:专业的专利平台
掌桥专利
首页

一种建模方法、装置、存储介质及电子设备

文献发布时间:2023-06-19 11:14:36


一种建模方法、装置、存储介质及电子设备

技术领域

本发明实施例涉及人工智能技术领域,尤其涉及一种建模方法、装置、存储介质及电子设备。

背景技术

随着人工智能的不断发展,人工智能在不同的技术领域被广泛应用,例如对金融风险的预测、电商平台的订单预测等。

但是,目前的人工智能模型具有一定的局限性,当一段时间内某一特定小时间区间发生了突发事件导致某个入模变量走势突变或者待预测指标发生显著偏差时,导致人工智能模型的预测精度差。

发明内容

本发明实施例提供一种建模方法、装置、存储介质及电子设备,以实现提高人工智能模型在突发情况下的预测精度。

第一方面,本发明实施例提供了一种建模方法,包括:

获取用于建模的历史数据,其中,所述历史数据包括影响因子和结果因子;

基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值;

基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。

可选的,所述基于所述结果因子的突变设置虚拟变量,以及各所述虚拟变量的变量值,包括:

确定所述结果因子的变化率;

若所述变化率大于或等于预设突变阈值,则确定所述变化率大于或等于预设突变阈值的突变时间范围,基于所述突变时间范围至少一个虚拟变量,以及设置各所述所述虚拟变量的变量值。

可选的,所述历史数据为多个时间段的历史数据,所述结果因子为多个时间段对应的结果因子;

所述基于所述突变时间范围至少一个虚拟变量,包括:

对于各个时间段的结果因子中,不重叠的各突变时间范围分别设置一虚拟变量。

可选的,基于所述突变时间范围设置各所述所述虚拟变量的变量值,包括:

对于基于任一突变时间范围设置的虚拟变量,将所述虚拟变量在任一突变时间范围内的变量值设置为1,在所述任一突变时间范围外的变量值设置为0。

可选的,在至少一个时间点,各所述虚拟变量的变量值均为0。

可选的,在所述基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型之前,所述方法还包括:

基于各所述影响因子的类型对各所述影响因子进行预处理。

可选的,所述预处理包括如下至少一项:滞后处理、超前处理、差分处理、环比处理、对数处理和指数处理。

可选的,所述基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型,包括:

获取初始模型以及所述初始模型的采样参数和预测参数;

基于所述初始模型的采样参数从所述历史数据中确定建模数据,其中,所述建模数据为从所述历史数据中采样得到的影响因子和结果因子;

基于建模数据和所述预测参数对所述初始模型进行建模处理,得到预测模型。

可选的,所述初始模型模型包括线性回归模型、LOGIT回归模型、hazard模型和Arimax模型。

可选的,所述影响因子为随时间变化的各经济指标,所述结果因子为随时间变化的还款违约率。

可选的,所述方法还包括:

创建压力情景;

在所述压力情景下,基于所述预测模型执行预测任务,得到预测结果。

可选的,所述创建压力情景,包括:

获取情景参数,其中,所述情景参数包括情景开始时间、情景频率、预测次数和情景指标;

基于所述情景参数创建压力情景。

第二方面,本发明实施例还提供了一种建模装置,包括:

数据获取模块,用于获取用于建模的历史数据,其中,所述历史数据包括影响因子和结果因子;

虚拟变量设置模块,用于基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值;

模型创建模块,用于基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。

第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任一实施例提供的建模方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例提供的建模方法。

本实施例的技术方案,通过获取用于建模的历史数据中的影响因子和结果因子,基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值,并基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。通过在用于建模的历史数据的基础上,设置虚拟变量,该虚拟变量用于表征突发因素,即在建模的过程中兼顾了突发因素的影响,提高了预测模型的压测能力以及预测精度,便于通过该预测模型精准预测突发事件发生下的预测值,便于根据预测结果提前设置应对策略,避免突发事件导致的不良影响。

附图说明

图1为本发明实施例一提供的一种建模方法的流程示意图;

图2是本发明实施例提供的一种客户违约率随时间发生变化的曲线图;

图3是本发明实施例一提供的一种虚拟变量的设置界面示意图;

图4是本发明实施例二提供的一种建模方法流程示例图;

图5是本发明实施例三提供的一种建模方法的流程示意图;

图6是本发明实施例四提供的一种建模装置的结构示意图;

图7为本发明实施例五提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种建模方法的流程示意图,本实施例可适用于在存在数据突变情况下创建高精度预测模型的情况,该方法可以由本发明实施例提供的建模装置来执行,该建模装置可以由软件和/或硬件来实现,该建模装置可以配置在诸如计算机或服务器等的电子计算设备上。该方法具体包括如下步骤:

S110、获取用于建模的历史数据,其中,所述历史数据包括影响因子和结果因子。

S120、基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值。

S130、基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。

预测模型通过已知信息预测未知信息,该未知信息可以是预设时间的发生概率,预测模型通过学习历史已知信息与历史的结果信息之间的关联关系,具有预测未来结果信息的功能。其中,历史已知信息可以是影响结果信息的主要因素,但是由于数据采集以及建模技术的局限性,无法保证采集的已知信息为影响结果信息的全部因素,即由于无法预料的突变因素,导致突变因素影响结果信息发生突变或者结果信息发生明显偏差。该突变因素可以是一段时间内某一特定小时间区间发生的突发事件。

示例性的,参见图2,图2是本发明实施例提供的一种客户违约率随时间发生变化的曲线图。图2中明显存在突发高违约率。例如该突发高违约率是由于助业贷因为政府农业补贴还款到账时间稍晚,导致某一地方客户发生集体违约,在这一区间内地方客户违约率会集体突然上升,针对这种特定情景,传统预测模型难以进行高精度预测。

针对上述技术问题,本实施例中通过历史数据和虚拟变量进行建模,以实现提高预测模型的预测精度。其中,用于建模的历史数据包括预设时间段内的影响因子和结果因子,对于不同预测模型对应的历史数据不同,其中,不同预测模型用于预测不同事件的发生概率,即历史时间的结果因子为预测事件的真事发生数据,影响因子即影响上述预测时间发生的因素,可选的,该影响因子可以是具有长期影响的因素,即该影响因子在任何时间段均对预测时间的发生存在影响。示例性的,对于目标对象的还款违约事件,历史数据中的影响因子为随时间变化的各经济指标,结果因子为随时间变化的还款违约率。相应的,图2中的违约率可以是结果因子,影响因子未示处,该影响因子可以是包括但不限于生产总值、个人收入、使用率、经济收支等。需要说明的是,影响因子可根据预测需求确定,本实施例中对此不做到限定。可选的,各影响因子满足低内聚性和低耦合性。如果同一情景选择的两个或多个影响因子已经存在较为明显的关联关系,则会使建模时所依赖的独立影响因子有效性降低,进而降低建模准确性。为避免这一问题,在建模时尽量选择情景内影响因子低内聚性,不同情景影响因子低耦合性。

由于获取的历史数据中的影响因子不存在产生突发变化的功能,本实施例中通过设置虚拟变量模拟突发因素,通过增加虚拟变量,在建模的过程学习突发因素的影响,提高预测模型在存在突发因素的情况下的预测精度,便于根据高精度的预测结果提前做出应对措施,提高了对突发事件的应对能力。

可选的,根据历史数据中结果因子的突变设置至少一个虚拟变量以及各虚拟变量的数值。示例性的,任一突变可以是对应一个或多个突发因素,即结果因子中的任一突变位置可对应设置一个或多个虚拟变量。本实施例中,虚拟变量数量可以是小于或等于预设数量。在一些实施例中,该预设数量可以是根据测试需求确定,例如预设数量可以是10,即虚拟变量的数量上限为10,避免设置大量虚拟变量影响建模的速度和质量的问题。

在一些可选实施例中,所述基于所述结果因子的突变设置虚拟变量,以及各所述虚拟变量的变量值,包括:确定所述结果因子的变化率;若所述变化率大于或等于预设突变阈值,则确定所述变化率大于或等于预设突变阈值的突变时间范围,基于所述突变时间范围至少一个虚拟变量,以及设置各所述所述虚拟变量的变量值。

其中,以预测模型对目标对象的还款违约事件的预测为例,结果因子为随时间变化的还款违约率,示例性的参见图2。图2中包括各时间点对应的还款违约率,基于相邻时间段的还款违约率的差值,以及前一时间点的还款违约率确定各个时间点的变化率,通过该变化率确定是否发生突变。具体的,通过预先设置的预设突变阈值分别与各时间点的变化率进行比对,如果任一时间点的变化率大于或等于该预设突变阈值,则确定该时间点发生突变,即表明该时间点上存在突发因素,针对该上述突变设置一个或多个虚拟变量,各虚拟变量可以是诸如D1、D2等。基于各时间点的变化率,确定突发因素发生的突发时间范围,基于上述突发时间范围确定虚拟变量的数量和数值。

需要说明的是,结果因子的突变可以是诸如图2的向上突变,也可以是向下突变,例如还款违约率的突然下降等,表明突变因素可以是包括正作用突变因素和负作用突变因素。可选的,本实施例中的结果因子的变化率,可以是变化率绝对值。通过变化率绝对值与预设突变阈值的比对,在存在向上突变和向下突变时,均设置虚拟变量,提供虚拟变量设置的全面性和准确性。

本实施例中,所述历史数据为多个时间段的历史数据,所述结果因子为多个时间段对应的结果因子。其中各个时间段可以是具有对应关系的时间段,例如多个整年的历史数据、多个季度的历史数据、多个月份的历史数据等,其中,各年、各季度以及各月具有相同的时间信息,具有可比对性。

以多个整年的历史数据为例,示例性的,可以是2018年、2019年和2020年的历史数据。基于上述变化率确定各年历史数据中的突发时间范围,将上述各时间段中的突发时间范围进行时间比对,确定不重叠的各突变时间范围。示例性的,2018年的突发时间范围为1月-3月,2019年的突发时间范围为10月-12月,2020年的突发时间范围为2月-3月,则2018年的突发时间范围与2019年的突发时间范围不重叠,2018年的突发时间范围与2020年的突发时间范围重叠,则确定两个不重叠的突发时间范围为1月-3月和10月-12月。其中,确定两个突发时间范围是否重叠可以是确定第一突发时间范围是否完全包括第二突发时间范围,或者第一突发时间范围是否完全被第二突发时间范围所包括,若是,则确定二者重叠,若否,则确定二者不重叠。

相应的,所述基于所述突变时间范围至少一个虚拟变量,包括:对于各个时间段的结果因子中,不重叠的各突变时间范围分别设置一虚拟变量,即根据不重叠的各突变时间范围的数量确定虚拟变量的数量,可选的,虚拟变量的数量与不重叠的各突变时间范围的数量相同;可选的,虚拟变量的数量为不重叠的各突变时间范围的数量的倍数,例如可以是2倍。

对于任一虚拟变量,突发因素发生时设置为数值1,突发因素不发生时设置为数值0,具体的,根据突变时间范围确定对应的虚拟变量的数值。基于所述突变时间范围设置各所述所述虚拟变量的变量值,包括:对于基于任一突变时间范围设置的虚拟变量,将所述虚拟变量在任一突变时间范围内的变量值设置为1,在所述任一突变时间范围外的变量值设置为0。

示例性的,参见图3,图3是本发明实施例一提供的一种虚拟变量的设置界面示意图。图3中设置虚拟变量D1、D2,其中,虚拟变量的名称由系统随机生成,此处不作限定。图3中包括根据建模需求设置的时间点,该时间点可以是根据数据采样频率确定。对于任一虚拟变量,若上述时间点在该虚拟变量对应的突变时间范围内,则将该时间点上虚拟变量的数值设置为1,若上述时间点不在该虚拟变量对应的突变时间范围内,则将该时间点上虚拟变量的数值设置为0。具体的,在图3中选中虚拟变量的数值设置为1的时间点,未选中的时间点对应的虚拟变量的数值为0。

需要说明的是,将设置的各虚拟变量以及各虚拟变量的数值在显示界面上进行显示,便于操作用户获知上述设置,以及可通过对上述显示界面的操作实现对各虚拟变量以及各虚拟变量的数值的编辑,例如包括但不限于增加虚拟变量、删除虚拟变量、更换虚拟变量在任一时间点的数值等。通过上述编辑操作可实现操作用户对虚拟变量的干预,以提高虚拟变量设置的准确性和灵活性。

因突变情景为极小概率事件,从宏观业务角度其难以覆盖整个时间线,因而至少需存在一个时间节点,在所有虚拟变量上全部为0。相应的,在至少一个时间点,各所述虚拟变量的变量值均为0,即意为该时间节点上一切指标走势按照正常趋势演变,没有特定经济事件冲击。

可选的,在一些实施例中,还可以是根据突变因素的特定频率设置对应虚拟变量的数值。例如每一年年末因为政府政策需要,各统计部门需要对各指标进行出数汇报,该年末结算期内,各中小客户为了自身发展需求,导致其相关贷款项清算率较高,进而导致违约率显著下降。因为该情形为年度特定时间节点大趋势,因而将虚拟变量设定为按照频率出现,设定其初始出现始点以及周期,其在每个周期推移点上取值为1,其余时段取值为0,并以该值参与建模计算。

可选的,基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型,包括:获取初始模型以及所述初始模型的采样参数和预测参数;基于所述初始模型的采样参数从所述历史数据中确定建模数据,其中,所述建模数据为从所述历史数据中采样得到的影响因子和结果因子;基于建模数据和所述预测参数对所述初始模型进行建模处理,得到预测模型。

其中,采样参数可以包括但不限于模型采样区间、样本点选取频率,预测参数可以包括但不限于模型预测频率,其中,模型预测频率可以是1个月或者1个季度等。

本实施例中,将影响因子和虚拟变量作为自变量,将结果因子作为因变量,通过采样参数在历史数据中确定上述影响因子和结果因子的数值,通过采集得到的影响因子和结果因子的数值,以及基于采样参数设置的虚拟变量的数值形成建模数据,基于上述建模数据以及预测参数对初始模型进行建模处理,其中,不同的初始模型可以是对应不同的建模方法,通过调用预先设置的建模方法,对初始模型进行建模处理,得到预测模型。

在一些可选实施例中,初始模型模型包括线性回归模型、LOGIT回归模型、hazard模型和Arimax模型,相应的,建模得到的预测模型为具有预测功能的上述线性回归模型、LOGIT回归模型、hazard模型和Arimax模型中的任一项。

例如,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析,是一个或多个称为回归系数的模型参数的线性组合。在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。线性回归模型可用最小二乘逼近来拟合,还可以用最小化“拟合缺陷”在一些其他规范里(比如最小绝对误差回归),或者在桥回归中最小化最小二乘损失函数的惩罚。相反,最小二乘逼近可以用来拟合那些非线性的模型。

logistic回归是一种广义线性回归(generalized linear model),与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有w‘x+b,其中w和b是待求参数,logistic回归通过函数L将w‘x+b对应一个隐状态p,p=L(w‘x+b),根据p与1-p的大小决定因变量的值。如果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归。

logistic回归的因变量可以是二分类的,也可以是多分类的,多类可以使用softmax方法进行处理。实际中最为常用的就是二分类的logistic回归。Logistic回归模型的适用条件:第一,因变量为二分类的分类变量或某事件的发生率,并且是数值型变量。但是需要注意,重复计数现象指标不适用于Logistic回归。第二,残差和因变量都要服从二项分布。二项分布对应的是分类变量,所以不是正态分布,进而不是用最小二乘法,而是最大似然法来解决方程估计和检验问题。第三,自变量和Logistic概率是线性关系。第四,各观测对象间相互独立。

本实施例的技术方案,通过获取用于建模的历史数据中的影响因子和结果因子,基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值,并基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。通过在用于建模的历史数据的基础上,设置虚拟变量,该虚拟变量用于表征突发因素,即在建模的过程中兼顾了突发因素的影响,提高了预测模型的压测能力以及预测精度,便于通过该预测模型精准预测突发事件发生下的预测值,便于根据预测结果提前设置应对策略,避免突发事件导致的不良影响。

实施例二

图4是本发明实施例二提供的一种建模方法流程示例图,在上述实施例的基础上进行了优化,可选的,在所述基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型之前,所述方法还包括:基于各所述影响因子的类型对各所述影响因子进行预处理。该方法具体不包括:

S210、获取用于建模的历史数据,其中,所述历史数据包括影响因子和结果因子。

S220、基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值。

S230、基于各所述影响因子的类型对各所述影响因子进行预处理。

S240、基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。

本实施例中,由于影响因子的类型不同,导致各影响因子的数量方式不同,例如不同指标历史值之前根据其单位和量级不同,如果直接使用则会对建模结果产生极大影响。示例性的,影响因子中的GDP累计同比与GDP累计值,前者为百分比,后者为一大数据量级。针对上述问题,在建模时需要根据指标特性对其进行无量纲化处理。因此在进行建模之前,对各影响因子进行预测量。可选的,所述预处理包括如下至少一项:滞后处理、超前处理、差分处理、环比处理、对数处理和指数处理。示例性的,无量纲化处理可以是由差分处理、环比处理、对数处理和指数处理中的一项或多项实现。示例性的,对GDP累计值采用环比处理,即环比计算公式为(当期值-上期值)/上期值,将各指标量化至同一影响程度,提高建模得到的预测模型的精度。

在一些实施例中,由于经济传导存在迟滞,例如,财务政策的推出并不会立刻传导至经济指标的影响,因此,对于传统宏观变量(即影响因子)可以采取滞后处理和超前处理。其中,滞后处理跟差分处理、环比处理属于同一层级,都是可选择的对于自变量的处理方式。例如滞后一期,则指使用上一期实际值作为当前期入模时采用的值,例如CPI累计同比3月份为8.1%,4月份为6.3%,5月份为7.2%,则在实际运算时将8.1%作为4月份数据,6.3%作为5月份数据,相似的,如果选择滞后两期,则将8.1%作为5月份实际运算数据。而类似的,滞后处理与超前处理相对应,超前处理指往后取值,例如超前一期在上述例子中则将5月份的7.2%作为4月实际运算数据。

基于预处理后的影响因子,以及虚拟变量和结果因子进行建模,得到预测模型。

本实施例提供的技术方案,通过在获取影响因子之后,对各影响因子进行预处理,降低各影响因子的数值类型不同导致对建模的影响,提高了得到的预测模型的质量和预测精度。

实施例三

图5是本发明实施例三提供的一种建模方法的流程示意图,在上述实施例的基础上进行了优化,可选的,所述方法还包括:创建压力情景;在所述压力情景下,基于所述预测模型执行预测任务,得到预测结果。该方法具体包括:

S310、获取用于建模的历史数据,其中,所述历史数据包括影响因子和结果因子。

S320、基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值。

S330、基于各所述影响因子的类型对各所述影响因子进行预处理。

S340、基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。

S350、创建压力情景,在所述压力情景下,基于所述预测模型执行预测任务,得到预测结果。

本实施例中,通过创建的预测模型在压力情景下执行预测任务,以实现对未知信息的预测,例如对未来时间内还款违约率的预测,便于操作用户基于未来时间内还款违约率的预测结果设置应用措施。

其中,压力情景为进行预测的未来时间内预测情景。

在一些可选实施例中,创建压力情景,包括:获取情景参数,其中,所述情景参数包括情景开始时间、情景频率、预测次数和情景指标;基于所述情景参数创建压力情景。

其中,情景开始时间即开始预测的时间,情景频率即相邻预测时间点之间的时间间隔,预测期数为预测节点的数量,情景指标为在未来时间内目标对象的经济指标,即影响因子,该影响因子可以是根据操作用户基于经验值设置,还可以是基于历史影响因子设置;例如,可以是将不同时间段内的历史影响因子进行均值确定。

以预测还款违约率为例,目标对象可以是包括对私测试对象和对公测试对象,对私测试对象支持从机构维度和产品两个维度进行自由组合,其中产品维度细分为信用卡、个人其他、个人住房贷款三个细项;对于对公测试对象,支持从区域、产品、规模、行业、押品五个维度进行自由组合,从债项粒度根据勾选的维度进行过滤并汇总。

可选的,基于所述情景参数创建压力情景包括:通过目标对象和承压指标进行过滤影响因子,设置各常规变量和虚拟变量能完全覆盖模型中变量,设置任务起始时间和频率满足情景能够覆盖整个任务报告期。其中,情景内各报告期即为开始时间加上期数乘以频率,例如从202012开始,以季为频率预测4期,则预测报告期即为202103、202106、202109、202112。

压力情景配置完成后,根据情景各宏观指标及虚拟变量的未来预测值,基于预测模型模型执行预测任务,可预测出各报告期下承压指标值及走势。

本实施例提供的技术方案,通过创建具有突发预测功能的预测模型,创建压力情景,在压力情景基于该预测模型执行预测功能,得到测试结果,实现了对未来时间内的预设事件的高精度预测。

实施例四

图6是本发明实施例四提供的一种建模装置的结构示意图,该装置包括:

数据获取模块410,用于获取用于建模的历史数据,其中,所述历史数据包括影响因子和结果因子;

虚拟变量设置模块420,用于基于所述结果因子的突变设置虚拟变量,以及所述虚拟变量的变量值;

模型创建模块430,用于基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型。

可选的,虚拟变量设置模块420包括:

变化率确定单元,用于确定所述结果因子的变化率;

虚拟变量设置单元,用于若所述变化率大于或等于预设突变阈值,则确定所述变化率大于或等于预设突变阈值的突变时间范围,基于所述突变时间范围至少一个虚拟变量,以及设置各所述所述虚拟变量的变量值。

可选的,所述历史数据为多个时间段的历史数据,所述结果因子为多个时间段对应的结果因子;

虚拟变量设置单元用于:

对于各个时间段的结果因子中,不重叠的各突变时间范围分别设置一虚拟变量。

可选的,虚拟变量设置单元用于:

对于基于任一突变时间范围设置的虚拟变量,将所述虚拟变量在任一突变时间范围内的变量值设置为1,在所述任一突变时间范围外的变量值设置为0。

可选的,在至少一个时间点,各所述虚拟变量的变量值均为0。

可选的,该装置还包括:

预处理模块,用于在所述基于所述虚拟变量、所述影响因子和所述结果因子构建预测模型之前,基于各所述影响因子的类型对各所述影响因子进行预处理。

可选的,所述预处理包括如下至少一项:滞后处理、超前处理、差分处理、环比处理、对数处理和指数处理。

可选的,模型创建模块430用于:

获取初始模型以及所述初始模型的采样参数和预测参数;

基于所述初始模型的采样参数从所述历史数据中确定建模数据,其中,所述建模数据为从所述历史数据中采样得到的影响因子和结果因子;

基于建模数据和所述预测参数对所述初始模型进行建模处理,得到预测模型。

可选的,所述初始模型模型包括线性回归模型、LOGIT回归模型、hazard模型和Arimax模型。

可选的,所述影响因子为随时间变化的各经济指标,所述结果因子为随时间变化的还款违约率。

可选的,该装置还包括:

情景创建模块,用于创建压力情景;

预测模块,用于在所述压力情景下,基于所述预测模型执行预测任务,得到预测结果。

可选的,情景创建模块用于:

获取情景参数,其中,所述情景参数包括情景开始时间、情景频率、预测次数和情景指标;

基于所述情景参数创建压力情景。

上述建模装置可执行本发明任意实施例所提供的建模方法,具备执行建模方法相应的功能模块和有益效果。

实施例五

图7为本发明实施例五提供的一种电子设备的结构示意图。图7示出了适于用来实现本发明实施方式的电子设备12的框图。图7显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备12典型的是承担图像分类功能的电子设备。

如图7所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器16,存储装置28,连接不同系统组件(包括存储装置28和处理器16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

存储装置28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储装置28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块26的程序36,可以存储在例如存储装置28中,这样的程序模块26包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网关环境的实现。程序模块26通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、摄像头、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网关适配器20与一个或者多个网关(例如局域网(Local Area Network,LAN),广域网Wide Area Network,WAN)和/或公共网关,例如因特网)通信。如图所示,网关适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。

处理器16通过运行存储在存储装置28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的建模方法。

实施例六

本发明实施例六提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的建模方法。

当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的建模方法。

本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的源代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的源代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机源代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。源代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网关——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

相关技术
  • 建模方法及建模装置、电子设备及存储介质
  • 一种光强分布的建模方法、装置、电子设备及存储介质
技术分类

06120112858324