掌桥专利:专业的专利平台
掌桥专利
首页

风险产品预测方法及装置

文献发布时间:2023-06-19 11:39:06


风险产品预测方法及装置

技术领域

本发明涉及人工智能技术领域,具体地,涉及一种风险产品预测方法及装置。

背景技术

在金融市场中,各种金融实时活动产生了大规模的时序数据,这些数据具有海量、高速、动态、高维和非线性的特点,例如股价、汇率和贵金属报价等,相关数据时效性较强。风险产品的预测问题在实际应用广泛存在,具有重要的理论实际意义。传统的基于经验的交易策略很难深入分析海量的金融数据并对未来的风险产品进行推测,提高了交易风险,降低了客户的交易体验。

发明内容

本发明实施例的主要目的在于提供一种风险产品预测方法及装置,以准确预测风险产品,降低交易风险,提高客户的交易体验。

为了实现上述目的,本发明实施例提供一种风险产品预测方法,包括:

获取产品的产品时序数据,根据产品时序数据构建原始产品特征矩阵;

根据原始产品特征矩阵构造目标产品特征矩阵,将目标产品特征矩阵输入基于产品特征训练矩阵创建的产品数据预测模型中,得到产品特征预测矩阵;

根据产品特征预测矩阵生成产品数据预测曲线,根据产品数据预测曲线给产品标注对应的风险标记。

本发明实施例还提供一种风险产品预测装置,包括:

原始产品特征矩阵模块,用于获取产品的产品时序数据,根据产品时序数据构建原始产品特征矩阵;

产品特征预测矩阵模块,用于根据原始产品特征矩阵构造目标产品特征矩阵,将目标产品特征矩阵输入基于产品特征训练矩阵创建的产品数据预测模型中,得到产品特征预测矩阵;

风险标记标注模块,用于根据产品特征预测矩阵生成产品数据预测曲线,根据产品数据预测曲线给产品标注对应的风险标记。

本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,处理器执行计算机程序时实现所述的风险产品预测方法的步骤。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现所述的风险产品预测方法的步骤。

本发明实施例的风险产品预测方法及装置先根据产品时序数据构建原始产品特征矩阵以进一步构造目标产品特征矩阵,再将目标产品特征矩阵输入产品数据预测模型得到产品特征预测矩阵以准确预测风险产品,可以降低交易风险,提高客户的交易体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例中风险产品预测方法的流程图;

图2是本发明实施例中构造目标产品特征矩阵的流程图;

图3是本发明实施例中构造目标产品特征矩阵的流程图;

图4是本发明实施例中创建产品数据预测模型的流程图;

图5是LSTM循环神经网络的示意图;

图6是LSTM循环神经网络的内部结构示意图;

图7是本发明实施例中风险产品预测装置的结构框图;

图8是本发明实施例中计算机设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

时序预测是依据过去和当前的数据对未来的数据进行推测,其实质相当于对具有时间属性的关联知识的提取,因此时序预测需要充分考虑数据的时变特征。鉴于现有技术很难深入分析海量的金融数据并对未来的风险产品进行推测,提高了交易风险,降低了客户的交易体验,本发明对时序数据构建时序特征,并对数据进行正交变换和降维以降低数据维度和噪音,应用对时序数据处理效果较好的长短时间记忆网络对时序数据进行量化预测,以高效准确识别异常产品,降低交易风险,提高客户的交易体验。以下结合附图对本发明进行详细说明。

在金融市场中,各种金融活动实时产生了大规模的金融时序数据,这些数据具有覆盖面广、内容丰富和实时性强等特点,且大部分是非结构化数据,例如记录股价波动的股指数据以及相关金融新闻动态。金融市场是有信息驱动的市场,金融信息的变化最终都会在不同程度的体现在金融市场的波动上。传统的基于经验的交易策略很难深入分析海量的金融数据,基于数理统计的机器学习方式获得的交易策略对处理海量数据也存在困难,很难构建复杂的特征工程,容易出现过拟合和泛化能力不佳的情况。

时序数据是指按时间次序排列且相互关联的随机变量序列。金融活动中会产生大量的时序数据,如企业的经营活动会产生资产、利润和企业市值变化等数据,每个数据都是一个时序数据,同时不同的数据通过数学计算又会产生一个新的时序数据并增加一个新的维度,如企业估值数据可以用资产/市值或者利润/市值来表达。因此金融数时序数据非常复杂,其复杂性体现在:维度高、噪音大、幅度上的拉伸和平移、时间轴上的伸缩性和线性漂移以及不连续点等特征。

图1是本发明实施例中风险产品预测方法的流程图。图2是本发明实施例中构造目标产品特征矩阵的流程图。如图1和图2所示,风险产品预测方法包括:

S101:获取产品的产品时序数据,根据产品时序数据构建原始产品特征矩阵。

一实施例中,设共有m个产品时序数据X

S102:根据原始产品特征矩阵构造目标产品特征矩阵,将目标产品特征矩阵输入基于产品特征训练矩阵创建的产品数据预测模型中,得到产品特征预测矩阵。

本发明中的部分产品时序数据彼此之间相互独立,另一部分产品时序数据之间存在关联关系。还有部分产品时序数据存在时间幅度上的伸缩,如5日均线和10日均线等。理论上可以将所有时序数据均作为机器学习的因子纳入模型进行训练,但因子越多意味着数据维度越高,因子间的联系也更加复杂,大量因子中必然包含大量噪音,这些噪音对模型的建立是无效的,甚至会带来负面影响。高维的数据在处理时容易陷入高维的灾难,每个数据的特征之间关系复杂,相关性较高,容易导致过拟合,因此必须对高维矩阵进行压缩,并减少特征向量之间的相关性。

在执行S102之前,还包括:对原始产品特征矩阵中的特征向量进行标准化处理。

例如,原始产品特征矩阵E中表示第i个特征F

图3是本发明实施例中构造目标产品特征矩阵的流程图。如图2所示,构造目标产品特征矩阵包括:

S201:确定原始产品特征矩阵的协方差矩阵的特征值和特征向量。

一实施例中,可以先对经过标准化处理的原始产品特征矩阵A进行正交计算以获得协方差矩阵B,

具体实施时,可以用特征值分解方法求协方差矩阵B的特征值和特征向量。对于n阶矩阵B,若存在数λ和n维列向量x,满足Bx=λx,则λ为B的特征值,x为B对应λ的特征向量。以3阶矩阵为例,特征值和特征向量的求解过程如下:

设3阶矩阵为

计算行列:

(λ-4)(λ-4)(λ+7)+(-2)×9×(-5)+5×(-6)×(-3)-(5×(λ-4)×(-5)+(-2)×(-6)×(λ+7)+(λ-4)×9×(-3));

化解为:λ

求解为:λ

分别将λ代入(λI-B)x=0,可以求出特征向量p

S202:根据特征值和特征向量构建投影矩阵。

一实施例中,S202包括:按照从大到小的顺序从特征值中选取投影特征值;根据投影特征值对应的特征向量构建投影矩阵。

具体实施时,可以按照从大到小的顺序从特征值中选取k个投影特征值。其中,k个投影特征值之和与全部特征值之和的比应大于预设百分比阈值(例如90%,相当于保留了原数据90%的特征)。将k个投影特征值对应的特征向量构建投影矩阵P

S203:根据投影矩阵和原始产品特征矩阵构造目标产品特征矩阵。

具体实施时,可以将原始数据投影到新的特征向量上,目标产品特征矩阵C

S103:根据产品特征预测矩阵生成产品数据预测曲线,根据产品数据预测曲线给所述产品标注对应的风险标记。

具体实施时,可以先根据产品特征预测矩阵生成产品预测时序数据,再根据产品预测时序数据生成产品数据预测曲线,根据产品数据预测曲线的趋势确定产品的风险并在产品上标注对应的风险标记以提示客户。

图1所示的风险产品预测方法的执行主体可以为计算机。由图1所示的流程可知,本发明实施例的风险产品预测方法先根据产品时序数据构建原始产品特征矩阵以进一步构造目标产品特征矩阵,再将目标产品特征矩阵输入产品数据预测模型得到产品特征预测矩阵以准确预测风险产品,可以降低交易风险,提高客户的交易体验。

图4是本发明实施例中创建产品数据预测模型的流程图。图5是LSTM循环神经网络的示意图。图6是LSTM循环神经网络的内部结构示意图。如图4-图6所示,基于产品特征训练矩阵创建产品数据预测模型包括:

执行如下迭代处理:

S301:根据产品特征训练矩阵和模型参数确定产品特征计算矩阵。

在执行S301之前,还包括:根据历史时序数据构造产品特征训练矩阵。

其中,模型参数可以为长短期记忆网络(LSTM,Long Short-Term Memory)的模型参数。长短期记忆网络是一种循环神经网络(RNN,Recurrent Neural Network)的特殊类型。原始的循环网络随着训练时间的加长以及网络层数的增多,很容易出现梯度爆炸或者梯度消失的问题,导致无法处理较长序列的数据,进而无法获取长距离数据的信息。LSTM通过引入门机制来控制信息的积累速度,并可以选择遗忘之前累积的信息。LSTM作为一种特殊的RNN,两者的区别在于普通RNN的单个循环结构内部只有一个状态,而LSTM的单个循环结构内有四个状态。相比于RNN,LSTM循环结构之间保持一个持久的单元状态不断传递下去,用于决定哪些信息要遗忘或者继续传递下去。

LSTM与RNN一样是由重复神经网络模块构成的一条链(如图5所示),但与递归神经网络不同的是,LSTM的神经网络模块(记忆块(memory block),如图6所示,)相较于RNN单tanh层的逻辑处理更复杂,包含了三个门(遗忘门(forget gate)、输入门(input gate)和输出门(output gate))与一个记忆单元(cell),记忆单元通过单元状态(cell state)来控制信息传递给下一时刻。

遗忘门301决定有多少上一个时刻的信息需要保留到当前时刻,通过sigmoid和上一时刻的输出来控制输出通过或部分通过,可以对之前学习到东西进行选择性的过滤:

F

其中,F

其中,

输入门(input gate)302决定当前时刻输入数据有多少需要保存到单元状态:

I

其中,I

将产品特征训练矩阵代入I

其中,w

当前暂时状态303主要根据上一时刻的输出和当前输入计算得到:

其中,

将产品特征训练矩阵代入

其中,w

当前记忆单元状态(cell state)304由上一时刻输出、遗忘门、输出门及当前暂时状态计算得到:

输出门(output gate)305控制当前单元状态有多少需要输出到当前输出值:

o

其中,o

当前输出306由当前单元状态和当期输出门计算获得:

h

其中,h

综上:

h

S302:根据产品特征计算矩阵与对应的产品特征实际矩阵确定损失函数。

S303:判断损失函数是否小于预设损失函数阈值。

S304:当损失函数小于预设损失函数阈值时,根据模型参数创建产品数据预测模型。

S305:当损失函数大于或等于预设损失函数阈值时,根据损失函数更新模型参数,继续执行迭代处理。

其中,模型参数包括遗忘权重、遗忘偏置、输入权重、输入偏置、状态权重、状态偏置、输出权重和输出偏置。

本发明实施例的具体流程如下:

1、根据历史时序数据构造产品特征训练矩阵。

2、根据产品特征训练矩阵和模型参数确定产品特征计算矩阵。

3、根据产品特征计算矩阵与对应的产品特征实际矩阵确定损失函数。

4、判断损失函数是否小于预设损失函数阈值。当损失函数小于预设损失函数阈值时,根据模型参数创建产品数据预测模型,否则根据损失函数更新模型参数,返回步骤2。

5、获取产品的产品时序数据,根据产品时序数据构建原始产品特征矩阵。

6、对原始产品特征矩阵中的特征向量进行标准化处理,确定经过标准化处理的原始产品特征矩阵的协方差矩阵。

7、确定协方差矩阵的特征值和特征向量,根据特征值和特征向量构建投影矩阵。

8、根据投影矩阵和原始产品特征矩阵构造目标产品特征矩阵,将目标产品特征矩阵输入基于产品特征训练矩阵创建的产品数据预测模型中,得到产品特征预测矩阵。

9、根据产品特征预测矩阵生成产品预测时序数据。

10、根据产品预测时序数据生成产品数据预测曲线,根据产品数据预测曲线的趋势确定产品的风险并在产品上标注对应的风险标记以提示客户。

综上,本发明对金融时序数据进行处理并引入对时间信号更为敏感的LSTM循环神经网络作为训练模型,能够避免金融时序数据维度高,数据相关性强,噪音多等问题,可以准确预测风险产品,可以降低交易风险,提高客户的交易体验。

基于同一发明构思,本发明实施例还提供了一种风险产品预测装置,由于该装置解决问题的原理与风险产品预测方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。

图7是本发明实施例中风险产品预测装置的结构框图。如图7所示,风险产品预测装置包括:

原始产品特征矩阵模块,用于获取产品的产品时序数据,根据产品时序数据构建原始产品特征矩阵;

产品特征预测矩阵模块,用于根据原始产品特征矩阵构造目标产品特征矩阵,将目标产品特征矩阵输入基于产品特征训练矩阵创建的产品数据预测模型中,得到产品特征预测矩阵;

风险标记标注模块,用于根据产品特征预测矩阵生成产品数据预测曲线,根据产品数据预测曲线给产品标注对应的风险标记。

在其中一种实施例中,原始产品特征矩阵模块包括:

特征确定单元,用于确定原始产品特征矩阵的协方差矩阵的特征值和特征向量;

投影矩阵构建单元,用于根据特征值和特征向量构建投影矩阵;

目标产品特征矩阵构造单元,用于根据投影矩阵和原始产品特征矩阵构造目标产品特征矩阵。

在其中一种实施例中,投影矩阵构建单元包括:

投影特征值选取子单元,用于按照从大到小的顺序从特征值中选取投影特征值;

投影矩阵构建子单元,用于根据投影特征值对应的特征向量构建投影矩阵。

在其中一种实施例中,还包括:产品数据预测模型创建模块,用于执行如下迭代处理:

根据产品特征训练矩阵和模型参数确定产品特征计算矩阵;

根据产品特征计算矩阵与对应的产品特征实际矩阵确定损失函数;

当损失函数小于预设损失函数阈值时,根据模型参数创建产品数据预测模型,否则根据损失函数更新模型参数,继续执行迭代处理。

综上,本发明实施例的风险产品预测装置先根据产品时序数据构建原始产品特征矩阵以进一步构造目标产品特征矩阵,再将目标产品特征矩阵输入产品数据预测模型得到产品特征预测矩阵以准确预测风险产品,可以降低交易风险,提高客户的交易体验。

本发明实施例还提供能够实现上述实施例中的风险产品预测方法中全部步骤的一种计算机设备的具体实施方式。图8是本发明实施例中计算机设备的结构框图,参见图8,所述计算机设备具体包括如下内容:

处理器(processor)801和存储器(memory)802。

所述处理器801用于调用所述存储器802中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的风险产品预测方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:

获取产品的产品时序数据,根据产品时序数据构建原始产品特征矩阵;

根据原始产品特征矩阵构造目标产品特征矩阵,将目标产品特征矩阵输入基于产品特征训练矩阵创建的产品数据预测模型中,得到产品特征预测矩阵;

根据产品特征预测矩阵生成产品数据预测曲线,根据产品数据预测曲线给产品标注对应的风险标记。

综上,本发明实施例的计算机设备先根据产品时序数据构建原始产品特征矩阵以进一步构造目标产品特征矩阵,再将目标产品特征矩阵输入产品数据预测模型得到产品特征预测矩阵以准确预测风险产品,可以降低交易风险,提高客户的交易体验。

本发明实施例还提供能够实现上述实施例中的风险产品预测方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的风险产品预测方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:

获取产品的产品时序数据,根据产品时序数据构建原始产品特征矩阵;

根据原始产品特征矩阵构造目标产品特征矩阵,将目标产品特征矩阵输入基于产品特征训练矩阵创建的产品数据预测模型中,得到产品特征预测矩阵;

根据产品特征预测矩阵生成产品数据预测曲线,根据产品数据预测曲线给产品标注对应的风险标记。

综上,本发明实施例的计算机可读存储介质先根据产品时序数据构建原始产品特征矩阵以进一步构造目标产品特征矩阵,再将目标产品特征矩阵输入产品数据预测模型得到产品特征预测矩阵以准确预测风险产品,可以降低交易风险,提高客户的交易体验。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。

本发明实施例中所描述的各种说明性的逻辑块,或单元,或装置都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。

本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。

在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

相关技术
  • 养老金产品组合风险预测方法及装置
  • 理财产品的风险预测方法、相关装置及计算机存储介质
技术分类

06120113006945