掌桥专利:专业的专利平台
掌桥专利
首页

基于序列到图的股票趋势预测方法和装置

文献发布时间:2023-06-19 19:28:50


基于序列到图的股票趋势预测方法和装置

技术领域

本发明涉及金融技术领域,尤其涉及一种基于序列到图的股票趋势预测方法和装置。

背景技术

股市被认为是全球最重要的投资场所之一。许多金融机构、银行、法律实体和个人将大量资产投资于这些市场。因此,每个国家的股市都是经济增长的指标之一。这就是为什么股市变化如此重要,以至于它们是由许多因素造成的,如宏观经济形势、新闻、公司财务报告、平行市场状况、投资者的心理和情绪状况、法律成分和其他隐藏因素。因此,投资者和研究人员希望能够准确预测股市趋势。鉴于影响股市的许多因素,机器学习和深度学习方法可以帮助我们改进预测。

目前股票预测领域使用统计分析方法、机器学习方法和深度学习方法做出了各种努力。与此同时,深度学习方法的性能明显优于统计方法或传统机器学习方法。深度学习方法可以根据深度学习架构对模型进行分类。现有技术中有许多不同的方法来确定分类。有些方案使用阈值来确定类,这意味着,如果价格变化率超过α百分比,这被认为是看涨的,如果价格下跌超过α百分比,它被认为是看跌的。然而在,确定这种分类方法时,获得的类将无法平衡,这在模型学习中会造成许多问题。深度学习框架可以很好的平衡这种阈值缺陷,目前利用深度学习来预测股票趋势的时候,有些技术利用图像编码的时间序列和CNN网络来预测趋势,但是这些技术是直接将股票各个时段的k线图像输入至模型中,这种技术仅可以在时间趋势上捕获趋势信息,对股票趋势的空间特征无效。

发明内容

有鉴于此,本发明提供一种基于序列到图的股票趋势预测方法和装置,以解决上述提及的至少一个问题。

为了实现上述目的,本发明采用以下方案:

根据本发明的第一方面,提供一种基于序列到图的股票趋势预测方法,所述方法包括:获取股票交易历史数据中的时序数据;从所述时序数据中采样获得股票的技术指标序列数据;利用水平传播方法将所述技术指标序列数据转换为包含了时空特征的二维图像;将所述二维图像作为卷积神经网络分类模型的输入,经过卷积运算后输出得到股票趋势分类结果。

根据本发明的第二方面,提供一种基于序列到图的股票趋势预测装置,所述装置包括:时序数据获取单元,用于获取股票交易历史数据中的时序数据;指标序列获取单元,用于从所述时序数据中采样获得股票的技术指标序列数据;图像转化单元,用于利用水平传播方法将所述技术指标序列数据转换为包含了时空特征的二维图像;分类预测单元,用于将所述二维图像作为卷积神经网络分类模型的输入,经过卷积运算后输出得到股票趋势分类结果。

根据本发明的第三方面,提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,处理器执行所述计算机程序时实现上述方法的步骤。

根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

根据本发明的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述方法的步骤。

由上述技术方案可知,本发明提出对于股票历史交易数据的预处理方法,将技术指标时间序列数据转换成图,一方面可以有效提高模型的计算效率,另一方面可以在时空中同时学习到股票趋势信息,趋势判断结果更加精准。另外本申请通过对技术指标序列数据组合后的图像数据,采用卷积神经网络方法学习到更易区分的类别,平衡了传统技术中阈值设定方法的不平衡问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1是本申请实施例提供的一种基于序列到图的股票趋势预测方法的流程示意图;

图2是本申请实施例提供的一种基于序列到图的股票趋势预测装置的结构示意图;

图3是本申请实施例提供的图像转化单元的结构示意图;

图4是本申请实施例提供的电子设备的系统构成示意框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。

本申请克服了现有技术基于阈值分类造成的类不平衡问题,解决了深度学习框架下的股票趋势预测分类问题,解决了在时序数据到图数据上的时空特征捕获,使得能够采用图卷积网络在三通道下进行特征学习。如图1所示为本申请实施例提供的一种基于序列到图的股票趋势预测方法的流程示意图,该方法包括如下步骤:

步骤S101:获取股票交易历史数据中的时序数据。

股票交易过程中会产生大量的数据,这些数据大多是和时间相关的数据,比如股票的k线数据、各种技术指标数据、买入卖出数据等,其都具有时间属性,在本步骤中所指的时序数据即带有这种时间属性的数据。

在本实施例中,获取的时序数据的时间段可以根据需要预测股票的趋势时间段来调整,总体来说,预测的趋势时间段越长,需要获取的时序数据的时间段也相应越长,即数据量越大。

步骤S102:从所述时序数据中采样获得股票的技术指标序列数据。

股票中的技术指标是通过统计工具从市场动量、大规模变化和许多其他类型的信息等不同方面获得的代表股市状况的数据,这些信息对所有投资者和交易员都至关重要,是股票趋势判断的重要依据。

优选的,本申请实施例中的技术指标包括但不限于:异同移动平均线MACD、和/或动向指标MDI、和/或三重指数平滑平均线TRIX、和/或能量指标CR、和/或指数移动平均值EMA等。这些数据都是时间线上连续的数据,体现在图表中都是线状或柱状图,因此本实施例可以根据不同的采用频率获取不同时间点上的技术指标数据,使其成为行数为1的矩阵,比如可以通过如下公式(1)来代表该矩阵:

其中S代表技术指标序列,v

因此相应的,本步骤中的采样得到的技术指标序列数据包括但不限于:异同移动平均线MACD序列数据、和/或动向指标MDI序列数据、和/或三重指数平滑平均线TRIX序列数据、和/或能量指标CR序列数据、和/或指数移动平均值EMA序列数据。

优选的,在本实施例中,根据指标的不同,采样得到的技术指标属性可以不同,比如,当技术指标序列数据为异同移动平均线MACD序列数据时,其属性可以通过如下方式得到:利用所述时序数据中MACD数据的长期平滑平均线和短期平滑平均线,计算长期平滑平均线和短期平滑平均线的差离值,以所述差离值作为股票的技术指标序列数据。

当技术指标序列数据为动向指标MDI序列数据时,其属性可以通过如下方式得到:利用所述时序数据中MDI数据的PDI曲线和MDI曲线,以及ADX曲线和ADXR曲线,计算PDI曲线和MDI曲线的差离值,以及ADX曲线和ADXR曲线的差离值,以所述差离值作为股票的技术指标序列数据。

当技术指标序列数据为三重指数平滑平均线TRIX序列数据时,利用所述时序数据中TRIX数据的TRIX曲线和TRMA曲线,计算TRIX曲线和TRMA曲线的差离值,以所述差离值作为股票的技术指标序列数据。

当技术指标序列数据为时序数据中CR数据时,利用所述时序数据中CR数据的CR曲线和股价曲线,计算CR曲线和股价曲线的差离值,以所述差离值作为股票的技术指标序列数据;

当技术指标序列数据为EMA数据时,利用所述时序数据中EMA数据中的短期EXPMA曲线和长期EXPMA曲线,计算短期EXPMA曲线和长期EXPMA曲线的差离值,以所述差离值作为股票的技术指标序列数据。

步骤S103:利用水平传播方法将所述技术指标序列数据转换为包含了时空特征的二维图像。

由上述可知,通过步骤S102后得到的技术指标序列数据是一种一维的趋势特征,该趋势特征只能在时间维度反应该时间节点之前的股票价格对未来股票价格的影响。而本步骤则是将该一维的技术指标序列数据转换成了二维图像,从而使得趋势特征包含了空间特征。这里所指的空间特征是指超出一维时间维度,可以提取到的二维甚至更高维度的特征,在本实施例中即趋势特征不但具有时间维度,还可以有各种技术指标的属性维度。

优选的,为了将上述技术指标序列数据转换为二维图像,本申请的采用水平传播方法具体是通过在技术指标序列数据的末尾添加0来调整输入矩阵的列数(级数),使得列数等于整数N的平方,然后再将该输入矩阵转换为N×N像素的二维矩阵图像。

比如,假设步骤S102得到的技术指标序列的大小是1583,通过在末尾添加17个零,使它达到1600。然后,将阵列转换为高度和宽度各为40像素的二维图像,因此,该二维图像大小为40*40像素。

步骤S104:将所述二维图像作为卷积神经网络分类模型的输入,经过卷积运算后输出得到股票趋势分类结果。

在本实施例中,可以利用二维卷积神经网络(CNN)作为核心分类器,从代表市场属性的二维图像中提取股市的重大波动。卷积神经网络是一种深度学习方法,它接受二维图像作为输入,通过多个过滤器提取图像中的重要特征,并更新其神经网络的权重进行学习。CNN的核心功能是离散卷积操作,如公式(2)。第一个参数(x)通常被称为输入,第二个参数(w)被称为内核,输出s(t)称为特征映射。

卷积运算应用于二维输入类图像,它使用二维离散核(K),内核大小(n*n)是一个需要调整的超参数。为了提取图像中的特征,需要通过卷积运算训练多个滤波器(特征映射S)。为了找到更复杂的功能或功能组件,可以添加额外的层。卷积过程是在带有窗口滑动的图像上执行的,以覆盖图像的所有像素。下式(3)即表示利用卷积核大小为K的滤波器,在二维图像(i,j)上进行卷积操作。

本实施例卷积神经网络分类模型的神经网络层包括第一层、第二层及第三层的三层结构,其中第一层包含一个32神经元的Conv2D网络、一个最大池化MaxPool和一个dropout;所述第二层包含一个64神经元的Conv2D网络、一个最大池化MaxPool和一个dropout;所述第三层包含一个64神经元的Conv2D网络;利用ReLU和Softmax分别是隐藏层和输出层的激活函数。上述最大池化MaxPool可以采用大小为2*2像素来进行池化,在本实施例中,通过两个64个神经元的前馈网络和一个退出网络增强了网络的性能。最后,采用三节点密集层,利用Softmax激活函数预测类标签。经过神经网络提取的特征经过softmax函数操作,可以获得分类结果。

在本实施中,上述获得的分类结果可以包括:空头头寸、多头头寸和持有。空头头寸,意味着在设定时间段开始时卖出和设定时间段结束时买入,持有头寸意味着没有卖出和买入,多头头寸意味着在设定时间段时买入并在设定时间段结束时卖出。

由上述技术方案可知,本发明提出的基于序列到图的股票趋势预测方法,对于股票历史交易数据的预处理方法,将技术指标时间序列数据转换成图,一方面可以有效提高模型的计算效率,另一方面可以在时空中同时学习到股票趋势信息,趋势判断结果更加精准。另外本申请通过对技术指标序列数据组合后的图像数据,采用卷积神经网络方法学习到更易区分的类别,平衡了传统技术中阈值设定方法的不平衡问题。

如图2所示为本发明实施例提供的一种基于序列到图的股票趋势预测装置的结构示意图,该装置包括:时序数据获取单元210、指标序列获取单元220、图像转化单元230和分类预测单元240,它们之间依次相连。

时序数据获取单元210用于获取股票交易历史数据中的时序数据。

指标序列获取单元220用于从所述时序数据中采样获得股票的技术指标序列数据。

图像转化单元230用于利用水平传播方法将所述技术指标序列数据转换为包含了时空特征的二维图像。

分类预测单元240用于将所述二维图像作为卷积神经网络分类模型的输入,经过卷积运算后输出得到股票趋势分类结果。

优选的,上述技术指标序列数据为行数为1的输入矩阵,如图3所示,上述图像转化单元230包括:补齐模块231和转换模块232,其中补齐模块231用于通过在所述输入矩阵的末尾添加0来调整所述输入矩阵的列数,使得所述列数等于整数N的平方;转换模块232用于将所述输入均值转换为N×N像素的二维图像。

优选的,上技术指标序列数据包括:异同移动平均线MACD序列数据、和/或动向指标MDI序列数据、和/或三重指数平滑平均线TRIX序列数据、和/或能量指标CR序列数据、和/或指数移动平均值EMA序列数据。

优选的,上述指标序列获取单元220从所述时序数据中采样获得股票的技术指标序列数据包括:利用所述时序数据中MACD数据的长期平滑平均线和短期平滑平均线,计算长期平滑平均线和短期平滑平均线的差离值,以所述差离值作为股票的技术指标序列数据;和/或利用所述时序数据中MDI数据的PDI曲线和MDI曲线,以及ADX曲线和ADXR曲线,计算PDI曲线和MDI曲线的差离值,以及ADX曲线和ADXR曲线的差离值,以所述差离值作为股票的技术指标序列数据;和/或利用所述时序数据中TRIX数据的TRIX曲线和TRMA曲线,计算TRIX曲线和TRMA曲线的差离值,以所述差离值作为股票的技术指标序列数据;和/或利用所述时序数据中CR数据的CR曲线和股价曲线,计算CR曲线和股价曲线的差离值,以所述差离值作为股票的技术指标序列数据;和/或利用所述时序数据中EMA数据中的短期EXPMA曲线和长期EXPMA曲线,计算短期EXPMA曲线和长期EXPMA曲线的差离值,以所述差离值作为股票的技术指标序列数据。

优选的,上述将卷积神经网络分类模型的神经网络层包括卷积神经网络分类模型的神经网络层包括第一层、第二层及第三层的三层结构,其中第一层包含一个32神经元的Conv2D网络、一个最大池化MaxPool和一个dropout;所述第二层包含一个64神经元的Conv2D网络、一个最大池化MaxPool和一个dropout;所述第三层包含一个64神经元的Conv2D网络;利用ReLU和Softmax分别是隐藏层和输出层的激活函数。

优选的,上述趋势分类结果包括:空头头寸、多头头寸和持有。

上述各个单元的详细描述可以参见前述方法实施例中对应的描述,在此不再继续赘述。

由上述技术方案可知,本发明提出的基于序列到图的股票趋势预测装置,对于股票历史交易数据的预处理方法,将技术指标时间序列数据转换成图,一方面可以有效提高模型的计算效率,另一方面可以在时空中同时学习到股票趋势信息,趋势判断结果更加精准。另外本申请通过对技术指标序列数据组合后的图像数据,采用卷积神经网络方法学习到更易区分的类别,平衡了传统技术中阈值设定方法的不平衡问题。

本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现上述方法。

本发明实施例还提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述方法的步骤。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有执行上述方法的计算机程序。

如图4所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理器130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图4中所示的所有部件;此外,电子设备600还可以包括图4中没有示出的部件,可以参考现有技术。

如图4所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。

其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。

输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。

该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。

存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。

通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。

基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种基于2‑维流预测的股票趋势预测方法
  • 一种股票历史趋势关键点的筛选方法及趋势预测方法
技术分类

06120115919329