一种基于人工智能的金融交易推荐方法及系统

文献发布时间：2023-06-19 10:35:20

技术领域

本申请涉及金融领域，尤其涉及一种基于人工智能的金融交易推荐方法及系统。

背景技术

在量化交易建模场景下，经典方法通常是将统计方法得出来的技术指标在某个时间点的值做为输入信息回测模型(例如五日均线值大于十日均线值这一时间点为买入点)，从信息量和时间点的角度考虑，这些信息的输入为零维信息，信息量少，从而使训练出的模型稳定性不高，失效快；且传统回溯分析技术通常采用参数枚举(暴力破解)点式信息输入、或使用线性回归等方法一维信息输入对数据进行处理；传统数据回溯建模通常基于CPU进行枚举、拟合运算，对数据量较大的样本回溯速度极为缓慢以至于不得不放弃较大的样本数据以满足工程产出要求。

此外，现有技术中，金融风险预测的模型一般都是通用模型，没有根据交易员的交易风格进行个性化定制，难以满足各种不同类型的交易员的需求。

发明内容

为解决上述技术问题，本申请提供一种基于人工智能的金融交易推荐方法及系统。具体的，本发明的技术方案如下：

一方面，本申请公开了一种基于人工智能的金融交易推荐方法，包括：获取待识别的金融数据图像；所述金融数据图像不限定图片尺寸和形状；确定交易风格类型，并根据所述交易风格类型确定预测模型；所述预测模型为训练好的深度神经网络模型；将所述金融数据图像输入所述预测模型；通过所述预测模型对所述金融数据图像做特征提取及识别处理；在所述金融数据图像上输出交易推荐框；并示出所述交易推荐框的类别信息，以及所述交易推荐框的坐标区域信息和/或所述交易推荐框的置信度。

优选地，所述基于人工智能的金融交易推荐方法，还包括：训练指定交易风格的预测模型，具体包括：采集金融数据图像训练样本；在所述金融数据图像训练样本上对含有K线和/或技术指标的特定区域进行标注；基于深度神经网络，构建预测模型；将所述标注后的金融数据图像训练样本输入所述预测模型，通过梯度下降算法对所述预测模型进行有监督学习训练；并采用GPU对模型回溯进行加速；根据所述指定交易风格调节确定所述预测模型的损失函数；所述损失函数中包含有坐标信息损失函数；判断所述预测模型的损失函数值是否达到预设函数值；若是，则训练结束，获得训练好的指定交易风格的预测模型。

优选地，所述基于深度神经网络，构建预测模型；具体包括：若所述指定交易风格为短线交易风格，则基于SSD系列神经网络或所述SSD系列神经网络所形成的变种卷积神经网络，构建短线交易风格的预测模型；若所述指定交易风格为长线交易风格，则基于YOLO系列神经网络或所述YOLO系列神经网络所形成的变种卷积神经网络，构建长线交易风格的预测模型。

优选地，所述预测模型基于所述SSD系列深度神经网络构建，所述预测模型在训练过程中，通过其SSD框架将IOU值大于第一预设值的领域区域标注为正样本；将IOU值小于第二预设值的领域区域标注为负样本；所述第一预设值大于所述第二预设值。

优选地，若所述预测模型基于SSD系列深度神经网络构建，则所述预测模型的损失函数为：

其中：L(x,c,l,g)为损失函数；N为满足某一类别且IOU>0.7领域区域的数量；L

优选地，所述根据所述指定交易风格调节确定所述预测模型的损失函数具体包括：若所述指定交易风格为长线交易风格，则调小所述预测模型的损失函数中的坐标信息损失函数前的系数的值；调小区间在预设的第一调节区间；若所述指定交易风格为短线交易风格，则调大所述预测模型的损失函数中的坐标信息损失函数前的系数的值；调大区间在预设的第二调节区间。

优选地，所述技术指标包括移动平均线、布林轨道、MACD或其它基于K线开盘价、收盘价、最高价和最低价中的一种或几种所计算得出的技术指标。

优选地，通过所述目标预测模型对所述金融数据图像做识别处理具体包括：在所述预测模型的前端框架中，调用预设的接口对所述金融数据图像做尺寸处理，将所述金融数据图像缩放为预设尺寸的金融数据图像；将所述预设尺寸的金融数据图像输入后续的多层卷积神经网络中进行特征提取、特征选择及特征识别处理。

另一方面，本申请还公开了一种基于人工智能的金融交易推荐系统，包括：图像获取模块，用于获取待识别的金融数据图像；所述金融数据图像不限定图片尺寸和形状；模型选取模块，用于确定交易风格类型，并根据所述交易风格类型确定预测模型；所述预测模型为训练好的深度神经网络模型；模型处理模块，用于将所述金融数据图像输入所述预测模型；通过所述预测模型对所述金融数据图像做特征提取及识别处理；模型输出模块，用于在所述金融数据图像上输出交易推荐框；并示出所述交易推荐框的类别信息，以及所述交易推荐框的坐标区域信息和/或所述交易推荐框的置信度。

优选地，所述基于人工智能的金融交易推荐系统，还包括：模型训练模块，具体包括：样本采集子模块，用于采集金融数据图像训练样本；标注子模块，用于在所述金融数据图像训练样本上对含有K线和/或技术指标的特定区域进行标注；模型构建子模块，用于基于深度神经网络，构建预测模型；训练学习子模块，用于将所述标注后的金融数据图像训练样本输入所述预测模型，通过梯度下降算法对所述预测模型进行有监督学习训练；并采用GPU对模型回溯进行加速；损失函数调节子模块，用于根据所述指定交易风格调节确定所述预测模型的损失函数；所述损失函数中包含有坐标信息损失函数；判断输出子模块，用于判断所述预测模型的损失函数值是否达到预设函数值；若是，则训练结束，获得训练好的指定交易风格的预测模型。

优选地，所述模型构建子模块包括：短线模型构建单元，用于当所述指定交易风格为短线交易风格时，基于SSD系列神经网络或所述SSD系列神经网络所形成的变种卷积神经网络，构建短线交易风格的预测模型；长线模型构建单元，用于当所述指定交易风格为长线交易风格时，基于YOLO系列神经网络或所述YOLO系列神经网络所形成的变种卷积神经网络，构建长线交易风格的预测模型。

本申请至少包括以下一项技术效果：

1)本申请中建模特征信息提取是在二维的图片中进行，较传统点式信息样本高出了两个维度；从时间角度来说，图片区域是多时刻一纬连续数据，较传统点式样本在时间轴上高出了一个维度。从而使得神经网络在有监督学习过程中提取到了更多的信息量，学习到了更稳定的规律；

2)在样本标注方面，本申请是在某一特定周期二级市场金融原图(尺寸不限，可以是大图)上直接进行块状区域标注制作样本，而非裁剪出块状区域，这就提高了样本制作效率，节约人工支出；

3)在样本输入方面，本申请是将带有标注信息的金融原图(尺寸不限，可以是大图)直接送入深度神经网络模型进行特征提取及模型训练，而非裁剪后的块状区域，这就实现了“端到端”一步输入法，提高了模型输入环节的样本读取速度；

4)在模型训练过程中，采用SSD框架会自动标注正负样本。比如，将IOU值>0.7的领域区域标注为正样本，IOU<0.3的领域区域标注为负样本，这样模型在训练过程中，不仅能学习到标注区域内的技术特征，而且也能学习到标注区域领域的技术特征、以及领域与标注区域技术特征之间的复杂关系，从而极大提高模型的稳定性；

5)通过本申请训练好的预测模型在实际使用过程中，交易人员只需要手动(或计算机自动)一次性地截图某一时期内的整张二级市场金融原图(大图)送入预测模型即可，而无需再做出对输入图片大小、形状是否与训练样本类似的判断，从而节约了人工决策成本；

6)本申请在一般的图像分类损失函数的基础上，加入了坐标信息损失函数，因此在下训练过程中，使得神经网络既学习到了标注区域的类别信息、同时也学习到了类别区域(交易预测框)的坐标信息；

7)本申请训练好的模型在实际应用中，返回值除了分类信息、分类置信度信息外，还会返回类别检测区域的坐标值，并将此三种信息通过计算机自动绘制于原图中，结果非常直观，图文并茂，方便交易人员观测和使用；

8)本申请基于不同交易风格，构建不同的卷积神经网络预测模型，满足不同风格交易者的需求。具体的，比如基于YOLO系列深度神经网络构建长线交易风格的长线预测模型；基于SSD系列深度神经网络构建短线交易风格的短线预测模型。

9)本申请对SSD框架的损失函数进行了业务场景应用改进，同样可以达到不同风格交易者(短线交易者、长线交易者、长短线兼顾者)使用的要求，增强了在金融量化领域中实用性。

10)最后，本申请在工程化中，选用了GPU对模型回溯进行加速，极大地提高了建模速度，实现了该方法的工程产出。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为实施例一基于人工智能的金融交易推荐方法的流程图；

图2为实施例二中的指定交易风格的预测模型的训练方法流程图；

图3为损失函数的值随着训练迭代次数的增加而逐步减小示意图；

图4为YOLO框架检测速度示意图；

图5为Vgg网络变种在SSD框架中的结构示意图；

图6为基于卷积神经网络构建的预测模型工作原理示意图；

图7为IOU面积计算方法示意图；

图8a为基于卷积神经网络构建的预测模型输出分类信息示意图；

图8b为基于卷积神经网络构建的预测模型输出1个类别值、1个置信度值和4坐标值的示意图；

图9为实施例六基于人工智能的金融交易推荐系统的框架图；

图10为实施例七基于人工智能的金融交易推荐系统的框架图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。

为使图面简洁，各图中只示意性地表示出了与本申请相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘出了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

还应当进一步理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

另外，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对照附图说明本申请的具体实施方式。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

【实施例一】

本实施例公开了一种基于人工智能的金融交易推荐方法，如图1所示，包括：

S101，获取待识别的金融数据图像；所述金融数据图像不限定图片尺寸和形状；具体的，金融数据图像是指二级市场金融数据图像，比如K线图，或者金融行情图等，本申请中不限定待识别的金融数据图像的尺寸和形状，不管是大图还是小图，圆形图还是方形图，都可以进行识别预判。

S102，确定交易风格类型，并根据所述交易风格类型确定预测模型；所述预测模型为训练好的深度神经网络模型；

具体的，本实施例中，可以根据交易风格类型的不同，训练了不同类型的预测模型，从而可以满足不同风格交易者的需求。交易风格包括长线交易、短线交易、长线、兼顾长线和短线的交易等。这些不同类型的预测模型可以是基于不同框架的深度神经网络构建；当然，也可以是基于同一框架的深度神经网络而构建，只是损失函数的参数设定有所不同，亦可以二者兼而有之，比如基于SSD神经网络来构建短线交易的预测模型，但是又可以通过设置不同的损失函数来进一步对短线交易模型进一步细分，比如七日短线预测模型、半月短线交易模型等，而这些不同的短线预测模型，则是通过调节SSD神经网络的损失函数中的参数值来实现的。

S103，将所述金融数据图像输入所述预测模型；

无需对该金融数据图像做任何裁减或其它处理，直接将该金融数据图像输入到选取的目标预测模型中即可，方便快捷。此外，由于无需再做出对输入图片大小、形状是否与训练样本类似的判断，从而节约了人工决策成本。

S104，通过所述预测模型对所述金融数据图像做特征提取及识别处理；

S105，在所述金融数据图像上输出交易推荐框；并示出所述交易推荐框的类别信息，以及所述交易推荐框的坐标区域信息和/或所述交易推荐框的置信度。

具体的，将待识别的金融数据图像输入到目标预测模型中后，该目标预测模型进行识别处理后，便会自动在该金融数据图像上绘制出交易推荐框，并标示出该交易推荐框的类别信息，是买入还是卖出，或者说是行情上涨还是行情下跌；此外，还会输出各交易推荐框的坐标位置信息，让交易员能够直观的了解到应该在哪一段进行相应的交易操作；更佳的，还可以输出该交易推荐款的置信度，从而交易者能据此做一个大致的交易风险预估参考。

本实施例中，对金融交易的推荐是基于深度神经网络模型，对二维的金融数据图像片进行识别预测的，较传统单单只提供数据这类点式信息样本高出了两个维度；从时间角度来说，图片区域是多时刻一纬连续数据，较传统点式样本在时间轴上高出了一个维度。从而使得基于深度神经网络的预测模型能提取到了更多的信息量，学习到了更稳定的规律，进而给出更为精准的交易推荐。

此外，本申请根据交易风格来确定用于预测的神经网络模型，为不同类型风格的交易者提供更为贴合的交易推荐预测，从而大大提高了用户的体验度，也更符合各交易者的需求，最终输出的交易推荐信息也更为精准。

【实施例二】

本实施例，在上述实施例一的基础上，增加了训练指定交易风格的预测模型的方法流程，具体的，如图2所示，本实施例中的训练指定交易风格的预测模型具体包括：

S201，采集金融数据图像训练样本；

一般的，采集的金融数据图像训练样本都是二级市场的金融数据图。一般地，二级市场金融数据图可以是原图(大图)，也可以是小图。对于大图的大小可根据交易者使用的终端显示器大小而定，例如显示终端的分辨率为1920*1080，则金融数据图(大图)的大小则为打开行情软件后所显示的包含有K线和(或)金融指标的近乎于1920*1080的区域，也可根据交易者喜好自行设定大小，本实施例对于采集的训练样本的金融数据图的大小尺寸及形状并无具体要求；

S202，在所述金融数据图像训练样本上对含有K线和/或技术指标的特定区域进行标注；

具体的，在获取到进入金融数据图像训练样本后，在金融数据图像训练样本上使用Image软件对感兴趣图像区域(特定区域)进行标注，这里需指明的是，仅在金融数据图上进行区域标注即可，不需要将标注区域截取另外保存，从而节约了人工成本。

较佳的，所述技术指标包括移动平均线、布林轨道、MACD或其它基于K线开盘价、收盘价、最高价和最低价中的一种或几种所计算得出的技术指标。也就是说标注区域可以为历史数据中带有技术指标(例如均线、MACD、布林轨道等行情分析中称之为技术指标物件)和(或)K线的行情上涨、下跌的起点区域，也可以为某类行情正在发生时的某部分区域。

S203，基于深度神经网络，构建预测模型；

具体的，这个预测模型可以是VggNet系列(包括但不限于VggNet11、VggNet13、VggNet16、VggNet19)、ResNet系列、LeNet、AlexNet、GoogleNet、Inception网络系列(包括但不限于Inception-V1、Inception-V2、Inception-V3、Inception-V4)、darkeNet系列(包括但不限于darkNet19、darkeNet53)、以及基于以上网络所形成的变种卷积神经网络模型；也可以说是基于SSD系列、YOLO系列(YOLO1、YOLO2、YOLO2、YOLO2)、RCNN系列(RCNN、Fast-RCNN、Faster-RCNN)、Mast-RCNN系列)神经网络所形成的预测模型。

不同的交易风格可以采用同一类型的神经网络模型，也可以采用不同类型的神经网络模型。本实施例中未限定。

S204，根据所述指定交易风格调节确定所述预测模型的损失函数；所述损失函数中包含有坐标信息损失函数；

具体的，根据不同交易风格调节确定预测模型的损失函数，比如，若不同交易风格的预测模型是采用的不同类型的神经网络模型来构建，那么便可依据根据交易风格确定的神经网络模型来确定损失函数；如果不同交易风格的预测模型都是采用的同一类神经网络模型构建，则可以通过调节该类神经网络模型(预测模型)的损失函数中的参数值来满足不同交易风格需求。

S205，将所述标注后的金融数据图像训练样本输入所述预测模型，通过梯度下降算法对所述预测模型进行有监督学习训练；并采用GPU对模型回溯进行加速；

具体的，将含有标注信息的二级市场金融数据图(训练样本)整体送入到基于深度神经网络构建的预测模型中进行有监督学习训练。本实施例中，通过计算机编程语言实现梯度下降算法对损失函数残差(即为损失函数值)求偏导数进行反向传导，更新卷积神经网络中卷积核中的权重参数，卷积核中的权重参数每更新一次，那么输入下一个训练样本时所产生的预测值就离真实标注值越接近，这时就会产生一个新的残差(新的预测值与标注真实值的置信度和坐标信只差)，再根据梯度下降算法继续对残差进行反向求偏导传播，由于每一次神经网络权重的跟新都会是的下一张样本的输出值离真实标注值更加接近。

上述的通过计算机编程语言实现梯度下降算法，其中计算机语言包括但不限于c、c++、matlab、pyhton、go、java、scala等能够实现整套技术方案在金融二级市场行情判断并返回坐标值的实际实现计算机语言。梯度下降算法包括但不限于：批量梯度下降(BatchGradient Descent)、随机梯度下降(Stochastic Gradient Descent)以及小批量梯度下降(Mini-Batch Gradient Descent)。

且在模型训练过程中，使用GPU加速功能对训练样本图片回溯、测试，从而形成了一个稳定、高效获取信息规律的方法。且选用了GPU对模型回溯进行加速，极大地提高了建模速度，实现了该方法的工程产出。

进一步的，在训练样本输入前，还需对预测模型参数进行一定的配置，参数的配置一般选取BatchSize为32～192之间；模型训练终止条件设为损失函数值小于0.5；BatchSize是指每次送入模型中的样本数量值。

S206判断所述预测模型的损失函数值是否达到预设函数值；若是，则进入步骤S207；

S207，则训练结束，获得训练好的指定交易风格的预测模型。

因此通过上述步骤S205反复的迭代训练，最后使的损失函数值小于预设的值，比如预测模型的损失函数值小于0.5时停止训练，即完成了模型的训练。上述这种反复迭代的技术方法为增量训练方法，即为不断且重复性的带入样本求解神经网络构成的高维线性方程组，寻找局部最优解(即尽可能满足最多的线性方程组的解，由于线性方程组参数过多，全部满足不一定能够达到。

如图3所示，在训练过程中，损失函数的值随着神经网络迭代次数的增加而逐步减小；当达到预设函数值后，则迭代训练结束，预测模型训练好了。那么就可以利用该预测模型来识别金融数据图像，推荐金融交易点了。

训练好后，便可通过该训练好的预测模型来在金融数据图上预测交易行情了，进而给到交易者交易推荐参考。交易者只需将金融数据图输入该预测模型，预测模型便会自动在该金融数据图上自动绘制出交易推荐框，示出交易推荐框的类别(比如行情上涨、行情下跌)及坐标位置信息，还可以示出该交易推荐框的置信度。比如输入一张金融数据图至预测模型后，该预测模型在该金融数据图上输出各推荐交易框，推荐交易框有两种类别：up为行情上涨，down为行情下跌，此外，还输出预测该交易推荐框的置信度，预测模型还可以有效地标记出交易推荐框的矩形坐标区域，达到工程产出要求。

当然，采用该预测模型来预测的金融交易推荐框，是偏向于训练时指定的交易风格的。

较佳的，本实施例中的损失函数包含分类置信度损失函数和位置信息损失函数。为了满足不同交易员风格(短线交易或长线交易)，可以在训练是通过调节损失函数中坐标信息损失函数前的Alpha系数来实现，其中Alpha系数可以置于坐标损失函数之前，根据原理同样地也可以置于置信度损失函数之前。本方案中所使用的损失函数既可以为分类置信度损失函数与坐标回归损失函数的拉格朗日乘子法相加后的函数共同进行梯度下降训练；也可以是置信度损失函数和坐标归回损失函数分开依次迭代进行梯度下降训练。

本实施例尽管在特征提取方面也使用到了卷积神经网络，但在分类方面并未使用聚类或者强化学习，而是构造了新的同时置信度损失函数和位置信息的损失函数，通过梯度下降算法(一种求解高维线性方程组的算法)对模型进行了有监督学习。这样就可以让神经网络权重分布中既包含了(学习到)样本区域的分类信息也包含(学习到)了样本区域在某一周期内整张金融数据图片中的位置信息；这样在模型的使用过程中，只需传入某一周期内整张金融数据图，就可一次性地在原图上输出(标记)分类区域及分类置信度两种信息，结果展示非常直观；另外，本方法也对损失函数系数进行了业务场景应用方面的探索，总结出满足不同风格交易者(短线交易者、长线交易者、长短线兼顾者)使用要求的规律，极大地增强了该方法在金融量化领域中实用性。

【实施例三】

本实施例基于上述实施例二的基础上，进一步细化阐述了基于交易风格的不同，在模型训练学习过程中如何操作，使得最终获得的预测模型更符合指定的交易风格。具体可通过以下方式实现：

(1)根据交易风格类型的不同，采用不同的深度神经网络构建预测模型。即上述实施例二中的步骤S203具体包括：

若所述指定交易风格为短线交易风格，则基于SSD系列神经网络或所述SSD系列神经网络所形成的变种卷积神经网络，构建短线交易风格的预测模型；

若所述指定交易风格为长线交易风格，则基于YOLO系列神经网络或所述YOLO系列神经网络所形成的变种卷积神经网络，构建长线交易风格的预测模型。

具体的，SSD相对于更早的目标检测框架(Faster-RCNN)来说，去掉了卷积层之后全连接结构，这就使得整个框架运行速度得到了大大的提升；同时SSD较之前的目标检测框架(Faster-RCNN)采用了更多的“建议框”在特征图上采样，弥补了去除全连接所造成的精度下降缺陷。在英伟达泰坦显卡上对SSD框架性能进行测试，对于300*300的高清图片，SSD的检测精度为74％；对于512*512更高分辨率的图像进行检测，精度则可高达77％，这就优于更早的目标检测框架(Faster-RCNN)；同时SSD512的检测速度也较之前的目标检测框架提升了2倍，SSD300的检测速度为之前的目标检测框架的将近7倍，这就使得SSD无论是在模型训练和模型运用中都更加有利用工程化。因为其精度很高，在本业务场景中更加适合短线交易者模型训练。

YOLO框架相对于Faster-RCNN和SSD框架最大的特点是在感兴趣区域的采集方面仅仅使用了2个“建议框”，分别是Faster-RCNN的将近1/4(四分之一)，是SSD的1/12(十二分之一)，这就使得检测速度(fps，帧每秒)得到了大幅度的提升，但这样也容易导致精度的下降，如图4所示，YOLO精度为66％，但是其速度却得到了大幅度提升，fps达21帧每秒，是Faster-RCNN的3倍。在本业务场景中，对于长线交易者来说，止损更大，这就意味着有更大地容错空间，因此YOLO更适合长线交易者。

(2)根据交易风格类型的不同，调节预测模型的损失函数的参数值。

不同交易风格的预测模型可采用同一类深度神经网络模型，也可以采用不同类的深度神经网络模型。本实现方式中不限定构建的预测模型的基本框架。而只是在对构建的预测模型的损失函数进行调节，从而获得指定交易风格的预测模型。预测模型的损失函数中包含有坐标信息损失函数。即上述实施例二中的步骤S204具体包括：

若所述指定交易风格为长线交易风格，则调小所述预测模型的损失函数中的坐标信息损失函数前的系数的值；调小区间在预设的第一调节区间；

若所述指定交易风格为短线交易风格，则调大所述预测模型的损失函数中的坐标信息损失函数前的系数的值；调大区间在预设的第二调节区间。

一般的，默认的坐标信息损失函数前的系数a值为1，若指定交易风格为长线交易风格，则可以将a的值调小，最小可调节到0.01，调得越小，则更偏短线交易；预设的第一调节区间即a的调节区间为0.01--1之间。

若指定的交易风格为长线交易，则可将a的值调大，一般最大可调节到30，调的越大，则预测越偏长线交易；预设的第二调节区间即a的调节区间为1--30之间。

比如，若所述预测模型基于SSD系列深度神经网络构建，则所述预测模型的损失函数为：

其中：

L(x,c,l,g)为损失函数；

N为满足某一类别且IOU>0.7领域区域的数量；

x表示SSD类别示性函数；

c表示置信度；

l表示SS框架坐标信息输出值；

g表示标注样本坐标信息输出值；

α表示Alpha，为拉格朗日乘子，一个常数，缺省值为1。

如以上整体损失函数所示，由于本实施例中的损失函数构造由拉格朗日乘子法得出，因此可通过调整拉格朗日乘子α(即Alpha)值的大小，来满足不同风格(长线、短线或长短线兼顾)交易员的使用的需求。一般来说短线交易者对盈亏比要求不高，对入场点位精度要求高，这样可以通过提高Alpha的值来实现；而长线交易者更加看重盈亏比，对入场点位的精度要求不是很高，这样就可以通过降低Alpha的值来实现。如果是长短兼顾，则要选取一个中间值来实现。

本方法结合该领域工程实践要求，为了增强本方法的工程实践性，满足不同投资者的使用需求，对损失函数中的Alpha值进行了改进。一般地，在二级市场金融量化投资领域中，对行情的判断希望获取的两个最为重要的信息是：行情方向和入场点位。行情方向决定了投资最终能否获利；而行情点位的确立可以帮助投资者确定止损位置，为此笔投资的风控提供重要的参考依据。从金融投资角度考虑，一般来说，短线操作者通常情况下看到的K线周期较小，这就导致了盈亏比较低，因此希望入场点位更加精确；而长线操作者通常看到的K线周期较大，这就导致了单笔投资盈亏比较高，因此对入场点位的精度要求不是很高，而侧重行情方向的判断；因此不同的投资者，可以通过调节Alpha值来达到对行情方向和入场精度的侧重需求。本方法中，结合损失函数构造原理与使用场景，得出以下建议结论：Alpha值的减小则侧重于短线交易，即使得模型在预测过程中的入场点位更加精确；Alpha值的增大则侧重于长线交易，即使得模型在预测过程中的行情方向判断更加精确。

【实施例四】

本实施例在上述任一实施例的基础上，重点阐述下构建的预测模型及其损失函数。

一般地，训练采集的二级市场金融数据图的大小尺寸及形状并无具体要求；确定好金融数据图(比如大图)后，就在此大图中使用Image软件对感兴趣图像区域进行标注，这里需指明的是，仅在金融数据图(大图)上进行区域标注即可，不需要将标注区域截取另外保存，从而节约了人工成本；标注区域可以为历史数据中带有技术指标(例如均线、MACD、布林轨道等行情分析中称之为技术指标物件)和/或K线的行情上涨、下跌的起点区域，也可以为某类行情正在发生时的某部分区域；

标注完成后，将含有标注信息的二级市场金融数据图(大图)整体送入到一个卷积神经网络(CNN)中进行特征提取。(这个卷积神经网络可以是VggNet系列(包括但不限于VggNet11、VggNet13、VggNet16、VggNet19)、ResNet系列、LeNet、AlexNet、GoogleNet、Inception网络系列(包括但不限于Inception-V1、Inception-V2、Inception-V3、Inception-V4)、darkeNet系列(包括但不限于darkNet19、darkeNet53)、以及基于以上网络所形成的变种卷积神经网络。也就是说可以是YOLO系列、SSD系列以及基于上述系列网络所形成的变种卷积神经网络。

本例中以Vgg16为例说明问题，以Vgg16为框架，构建预测模型。vgg网络结构如图5所示。含有标注信息的二级市场金融数据图(大图)送入到图5所示卷积神经网络中，SSD框架中的程序设定后会自动调用Tensorflow或者Opencv接口(具体使用何种接口由程序设计人员自己决定，两种皆可)将输入的大图调整为300*300(如图5最左端所示)大小(也就是说将尺寸近乎于1920*1080的含有标注信息的二级市场金融数据图(大图)调整为300*300)再送入到后续的卷积神经网络中去做特征提取；卷积神经网络会使用多个卷积核对输入图片区域以1个像素点为步长从左到右，从上到下作扫描，原理示意图如图6所示。

需要特别指出的是，SSD框架会自动将IOU>0.7的区域标注为正样本，IOU<0.3的标注为负样本，这样模型在训练过程中，不仅能学习到标注区域内的技术特征，而且也能学习到标注区领域的技术特征以及领域与标注区域技术特征之间的复杂关系，从而提高模型的稳定性。IOU面积计算方法如图7所示：

IOU的计算公式如下：

A—A图的面积

B—B图的面积

∩—交集运算符

∪—并集运算符

如图7所示，IOU表示A图与B图面积的交集处除以A图与B图面积的并集。A、B完全重叠则为1，完全不相交则为0，因此IOU为A与B相交程度的度量，取值范围为0～1。

再回到图6，接着往下说，卷积神经网络的特征提取过程为卷积核(Convlolutionkernel)与原图(Source pixel)像素对应相乘再相加(高等数学中称之为点积运算)，然后输出一个计算后的值(图中为-8)。需要特别指出的是本方法所使用的卷积运算除了输出运算后的特征值外，还需要对这个特征值做进一步的处理，输出1个类别值、1个置信度值和4坐标值如图8b所示。

也就是说本例中的-8这个值，还要被1个1*1的卷积核继续扫描，映射输出分类信息和坐标信息。图8a为分类信息的输出，假设输出类别为上涨、下跌两类(多类则输出多个值)，则-8就映射出了两个数值，分别在位置上对应图8a中的上涨、下跌类别，这两个位置谁的值最大，则就被认为是属于哪一类。由于输出的两个值不一定小于1，为了得到一个概率值需要采用一个叫做Softmax的算法做归一化处理，计算公式如下：

exp—自然指数，大于1，为增函数；

i—某一个样本(IOU值大于0.7的领域)的序号；

p—类别，本方法举例说明中共为2类，分别是上涨或下跌；

∑—求和符号；

公式解释如下：某一样本属于第p类的置信度，就等于该样本通过卷积神经网络映射到第p类位置的数值除以该样本通过卷积神经网络映射到所有类数值的和，例如：某一个区域是上涨的概率为此区域经过卷积神经网络后的数值点(例如-8)经过映射后在上涨位置的值除以上涨位置的值与下跌位置值之和。(在计算过程中加入了指数，是为了让置信度计算函数更加平滑，方便后续损失函数的计算。损失函数将在后文中详细说明)

另外，需要特别指出的是，通过置信度计算，如果该样本被判别为上涨类别，则在图8b第二个位置输出0(0为类别符号，本方法举例中0为上涨，1为下跌)，并且在图8b第三个位置则输出置信度的值(0～1之间的值)，图8b第1个位置输出的是一个索引(即序列号)；第4～7个位置则输出样本的坐标信息，分别为该领域中心点坐标(cx,cy)和该矩形领域的高宽(h、w)。也就是说本方法除了能够通过训练，预测出二级市场金融数据图(大图)中某个矩形区域的类别(上涨还是下跌)、置信度(上涨或是下跌的概率值)外，还可以通过训练，预测出该矩形区域在图中的具体的位置，并将此区域自动绘制在二级市场金融数据图(大图)中。这种功能的实现，极大的方便了交易人员的日常工作，交易人员不再需要对金融大图中的实时行情图多次手动截取块状区域送入模型中进行判别，从而节约了人工成本；另外，交易人员也无需考虑在金融大图中截取的区域大小、形状是否满足模型要求，而是直接将近乎于1980*1080或者任意尺寸的图片整张送入训练好的模型即可，从而节约了决策成本；这种实用功能的实现是通过构造以下损失函数实现的：

其中：L(x,c,l,g)为损失函数；N为满足某一类别且IOU>0.7领域区域的数量；L

该损失函数的特别之处在于根据拉格朗日乘子法在分类损失函数Lconf(x，c)的基础上加入了Lloc(x，l，g))位置损失函数，从而使神经网络在有监督学习过程中，学习到了类别和坐标值双重信息。通过拉格朗日乘子法将两部分损失函数相加，简化了流程，提高了模型的学习效率。关于位置损失函数，更加详细地表征如下：

其中，

N—满足某一类别且IOU>0.7领域区域的数量；

i—某一个样本(IOU值大于0.7的矩形区域形区域)领域区域的序号；

Pos—Positive，正样本；

m—标注样本领域区域中心点坐标(cx,cy)和该矩形领域的高宽(h、w)；

Smooth

本方法对于类别置信度输出和坐标位置输出，都遵循了残差最小原理，即通过计算机运行反向梯度求导运算，不断更新神经网络参数权重系数，从而迫使得模型输出值与真实标注值之间的差值

此外，本实施例中，SSD框架会自动将IOU值>0.7的领域区域标注为正样本，IOU<0.3的领域区域标注为负样本，这样模型在训练过程中，不仅能学习到标注区域内的技术特征，而且也能学习到标注区域领域的技术特征、以及领域与标注区域技术特征之间的复杂关系，从而极大提高模型的稳定性。当然，在实际操作中，也可以根据需求设置用于作为正样本判断参考的第一预设值；以及用于作为负样本判断参考的第二预设值。比如第一预设值为0.8；第二预设值为0.2。

【实施例五】

本实施例基于实施一的基础上，对实施例一中的步骤S104进行了详细阐述。具体的，实施例一中的步骤S104通过所述目标预测模型对所述金融数据图像做识别处理具体包括：

在所述预测模型的前端框架中，调用预设的接口对所述金融数据图像做尺寸处理，将所述金融数据图像缩放为预设尺寸的金融数据图像；

将所述预设尺寸的金融数据图像输入后续的多层卷积神经网络中进行特征提取、特征选择及特征识别处理。

比如，SSD框架中的程序设定后会自动调用Tensorflow或者Opencv接口(具体使用何种接口由程序设计人员自己决定，两种皆可)将输入的大图调整为300*300(如图1最左端所示)大小(也就是说将尺寸近乎于1920*1080的含有标注信息的二级市场金融数据图(大图)调整为300*300)再送入到后续的卷积神经网络中去做特征提取。

本实施例中，金融大图尺寸可以为任意尺寸大小，本方案对输入图片大小并无要求，因为本技术算法方案可以对任意尺寸图片进行像素重排至统一大小。此外，在模型训练过程中，可在原有训练样本大图上直接标注即可，无需从原图中对次特定区域进行裁剪分离，大大节约人力支出；训练时将含有标注信息的整张大图片信息送入模型进行训练或预测，无需送入特定裁剪区域，以节约人力支出。当然，最终使用时，也无需对待识别的金融数据图像的尺寸大小或形状做约定。

【实施例六】

本实施例公开了一种基于人工智能的金融交易推荐系统，该金融交易推荐系统可采用上述实施例一至实施例五中的任一金融交易推荐方法。具体的，本实施例的金融交易推荐系统如图9所示，包括：

图像获取模块100，用于获取待识别的金融数据图像；所述金融数据图像不限定图片尺寸和形状；

模型选取模块200，用于确定交易风格类型，并根据所述交易风格类型确定预测模型；所述预测模型为训练好的深度神经网络模型；

模型处理模块300，用于将所述金融数据图像输入所述预测模型；通过所述预测模型对所述金融数据图像做特征提取及识别处理；

模型输出模块400，用于在所述金融数据图像上输出交易推荐框；并示出所述交易推荐框的类别信息，以及所述交易推荐框的坐标区域信息和/或所述交易推荐框的置信度。

【实施例七】

本实施例在上述实施例六的基础上，如图10所示，所述基于人工智能的金融交易推荐系统，还包括：

模型训练模块500，具体包括：

样本采集子模块510，用于采集金融数据图像训练样本；

标注子模块520，用于在所述金融数据图像训练样本上对含有K线和/或技术指标的特定区域进行标注；

模型构建子模块530，用于基于深度神经网络，构建预测模型；

损失函数调节子模块540，用于根据所述指定交易风格调节确定所述预测模型的损失函数；所述损失函数中包含有坐标信息损失函数；

训练学习子模块550，用于将所述标注后的金融数据图像训练样本输入所述预测模型，通过梯度下降算法对所述预测模型进行有监督学习训练；并采用GPU对模型回溯进行加速；

判断输出子模块560，用于判断所述预测模型的损失函数值是否达到预设函数值；若是，则训练结束，获得训练好的指定交易风格的预测模型。

较佳的，所述模型构建子模块包括：

短线模型构建单元，用于当所述指定交易风格为短线交易风格时，基于SSD系列神经网络或所述SSD系列神经网络所形成的变种卷积神经网络，构建短线交易风格的预测模型；

长线模型构建单元，用于当所述指定交易风格为长线交易风格时，基于YOLO系列神经网络或所述YOLO系列神经网络所形成的变种卷积神经网络，构建长线交易风格的预测模型。

较佳的，所述根据所述指定交易风格调节确定所述预测模型的损失函数具体包括：

若所述指定交易风格为长线交易风格，则调小所述预测模型的损失函数中的坐标信息损失函数前的系数的值；调小区间在预设的第一调节区间；

若所述指定交易风格为短线交易风格，则调大所述预测模型的损失函数中的坐标信息损失函数前的系数的值；调大区间在预设的第二调节区间。

本实施例主要对模型训练模块进行了详细阐述，特别是针对不同的交易风格可采用不同的预测模型。具体的技术细节可参见前面的方法实施例三的详细阐述，此处不再赘述。

本申请的系统实施例与方法实施例对应，本申请中的方法实施例一至五的技术细节同样适用于本申请的方法实施例，为减少重复，不再赘述。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘晓辉;李强;
专利申请人：刘晓辉;

上一篇：一种车用标识灯控制方法及系统
下一篇：多火点灾害下电网连锁故障风险最小化处置方法及系统