您的当前位置:首页正文

基于DBN的金融时序数据建模与决策

来源:好兔宠物网
第27卷第4期 计算机技术与发展 COMPUTER TECHNOLOGY AND DEVELOPMENT 2017年4月 Vo1.27 No.4 Apr. 2017 基于DBN的金融时序数据建模与决策 曾志平 ,萧海东 ,张新鹏 (1.上海大学通信与信息工程学院,上海200072; 2.中国科学院上海高等研究院智慧城市研究中心,上海201210) 摘要:在金融时序数据的分析中经常会遇到一些复杂的非线性系统,利用数学方法很难对这些复杂的系统状态方程准 确建模。针对目前金融时序的数据分析复杂性和不确定性等问题,将对复杂非线性系统的模拟转化为对金融时序数据曲 线的模式识别,确定了金融时序数据上升、下降以及无规则的各种模式。利用深度学习对非结构化数据处理的优势,提出 了一种改进的基于深度信念网络(DBN)决策算法的金融时序数据建模与分析方法。将时序数据转化为非结构化数据,以 这些非结构化数据作为深度学习网络的输入层训练DBN金融时序数据模型,应用训练好的模型于金融时序数据样本的预 测选取和交易。实验结果表明,利用DBN模型选择的金融数据样本在金融时序数据量化的决策分析中的准确率可达到 90.544 2%。 关键词:深度信念网络;受限玻尔兹曼机;深度学习;金融时序数据;预测与决策 中图分类号:TI ̄91.41;F830.59 文献标识码:A 文章编号:1673—629X(2017)04-0(01-05 doi:10.3969/j.issn.1673—629X.2017.04.001 Modeling and Decision-making of Financial Time Series Data with DBN ZENG Zhi—ping ,XIAO Hai—dong ,ZHANG Xin—peng (1.School of Communication and Information Engineering,Shanghai University,Shanghai 200072,China; 2.Research Center of Smart City,Shanghai Advanced Research Institute,Chinese Academy of Sciences, Shanghai 201210,China) Abstract:In analysis of the financil taime series data,some complex nonlinear systems are often encountered.It is diiculft to accurately model the state equation of heste complex systems wittI mathematical methods.Faced wih tthe current problem of complexity and uncer- tainty of inafncial time series analysis,simulations of complex nonlinear systems has been translated into panem recognition of inafncial itme series data and various patterns of financil taime series curves,such as ascending,declining and rndom,have been detaermined.By taking use of he advatntages of deep learning in unstructurd datea processing,an improved financial time series modeling and analysis method wiht improved Deep Belief Network(DBN)decision-making algorithm has been proposed,by which time series data have been transformedinto unstructured datato betakenasinput ofinputlayertrainingmodelforin-depthlearning networkandto usetrainedmod— el to predict the inancifl taransaction data sample selection.Experimental results show that the accuracy rate acquired by improved deep belief network method has been achieved by 90.544 2 percent in quantiattive analysis offinal samples. Key words:deep belief network;Restircted Boltzmann Machine(RBM);deep learning;financial time series data;forecasitng and deci- sion O 引 言 目前对于金融时序数据分析的方法主要有两类: 基本面分析和技术面分析 。基本面分析是研究影响 市场过去和现在的行为对金融市场未来走势的影响。 许多利用计算机的模型如遗传算法、人工神经网络、支 持向量机等金融数据分析的方法属于技术分析方 证券市场供给和需求的各种因素;技术面分析是研究 法 。现今大多数金融数据分析方法都是基于技术面 收稿日期:2016—06—22 修回日期:2016—09—28 网络出版时间:2017—03-07 基金项目:国家自然科学基金资助项目(61271349);中国科学院科技服务网络计划(STS计划)项目(KFJ—Ew— rs一140);中科院先导项目 (XDA06010800);上海市科学技术委员会资助课题(14DZ1119100) 作者简介:曾志平(1989一),男,硕士生,研究方向为大数据分析;萧海东,副研究员,研究方向为大数据分析、信息安全、智能数据融合、物联网; 张新鹏,教授,研究方向为图像处理、多媒体信息安全。 网络出版地址:http://kns.cnki.net/kcms/detail/61.1450.TP.20170307.0922.094.html ・2- 计算机技术与发展 第27卷 分析的方法。技术面分析主要分析市场数据的特征和 社会舆情对市场的影响。其中文献[3]利用微博采集 个人数据中个人的情感倾向分析研究经济市场走向, 但利用情感数据分析市场包含太多主观因素,使得分 析结果带有很大的模糊性,不利于定量化分析。文献 [4]讨论了利用小波分析对股指期货市场收盘价的研 究并进行了有效验证,但没有提出行之有效的对整个 金融市场中金融样本进行分析的方法。文献[5]分析 了布林指标、移动平均线等指标的协同作用,确定有效 的各种金融市场模式,但是没有提供定量的决策分析。 深度学习的概念由Hinton等于2006年提出。。 , 利用深度信念网络(Deep Belief Networks,DBN)实现 数据的降维及分类。深度学习可通过学习一种深层非 线性网络结构,实现复杂函数逼近 。深度学习目前 在很多领域都优于过去的方法,因此在语音识别 、人 脸识别 、交通标志分类0 、医学图像处理 等领域 都有所应用。深度学习带来了机器学习的一个新浪 潮,导致了“大数据+深度模型”时代的来临 ,并且 金融大数据由于数据量正在不断变大,因此深度学习 将在提供金融大数据分析解决方案中发挥关键作 用¨ 。已经有很多学者利用深度学习技术来实现对 时序数据的分析,目前文献[14]利用三层DBN网络 对混沌时间序列进行预测,文献[15]对交通流量的时 序序列进行预测,都实现比传统方法更好的效果;在金 融时序数据分析中,文献[16]利用改进的DBN网络 实现比传统方法更好的外汇汇率预测。 针对目前金融时序数据分析的复杂性和不确定性 等问题,在技术面层次分析金融时序数据的原始特征, 通过分析金融市场中海量各种原始时序数据的特点, 结合DBN模型分析金融市场中的时序数据。采集海 量原始的金融时序数据,为了挖掘出原始数据中所隐 含的信息,把原始结构化时序数据转化为非结构化数 据作为DBN深度学习模型的输入,建立DBN深度学 习金融时序数据分析模型,同时为金融时序数据提供 定量化分析决策。 1 DBN算法 深度学习的整体框架都是根据人脑神经网络的机 制来进行学习的,因此其核心训练思路主要有以下三 个步骤: (1)无监督学习用于每一层网络的pre—train(预 训练); (2)每次用无监督学习训练一层,然后将其训练 结果作为其高一层的输入; (3)用自顶而下的监督算法去调整所有层(参数 微调)。 DBN作为~种深度学习的模型受到广泛关注。 从结构上看,DBN由多层无监督受限玻尔兹曼机(Re— stricted Boltzmann Machine,RBM)和有监督的反向传播 (Back Propagation,BP)网络组成 。深度神经网络的 整体结构如图1所示,输入层一隐藏层之间利用高斯伯 努利RBM,隐藏层一隐藏层之间利用高斯伯努利RBM, 隐藏层一隐藏层的层级设计可以有Ⅳ层,然后输出层 作为无监督分类的结果。 l RBM 图1 RBM组成的DBN RBM在给定模型参数条件下的联合分布为: P( ,h;0):exp(一层(口,h; ))/Z (1) 其中,Z=∑∑exp(一E(v, ; )), 为输入,h 为输出,0为计算参数。 模型赋予可视变量 的边际概率为: p( ; )=∑exp(一E(v, ; ))/z (2) 对伯努利~伯努利RBM能量函数定义为: l J l J E( ,^; )=一∑∑ hs一∑bi口 一∑Ct.iVj I J J l ‘;l I I (3) 其中, 为可视单元和隐单元连接权值;b。和o 为偏置量; 和_『为可视单元和隐单元的数目。 条件概率计算如下: , p( :1 I ; )=6(∑伽 + ) (4) , p(v =1 I 9)=6(∑wo.h ̄+b ) (5) 这里6( )=1/(1+exp( ))。相似的,对应高 斯一伯努利RBM能量函数为: I J I E(v, ; )=一∑∑埘 ‘ 1 J l +∑(l 1  一 ) 一 , ∑ (6) 对应条件概率为: , p(hj=1 I ; )= (∑Wij + ) (7) J p(v。=1 I h; )=N(E似 h +b ) (8) 第4期 曾志平等:基于DBN的金融时序数据建模与决策 .3. 其中,J7、r(・)为高斯分布。 然后对RBM微调,即利用对数似然概率log(p(v; ))梯度可推导出RBM的权值更新准则为: Ziw (t+1)=caw (t)+ (<vlhj>d山一<vihj > 。) (9) 其中,a为学习率;c为动量系数;<・>为期望。 这样由RBM组成的DBN深度学习算法就组成 了,主要是对RBM结构进行微调和设置适合的层数使 之适应数据的训练,获得最高精度。 2改进的DBN金融分析模型 2.1实证分析 在金融时序数据的分析中经常会遇到一些复杂的 非线性系统,利用数学方法很难对这些复杂的系统状 态方程准确建模 ,直接利用金融时序数据输入模型 中容易造成DBN算法的发散,不能找出原始数据中的 整体规律。 而目前DBN深度学习模型应用比较成功的就是 在图像的识别中。因此尝试利用改进的DBN模型,把 原始金融数据转化为相应的非结构化数据,对这些非 结构化数据抽取特征对不同趋势的时序数据曲线进行 分类,把建立复杂的数学模型转化为相应的图像识别 模型,从而提升DBN模型的精确度。 首先,使用DBN模型对短期内金融市场的涨跌进 行预测。利用t天内的收盘价及成交量等信息对应t+ 1天内的收盘价的价格变化构建相应的DBN模型。 一般地,预测时间间隔越小,DBN模型的预测能力就 越强,研究选用以天为单位作为预测模型输入,并选取 了过去一段时间所有金融交易数据作为DBN模型训 练的样本。 由于金融时序数据的复杂性,需要对金融时序数 据样本进行归一化处理,公式为: ,=a 1T ( 。)其中,,为输出数据; 为偏移参数,一般默认为 2; 为原始数据。 通过归一化转换有利于DBN模型的训练。 当DBN深度学习模型训练好之后,预测的目标是 价格变动方向(涨还是跌)和变动幅度大小。根据预 测模型的输出判断未来的涨跌做出买入决策。根据涨 跌给定一个阈值,只有达到或超过阈值才会触发卖出 信号。相应的卖出信号如下: f 1 sellprice≥buyprice×s singal={0 sellprice<buyprice×s (11) 【_1 t> 其中,buyprice为模型预测选取的买入价;sellprice 是卖出价;s为买入价的倍数;T为一个卖出的时间 段。Signal为1时卖出,交易成功,获得收益;Signal为 0时,进入下一个交易日;Singal为一1时,强行卖出,交 易失败,有亏损的风险。 2.2金融时序数据采集 为了验证DBN金融分析模型,选取当前国内最大 的金融市场——沪深股市作为金融时序数据样本,采 集2012年10月20日之前100工作Et深沪股市所有 股票的收盘价作为模型训练的样本集,把样本集分为 三类,根据股票样本特征采集转化为有明显上升趋势 (a)、有明显下降趋势(b)和无明显趋势(c)三种不同 非结构化数据样本并归类,如图2所示。并根据每五 个工作日的收盘价曲线把三种不同样本转化为50x50 像素的非结构化图片,利用这些非结构化数据作为训 练DBN模型的原始预训练数据。同样验证数据和检 测数据也利用同样的方式获得。分别生成样本集训练 的样本:预训练数据5 000个、验证数据3 000个和测试 数据2 000个。当DBN深度学习模型训练好之后,对 2000—2014年两年间的所有金融市场样本每个交易日 数据进行滑窗预测并验证模型的有效性。 / / ,/ ,,。 / 厂。 。  ‘, / / / 厂。 /。 /‘  ’/ r, , ,. 厂 / / , 一 / /。 ,,‘ ‘ /‘ 厂 厂。 ,, / / / 一_ 厂。 厂‘ 厂。 /。 ,,。 / / / 厂 \ 、 、、 \ 、 、 \ 、. 、. \ 、. \  ̄、 \ \ \. \ 、、 \ \ \ \ L. \ 、 \ 、 \ 、. L \. 、 \ \ 、 、 、、 、 、I-’ \ 、. -’ \ \ 、 、 、 \. 、 (b) J / √ V  ̄,、 . /^、 、一,一 、 1 、一,一 \, 、 . 八 \一/ 一一、 \^ \. 厂\ 、. 厂、 厂 / N,- 、√ . 一_\ \,、 / 金融数据样本示例 2..J 3 DBN网 IJⅡ 网i旨1J¨劲 采用三层RBM组成的DBN深度学习网络,网络 的输入层有50x50个节点,第一个、第二个隐含层有 3 000个节点,输出层有3个输出节点(上涨、下跌或者 无明显趋势状态)。首先通过逐层训练的方式,数据 被依次映射到隐含层h ,h:,…,h 中。为了加快训练 过程,一般采用GPU对训练模型进行加速。然后利用 验证数据和检测数据在模型建立好后对整个模型进行 微调测试,提升准确度。提升精确度实现模型的分类, 需要在DBN模型的最后加入一个分类器,把不同类型 的数据集与数据集对应的标签利用有监督的学习方法 微调整个网络。详细的DBN网络训练流程如图1所 示,这里各层网络节点数为[2 500,3 000,3 000,3],把 ・4・ 计算机技术与发展 第27卷 非结构化数据图像像素点转化为输入的2 500个节 点,再经过两层隐含层的训练最后输出3个分类节点。 2.4金融时序数据决策 下来 个工作日内根据Signal信号确定卖出信号;最 后统计出Sinal=1信号成功的样本个数,验证模型的 g效果。图3为金融时序数据决策分析流程。选取历史 的金融数据作为模型训练的原始数据,把这些数据转 化为三种类型的非结构化数据,利用训练好的DBN深 度学习模型预测并验证这些数据,把选取好的样本输 出到决策分析,然后再利用接下来 个工作日的金融 对已经训练好的模型进行模型预测,利用2000— 2014年两年间的金融市场每日数据——开盘价、收盘 价、最高价、最低价、成交量和输入的历史时序数据提 供买卖的决策。首先,利用训练好的模型选出t+1天 可以买入的样本;然后在符合金融市场的规律下在接 时序数据得出卖出信号Signal。 id抽 神hIllIe dc髓lI炷 I、. 鼢蛐 罅I9。l嘏90B 捌辩 鞠90B 枷90B 绷辩 翱 瑚2.10.19 ∞ 搏l3 瑚 搏 姗1.015啦 l7带时 饼鳓D 粥i舯 &盯 赫 甜 38 2012-10-17 1辫啪 捌 协n 322撕 捌2 1.01{蛳n眦 蜘 摊1O 珈9a时 / ㈨^  l图3金融时序数据决策分析流程图 建可以利用GPU的Theano环境。 3 实 验 3.1 实验环境 3.2实验结果及分析 利用DBN建立好的模型对2000年一2014年间的 对金融时序数据分析采用的处理器为国产兆芯 X86处理器,内存容量16 GB。为了加速DBN算法处 理金融大数据的能力,利用NVIDIA显卡的GPU提升 算法性能,整个算法的软件环境是在Python2.7下搭 金融市场每日数据验证模型的有效性。假设 为40 天,s:1.01即在40天内买卖样本,并且样本买卖的 收益为1%。详细如表1所示。 表l 2000~2014每月统计金融时序数据样本 时间 20()o 20o1 2oo2 2oo3 2o()4 成功样本数/个 339 260 267 239 3l8 失败样本数/个 34 44 55 46 70 时间 20o8 2oo9 2010 2Oll 2O12 成功样本数/个 575 932 577 584 779 失败样本数/个 72 50 44 lO7 l14 2oo5 2oo6 2o07 539 652 l 242 74 56 78 2013 2014 904 l 244 69 74 统计分析l5年间交易成功和交易失败的数据样 本,对表1数据的分析如图4所示。总体上交易成功 的样本远远大于交易失败的样本,对所有统计数据分 析在两年间样本成功率为80.753 4%。 对交易成功的样本,进一步分析在 时间内能达 到成功交易s的指标下所需要交易的时间。对成功交 易的金融样本的分析如图5所示。成功交易的金融样 本五天内能交易的占了成功交易的80.753 4%,一个 交易日内就能卖出的占了55.433 3%。短时间内模型 选择的样本验证成功效果明显。因此,前面假设T= 2000 2001 2002 2003 2004 21 ̄05 2∞6 2007 2008 2009 2010 2011 2022 2013 2014 m Lt 时间/年 图4 2000—2014年间成功和失败样本数 旃幡棼暑 援 2 第4期 4 3 曾志平等:基于DBN的金融时序数据建模与决策 ・5・ 40天是合理的,当t=40时成功卖出的样本个数只有 5个,占成功卖出样本的0.116 4%,样本数已经足 够小。 5 000 _●_成功卖出样本数 1 0o0 0 1 , / , 11 15 lb l,19 21 z,z z,z,31,5 5 5,j 时阔厌 图5 20o0—20l4年闽t时间内 成功卖出的金融样本数 从以上两个结果显示,利用DBN模型选择的金融 大数据样本呈上升趋势的预测准确率达到了 90.544 2%,能有效提供决策的样本筛选;同时,对筛 选后的样本成功卖出的时间趋势进行分析,五天内交 易占80.753 4%。 4结束语 针对目前金融时序数据分析的复杂性和不确定性 等问题,通过分析海量金融数据确定了金融大数据非 结构化的各种模式,提出了复杂的金融大数据趋势转 化为对金融趋势曲线非结构化数据的识别分类。利用 DBN深度学习方法对金融大数据进行了建模分析,得 到不同时刻金融大数据走势并进行了金融数据走势定 量分析,为实际预测与决策提供了宝贵的参考和重要 的依据。验证实例表明,利用DBN模型选择的金融数 据样本决策的准确率达到了90.544 2%。 参考文献: [1] 杨用斌,杨唯实.基本面分析和技术分析流派市场价格博 弈一基于方法相关性下的研究[J].经济问题,2013(11): 78—81. [2] Mabu S,Obayashi M,Kuremoto T.Ensemble learning of rule- based evolutionary algorithm using mulit layer pereeptmn for stock trading models[C]//7th international conference on soft computing and intelligent systems and 15th international sym- opsium on advanced intelligent systems-[S.1.]:[S.n.], 2014:624—629. [3]庞磊,李寿山,张慧,等.基于微博的股票投资者未来 情感倾向识别研究[J].计算机科学,2012,39(6A):249— 252. [4]刘向丽,王旭朋.基于小波分析的股指期货高频预测研究 [J].系统工程理论与实践,2015,35(6):1425—1432. [5]胡晓彤,王子银.基于模糊模式识别的金融数据分析[J]. 制造业自动化,2011,33(4):208—211. [6]Hinton G E,Osindero S,Teh Y W.A fast learning algorithm ofr deep belief nets[J].Neurla Computation,2006,18(7): 1527—1554. [7]Sun Z J,Xue L,Xu Y M,et a1.Overview ofdeep learning[J]. Application Research of Computers,2012,29(8):2806— 2810. [8] Zhang X L,Wu j.Denoising deep neural networks based voice activity detection[C]//2013 IEEE intemational conference on acoustics,speech and signal processing-[s.1|]:IEEE,2013: 853-857. [9] Stuhlsatz A,Lippel J,Zielke T.Feature ex ̄action wiht deep neurla networks by a generlaized discriminant analysis[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012,23(4):596-608. [10]Ciersna D,Meier U,Masci J,et 1a.Multi-column deep neural network ofr trafifc sing classiifcation[J].Neurla Networks, 2012,32:333-338. [1 1]Caureior G,Nascimento J C.Combining mulitple dynamic models and deep learning architectures for tracking the left ventricle endocardium in ultrasound data[J].IEEE Trnasac- tions on Pattern Analysis and Machine Intelligence,2013,35 (11):2592—2607. [12]余凯,贾磊,陈雨强,等.深度学习的昨天、今天和明天 [J].计算机研究与发展,2013,50(9):1799-1804. [13]Chen X W,Lin X.Big data deep learning:challenges and per- spectives[J].IEEE Access,2014,2:514-525. [14]Kuremoto T,Kimura S,Kobayashi K,et a1.Time series fore— casting using a deep belief network with restricted Bohzmann machines[J].Neurocomputing,2014,137(15):47—56. [15]Huang W,Hong H,Song G,et 1a.Deep process neural network ofr temporal deep learning[C]//2014 international joint con- ference on neural networks.[S.1_]:[S.n.],2014:465-472. [16]Shen F,Chao J,Zhao J.Forecasting exchange rate using deep belief networks and conjugate gradient method[J].Neurocom- puting,2015,167:243—253. [17]孙小军,张银利.股票一债券投资组合问题的数学模型及算 法[J].系统工程理论与实践,2015,35(6):1433—1439. 

因篇幅问题不能全部显示,请点此查看更多更全内容