基于机器学习的量化投资建模研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4 研究思路及框架

本书的研究框架如图1-1所示,总体上遵循“提出问题→理论分析→模型与策略构建→实证检验→结论与展望”的思路展开研究,分为量化投资建模的金融理论基础与方法原理分析、价格和交易量预测建模及最优组合模型构建、择时策略与在线最优组合交易策略构造3个阶段。各阶段的研究与实现过程概述如下:

图1-1 本书的研究框架

阶段1:量化投资建模的金融理论基础与方法原理分析。

系统深入地介绍本书量化投资建模研究过程中运用或涉及的信号处理和机器学习方法的理论基础,以及股票行业联动与轮动关系理论,主要包括经验模态分解及其系列改进方法、多元经验模态分解、最大信息系数、支持向量回归模型、LSTM神经网络以及关联规则挖掘Apriori算法等,为后续章节深入运用上述模型与方法进行金融预测建模与策略构建研究奠定坚实的理论基础,同时也便于清晰、高效地阐述本书后续的实证研究过程与实验结果分析。

阶段2:价格和交易量预测建模及最优组合模型构建。

(1)基于机器学习的股票价格与交易量预测建模。针对股价时序中复杂波动模式有效提取以及高精度预测的难题,将经验模态分解(EMD)及其改进方法,包括集合经验模态分解(EEMD)和自适应噪声完备集合经验模态分解(CEEMDAN),引入股市指数预测建模研究中。首先,提出EMD分解下基于支持向量回归的股票价格集成预测方法EMD-SVRF;其次,采用遗传算法(GA)自动执行超参数优化,提出遗传算法改进的指数预测建模方法EMD-GA-SVR;再次,提出EEMD与SVR结合的沪深300指数预测建模方法EEMD-SVRP;最后,将CEEMDAN的自适应完备分解功能与长短期记忆网络(LSTM)高效提取复杂序列中长期依赖关系的优势相结合,采用“分解—集成—预测”的思路,提出指数集成预测方法CEEMDAN-LSTM。

(2)基于机器学习的股票指数日内交易量分布预测建模。现有的预测建模方法难以有效提取日内交易量分布随时间演变的复杂变化规律,导致日内交易量分布预测误差过大。为此,本书提出一种MEMD分解下基于LSTM-Attention的指数日内交易量分布预测方法M-LSTM。首先,运用MEMD将区间交易量多维时间序列分解为若干个独立的本征模态函数(IMF)和一个趋势项;其次,对各维度中高频IMF进行去噪和重构处理,获取降噪后的日内交易量区间分布;再次,构造基于LSTM-Attention网络的日内交易量分布多元预测模型;最后,通过实证分析本书提出的交易量分布预测方法M-LSTM的预测精度与有效性。

(3)股票行业指数互动关系预测建模研究。首先,提出MEMD-Apriori行业轮动分析模型,运用MEMD方法对申万一级行业指数进行去噪,并利用最大信息系数(MIC)测度各行业指数的相关关系,然后将行业指数转化为收益率序列,并设定适当的阈值以确定指数的涨跌标签值,进而运用Apriori算法挖掘不同行业指数间的涨跌关系规则;其次,以相关行业指数为输入、以目标行业指数涨跌状态为输出标签,构建基于MEMD-SVC的行业指数涨跌关系模型;最后,分别以MEMD-Apriori、MEMD-SVC行业指数涨跌分类模型为基础,生成择时信号并构建相应的择时策略,进而进行仿真回测以评估策略有效性。

(4)基于DDPG的在线最优组合建模。对深度强化学习DDPG算法进行改进,使之能够应用于投资组合管理问题。针对DDPG模型对复杂环境的感知能力有限、状态数据内部特征之间具有较强的相关性问题,将卷积神经网络技术引入DDPG算法模型中,结合单只股票投资权重的限制,构建了基于深度强化学习DDPG算法的实时在线最优投资组合管理模型,实时感知市场变化并使决策最优化,实现了投资组合管理实时自动化、智能化。

阶段3:择时策略与在线最优组合交易策略构造。

(1)基于机器学习预测的股市指数量化择时研究。首先,以EEMDSVR指数低频分量预测结果为基础制定交易信号生成规则,构建基于低频分量趋势预测信号的沪深300指数择时策略;其次,构建基于CEEMDANLSTM预测的市场指数择时策略,根据不同分解水平的小波低频分量能够反映信号基本和次级趋势且不具滞后性的特点,提出一种基于小波低频分量的量化择时策略;最后,设计多组对比实验,深入分析上述择时策略在收益获取与风险控制能力方面的表现。

(2)基于行业指数涨跌分类模型的择时策略构建研究。利用阶段2构建的基于MEMD-Apriori的行业指数涨跌分类模型,获得行业轮动过程中的指数涨跌规则,进而生成交易信号,即当领先变化行业上涨时买入滞后上涨行业,当领先变化行业下跌时卖出下跌行业,从而构建MEMD-Apriori行业指数择时策略。同样,以MEMD-SVC模型在回测区间的分类结果为交易信号,当目标指数的分类结果为上涨时,则下一个交易日产生买入信号;当分类结果为下跌时,则下一个交易日产生卖出信号;当分类结果为持平时,则不产生买卖信号,由此构建MEMD-SVC行业指数择时策略。进一步,对两种行业择时策略分别进行仿真回测和对比分析实验,以评估策略的有效性、可靠性。

(3)基于深度强化学习的在线最优组合交易策略的构建与分析。以给定的股票集合为候选的交易标的资产池,根据阶段2所构建的基于DDPG的在线最优投资组合管理模型,不断自动化修改各股票资产的权重,获得实时在线的最优股票投资组合,并进一步构建出基于深度强化学习的在线最优组合交易策略。然后,采用真实的股票价格数据对所构建的组合管理模型进行测试,并以上证50指数收益率为基准,通过仿真交易回测,深入分析评估基于DDPG模型的最优组合交易策略在收益获取与风险控制方面的能力。