论文部分内容阅读
本文基于高频高维金融数据对量化投资策略进行研究。高频金融数据所包含的反映市场变化的有效信息是建立短期投资策略的基石。基于高频高维金融资产数据估计的高频协方差矩阵是度量多资产波动率的有力工具,也是研究投资策略的基础。微观结构噪音和数据非同步性是基于高频高维金融数据估计协方差矩阵面临的两大挑战。我们采用核估计和预平均的方法来消除构建高频协方差矩阵过程中微观结构噪音的影响。进一步,我们提出观测点-持续期流动性排序模型对多资产进行排序,基于7种不同分组方式对排序后资产进行分组,同步化过程在组内分别进行以达到尽可能减少高频数据的丢失。同时,我们提出计数分析和权重分析的方法对提出的观测点-持续期模型和已有观测点模型、交易量模型、交易量-持续期模型造成数据丢失率进行定量分析。我们提出运用预平均的方法在各分组内构造分组协方差矩阵,然后按一定规则将各分组协方差矩阵合并为整体协方差矩阵。进一步,本文运用了3-因子和?1正则化方法对协方差矩阵进行正则化处理;结合均值-方差模型,我们运用正则化协方差矩阵来分别考虑基于最小方差模型、卖空约束的全局最小方差模型和单资产卖空限制的全局最小方差模型下的最优投资策略。我们运用国泰安高频数据库1秒频率的高频数据进行实证研究。本文选取上海证券交易所A股102只资产在2014至2017年976个完整交易日的数据进行实证分析。首先,基于计数分析和权重分析的实证结果显示我们提出的观测点-持续期流动性模型在同步化过程中能更有效地减少数据的丢失率。其次,基于不同的协方差矩阵正则化造成的残差的实证分析显示,?1正则化的预平均估计构造的协方差矩阵残差较3-因子方法更小。最后,基于夏普比率和含有交易成本的单位风险净收益率两个指标,我们对不允许卖空和允许不同程度卖空的9种全局风险最小投资组合模型进行实证研究。实证结果显示,和已实现核方法相比,预平均方法构造的协方差矩阵下的最优投资策略具有更高的夏普比率和单位风险净收益率。因此,基于预平均方法构造的协方差矩阵的最优投资策略能够更加有效地对资产进行配置。