论文部分内容阅读
在互联网时代的当今社会,数据开始爆炸性地呈现在公众面前,社会各个领域的大数据技术革命已经到来,对数据的需求、计算机、网络技术已经渗透到金融市场的方方面面。随着证券市场的不断发展,越来越多的证券公司和金融投资机构开始运用大数据方法来从事证券投资分析研究与决策交易。机构大数据获取的便利性使得大数据技术迅速渗透到证券投资的各个领域,例如人工智能技术,网络舆情分析,新闻热度大数据选股等。如何将大数据应用到量化投资策略上,实现证券交易自动化和稳定收益成为证券金融公司发展过程中需深入思考和亟待解决的首要问题。基于此,本文以互联网金融为切入点,将研究重点放在证券投资策略、余额宝收益率及其组合投资上,通过对文献梳理,采用实证分析和案例分析相结合的研究方法,对目前新兴的证券投资量化策略和互联网理财产品余额宝进行系统的实证分析,并给出两者组合投资的风险控制模型分析,最后得出相关结论与研究展望。本文研究的主要内容和结论如下:(1)针对大数据方法在证券投资策略方面的研究,首先给出机构热门推荐选股策略,通过抓取2015年5至6月慧博研报股票推荐数据再打分得到组合的一篮子股票,发现组合股票对上证指数具有领涨抗跌效果,且收益巨大,风险可控。再根据热股策略回测展示,从2014年初开始计算,抓取半个月研报数据,选出机构推荐前十名股票组合,买入持有2个月再卖出,然后循环以上操作,回测发现该策略胜率为41.67%。虽然在牛市中未跑赢大盘,但每年收益均在20%以上,且在熊市表现更佳,适合长期大规模资金的投资运营。然后对于SHARPE策略选股考虑了两种情况:在股灾前该策略能跑赢大盘,但在股灾时表现亦不佳,整体策略胜率为66.7%。说明该选股策略在短期内(1-3个月)效果最佳,长期效果不显著,这可能是A股存在价格反转和价格惯性的作用。对选出的夏普指数高的股票研究还发现,以创业板和次新股居多,短期具有巨大爆发潜力且回撤风险很小。而在针对RoMad策略选股,计算A股在考察期间的单位收益回测比(RoMad),分三类选择RoMad最高的推荐股票,发现蓝筹股市值大,风险最小,中小板股票风险适中,创业板股风险最大,投资者可根据各自的风险偏好,选择各板块表现较好的股票;最后通过文本挖掘的方法,将中国A股分行业,概念和地域(省份)板块,根据相关板块的新浪(百度)搜索量次数进行排名,可以得到对应板块热度和次序,并且做到了实时更新,为投资者选择热门板块做决策参考;(2)通过对互联网金融产品余额宝收益率影响因素和预测做实证分析,发现余额宝七日年化收益率数据不服从正态分布,且原始数据不平稳,继续做一阶差分得到平稳数据。然后对余额宝收益率原始序列处理得到高频、低频和残差这三组新的序列,再对各组序列做特征分析,发现余额宝收益率主要是受国内市场资金面决定的长期趋势、金融行业出现的"钱荒"事件和货币政策调整等重大事件以及短期正常市场波动三方面影响,且影响程度依次由高到低。而后,分别对余额宝收益率原始数据,EMD分解后的高频、低频和残差项的数据进行ARMA短期预测。最后将三组预测数据重组得到新的预测序列,有效避免数据不平稳带来的预测误差,可为更多互联网金融产品的趋势研究提供帮助。预测的结论为,余额宝七日年化收益率能维持在3%左右的正常水平。以余额宝为例研究互联网金融产品的收益率和影响因素分析,为证券投资策略的扩展多一个选择;(3)基于互联网金融背景下证券投资策略的风险控制,本文归纳了五种风险类别,分别是信用风险、冲击成本风险、操作风险、系统性风险和其他风险。然后重点研究了权重未知和受约束情况下马柯维茨均值-方差模型,用余额宝七日年化收益率和上证指数收益率数据实现了该模型算法,从投资组合的风险收益表和有效前沿面两个纬度控制风险。关于风险价值VaR模型的计算,给出三种常见计算方法,并实现Matlab编程得到参数模型法和蒙特卡罗模拟法的结果图及组合收益风险散点图。最后给出KMV模型和风险传染模型的计算公式与检验方法,为互联网金融背景下证券投资策略选择的风险控制做理论依据和实际研判。