基于集成学习算法的开放式基金投资策略研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:xmjxex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,开放式基金的规模不断扩大,类型也日益多样化。开放式基金以其流动性好、风险分散、相关信息透明度高、基金相关数据更新及时等优势备受欢迎。尤其是开放式基金中的股票型基金和混合型基金,已然成为投资者最为青睐的投资对象,但二者皆包含较多投资类型以及较高投资风险,专业投资意见和理念的缺失也导致个人投资者投资策略选择的困难。合理构建投资组合对个人投资理财具有一定的意义。得益于机器学习算法的发展与进步,关于基金的量化研究逐渐发展。集成学习算法在此基础上经过不断地创新与改进,被广泛应用于金融领域的研究中,但大多数学者主要集中于基金业绩表现以及基金风险度量的研究,鲜有学者将集成学习的研究视角转向个人投资者,探讨如何利用集成学习算法高效选取优质基金构建投资组合的分析相对较少,然而,筛选优质开放式基金投资组合对于构建一个业绩表现较好的投资策略至关重要。同时,对投资组合资产配置的研究集中于分析个别模型的优缺点,并未通过不同资产配置模型间的对比,具体分析适用于何种类型基金的投资策略构建。因此,本文尝试将集成学习算法模型运用到开放式基金的投资策略构建中,并通过三种常用资产配置模型投资策略的对比,进行实证分析,具有一定的理论意义和现实意义。随着开放式基金的发展,基金投资组合构建的困惑对投资者来说依然存在,因此,本文主要基于集成学习算法模型构建开放式基金投资策略,研究过程如下:首先,根据相关文献研究梳理,选择了三种在金融场景中应用较为广泛且具有一定实际应用效果的集成学习算法,分别为随机森林算法(Random Forest)、GBDT算法(Gradient Boosting Decison Tree,梯度提升数)和Light GBM算法(Light Gradient Boosting Machine),对股票型基金和混合型基金的收益率进行预测,通过模型评价指标平均绝对误差、均方根误差,综合评估三种集成学习模型的预测效果。对比结果证明,随机森林模型对股票型基金和混合型基金收益率预测效果最好。因此选用随机森林作为基金收益率预测模型,并通过预测每个持仓周期的全部样本基金收益率,挑选出排名前四的基金作为持仓基金。再根据资产配置模型的相关理论,分别运用等权重模型、最小方差模型和风险平价模型,对持仓基金进行投资权重的配比,构建股票型基金、混合型基金投资策略,并进行市场回测计算投资策略的投资结果,选用年化收益率、年化波动率、夏普比率和最大回撤这4个具有代表性的指标,对不同资产配置模型构建的开放式基金投资策略进行对比分析。本文根据以上实证分析得到以下主要结论:(1)集成学习算法随机森林的拟合效果较好,对股票型基金和混合型基金的收益率预测效果更优。(2)最小方差资产配置模型更加适用于股票型基金和混合型基金的投资策略构建。(3)本文所研究的股票型开放式基金和混合型开放式基金的投资策略,与基准中证全指作比较,投资效果均优于基准。本文的创新点主要有以下几点:(1)预测方法的创新,引入了三种集成学习算法模型来完成基金收益率预测相关研究。(2)研究思想的创新,大多数文章对基金业绩表现进行研究,本文与这些研究的不同之处在于,考虑到个人投资者的投资需求,对股票型基金和混合型基金的投资组合构建以及策略效果进行研究,给个人投资者提供投资思路的参考。本文构建的股票型开放式基金和混合型开放式基金投资策略在业绩上有着不错的表现,但在之后的研究中依然存在着很大的进步空间。如增加开放式基金的研究类型,优化特征的选择,优化集成学习算法以及资产配置模型,并将该方法应用到更多的研究当中。
其他文献
股票停牌是基于提升股票价格发现效率、抑制股票剧烈波动、消除信息不对称的初衷所设立的交易机制,在保护投资者利益和稳定交易秩序上发挥了重要作用,被世界各国主要证券市场广泛接受和实施。我国于1998年开始实施股票停牌,其大致经历了信息不完全对称下的发展、证券市场发展下逐步完善和国际接轨中的探索与改进三个发展阶段。虽然监管机构在三个阶段中对股票停牌进行了多次制度变革,但停牌种类繁多、频次较高的问题始终所为
学位
近年来,国家出台“三线四档”等政策,增加房地产行业的银行借贷门槛,在这种背景下,房地产违规信贷现象屡禁不止。罚单的数量和金额表明监管机构对违法违规行为的惩治决心和力度,但也从侧面说明“罚单式”监管模式的效果欠佳。房地产开发过度依赖银行信贷,不仅危及自身,也会将房地产市场的隐患传导至银行系统,进而引发系统性金融风险。因此,商业银行房地产信贷风险亟须得到有效评价和监管,研究该问题对于引导资金脱虚向实,
学位
个人信用评估对信贷机构降低经营风险,增加营业收益具有非常重要的作用。随着大数据技术的迅猛发展和普及,快速且精准的数据挖掘以及智能学习技术成为信用评估的主流手段。信用评估可以看作是一个二分类问题,即区分客户是违约客户还是未违约客户,但不同类型的客户被识别错误给信贷机构所造成的损失是不一样的,这一特点要求评估模型不仅具有较高的分类准确率,而且也要考虑不同类别间数据样本的误分类代价。本文在充分考虑信用评
学位
近年来,云计算、大数据、物联网、区块链、人工智能等新一代信息技术发展迅猛,金融科技对金融业中的主要参与者带来全新发展思路。与欧美等发达国家相比,我国金融科技起步较晚,但正加快发展脚步,以实现超越。金融科技对我国商业银行的影响具有一定的复杂性:互联网金融的风靡,对传统商业银行带来强烈的冲击,但同时也倒逼商业银行开始转换思路,谋求新的发展路径。然而随着新一代信息技术的发展,其与金融领域的结合也越来越紧
学位
一方面,中国的城市化发展已经从注重增长速度的传统城镇化转变为注重质量提升的新型城市化,而以往的城镇化过程中产生了不少的问题,如空气污染、水污染等环保问题以及道路和房屋等城市生活问题,而交通拥堵是新型城市化建设中最重要、最紧迫的问题之一;另一方面,随着市场经济的发展以及民众生活水平的日益改善,更多的人有了属于自己的私家轿车,根据公安部门的最新数据,2019年全国注册的汽车数量新增2578万辆,全国汽
学位
随着5G技术的普及和应用,各类社交媒体平台与电子商务网站的发展迅速,网络上产生了海量涉及个人情感信息的文字数据。通过分析这些文本数据,可以更准确地获知评论者的意见,为商家的商业经营提供支持,帮助决策机构监管舆情。设计合理高性能的模型发现并分析在大量文字数据中蕴藏的情感信息,成为了情感分析中的一个重要任务。文本情感分析包括显式情感分析和隐式情感分析。目前针对显式情感分析的研究已经比较成熟,然而隐式情
学位
2021年7月,全国碳市宣布全面启动,碳质押融资贷款等创新性碳金融衍生产品得到不断丰富与发展,作为一种特殊的资产,其业务主体面对的违约骗贷等交易风险更加难以识别与监督。电力行业作为全国碳市试点先行主体,有关电力企业在碳质押融资贷款方面的研究案例较少,无法有效全面的衡量因主体间利益关系复杂而导致的系统性交易风险;目前缺少针对碳质押融资贷款领域的绿色指标披露体系,基于碳质押融资贷款的单个主体风险识别模
学位
社交媒体上的虚假新闻对于社会而言是一项重大挑战。虚假新闻可以定义为通过篡改文本、图片、视频、音频等模态内容有意创造的信息,以欺骗或误导读者。虚假新闻的大肆传播不仅会对社会产生负面影响,甚至会操纵重要的公共事件。因此,如何有效检测社交媒体平台所传播的虚假新闻成为了亟待解决的重要难题。随着近年来人工智能技术的飞速发展,深度神经网络结构可以自动地抽取模态关键特征,研究者们开始将深度学习技术应用于虚假新闻
学位
2020年以来,新冠肺炎疫情对世界各国人民的生产生活造成了极大影响。地铁站等人群密集的公共场所极易导致病毒的快速传播。因此,为了提升呼吸道传染病疫情下行人在地铁站内的安全通行水平,最大限度的降低行人的病毒感染率,本论文以呼吸道传染病疫情为背景,运用建模仿真方法研究地铁站内楼梯、自动扶梯、闸机、通风,和行人口罩佩戴情况等关键元素的优化设置方案,提出面向降低病毒感染率的地铁站内行人安全管理措施。本论文
学位
近年来,社会网络与行为金融学的交叉研究已成为研究热点,大量学者不断尝试引用社会网络理论和方法研究金融领域中投资者行为及存在的风险性等问题。作为资本市场重要的组成部分,具有资金、资源和专业优势的基金对市场的可持续稳定运作和发展发挥着重要作用。以公募基金为代表的机构投资者“报团取暖”现象在实际经济活动中比较普遍,但这种现象往往伴随着抱团股股价发生暴涨暴跌,甚至引起股市的跌宕起伏以及“踩踏惨剧”的频繁发
学位