论文部分内容阅读
在介绍国内外指数化投资优化的文献基础上,发现在海量的历史数据信息中找到更有用和有效的指数跟踪信息和模式,成为指数化投资研究的新方向。如何解决“丰富的数据与贫乏的知识”间的矛盾,数据挖掘成为解决这个问题的新的突破点。数据挖掘是从大量的、不完全的、有噪音的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道、但又是潜在有用的信息和知识的过程,进而对数据进行深层次的处理。因此论文提出基于数据挖掘的5种指数化投资优化方法。在指数化投资研究领域引入数据挖掘的相关理论方法,一方面可以为投资决策提供重要的创新解决手段,另一方面,也为数据挖掘的研究与应用开辟一个新的领域。因此,从定量分析的角度利用数据挖掘的有关理论及方法,对指数化投资方法在我国资本市场的适用性及系统深入的研究具有重要的理论意义与学术价值。指数化投资是一种被动投资策略,其最初的思想来自于学术界“持有市场投资组合”的论点,是通过复制和跟踪某个基准指数(benchmark)而获取市场平均收益的一种投资组合。它不仅没有积极基金管理的超额风险,而且没有时机选择的限制,因此,随着我国证券市场的发展深化,指数化构造方法作为指数化投资研究的主要形式,越来越受到理论界和实务界的关注。一般地,指数化构造方法分为完全复制法、优化复制法和抽样复制法三类。由于优化复制法合理有效的构造原理,因此应用优化复制法所构造的指数投资组合的优化问题是本论文的研究重点。在指数化投资组合的优化研究实证设计和分析中,首先,根据2009年1月5日到2010年6月30日上证180及各成分股的历史数据,在一系列约束条件(个股集中度、交易成本、资金规模、市场冲击成本、最小交易量)的限制下,以上证180只成分股为优化对象,通过最小化5种优化方法的目标函数(即跟踪误差),用matlab实现180只成分股的最优持有权重和最优持有数量的配置满足最优规划,从而在技术上构造最优的指数投资组合。其次,利用样本外数据进行跟踪基准指数能力、指数跟踪业绩指标和样本外优越性的检验和比较分析。最后,对基于数据挖掘的5种方法从不同指标角度分析指数化投资得出的结论也不一致,这也验证了数据挖掘方法不能单纯的比较孰优孰劣的结论。