论文部分内容阅读
经典金融理论认为,证券投资者是理性的,他们依据效用最大化原则进行投资。然而近年来,随着种种金融异象的发现,金融学界开始对投资者的具体决策过程和投资行为进行实验研究和实证分析,发现人的情绪、性格及心理感觉等主观因素在金融投资中起着不可忽视的作用。投资者并不总是理性的,其决策行为不仅受到自身固有的认知偏差的影响,同时还受到外界环境的干扰,于是金融投资研究中开始考虑行为科学对决策的影响,逐渐形成了行为金融学。中国理论界对于行为金融理论的研究时间还比较短,在金融实际投资和监管领域的应用更是少见。事实上,行为金融所发现的很多现象在中国证券市场也存在,如过度自信、羊群效应、反转效应和动量效应等等。本文以行为金融理论为指导,以我国股票投资者的交易数据作为研究对象,通过对投资者在二级市场的交易数据的挖掘,探索存在于我国股票投资者中的行为规律和交易模式。在研究我国股票投资者交易行为模式时,采用了SAS所提倡的SEMMA过程,即抽样(Sample)、探测(Explore)、修正(Modify)、建模(Model)、评估(Assess)、打分(Scoring)的数据挖掘过程。论文主要分为以下五个部分:第一部分回顾了行为金融学在我国的发展,对我国股票市场投资者的行为偏差进行总结。首先,我国的股票市场在市场交易、政府监管、上市公司、投资者构成等方面同国外的成熟证券市场存在极大的差异。一些上市公司将股权融资视为“免费贷款”,机构投资者可以一定程度操纵股票价格。个人股票交易者投资意识差,投机意识浓。其次,简要概述了行为金融学的基本理论,对个人投资偏差和处置效应的国内外研究成果进行了综述。第二部分阐述数据挖掘的方法。数据挖掘的理论基础来源于统计学,实现机制则依赖于数据库管理系统。但是数据挖掘模型同统计学原型有一定的差距,数据挖掘面对的是海量数据,要考虑数据分析的执行效率,而统计学中的种种分析方法在数学上太过完美,如果用于分析海量数据将导致低效。数据挖掘中探索模式使用的主要模型是决策树。决策树之所以有强大的吸引力,主要是因为它的结果容易解释。将枝干节点合取形成条件,叶节点就形成了结果,这就是一个规则。本文研究就是利用决策树模型探索个人交易数据中的规则,即发现交易模式。第三部分数据预处理。数据挖掘是针对次级数据的挖掘,其数据收集是在分析目的确定前,这种途径收集来的数据可能并不存在对挖掘有益的直接信息,需要对数据进行加工汇总。首先是数据准备过程,将原始的FoxPro格式数据转化为了SAS格式;对不同的数据库数据进行了整合,重点插补了不完整数据。本文通过自创的插补方法,充分利用最原始数据信息,对不完整的文本信息和数字信息进行插补,为后续的分析打下了良好的基础。第四部分原始数据的探测。按照交易者背景信息和交易记录信息两个方面进行了数据描述统计,发现数据库中存在于隐性冗余和数据异常。隐性冗余主要表现在交易者背景数据库中,交易者背景数据库是截止2006年6月为止开户的所有交易者信息,但从交易流水库看,2002年8月后开户的投资者是没有交易记录的,这就形成了隐性冗余;数据异常主要表现在本次资金余额这个字段上,理论上本次资金余额应大于0,由于2000年前证券公司存在对大客户的融资,导致了本次资金余额出现为负的情况。第五部分构建数据挖掘模型。首先研究了中国股票市场是否存在处置效应,实证表明在损失还未超过30%的情况下,处置效应并不明显;在损失超过了30%后处置效应显著。其次,分别对买入和卖出决策、盈亏分析、不同类型交易者差异分析三个部分分别采用决策树模型,发现人们更加注重20个交易日内的低点;交易期限低于5天的情况下,亏损的可能性增加,这个结论对没有完成交易的交易者尤为显著;盈利的能力同大盘呈现了明显的相关,由于个人的预测能力有限,不能探测何时到底,在大盘下降过程中买入股票,亏损的可能性大大增加;投资额在1-20万的投资者交易次数最多,资金量较小的投资者(20万以下)在一支股票上的总买入金额有集中趋势,而资金量超过50万的投资者没有显著差异。结合上述的研究结果,提出了相应的政策建议。