论文部分内容阅读
现代行为金融对传统“有效市场假设”(Efficient Market Hypothesis,EMH)关于“市场理性人”的假设提出质疑,并在相关的实证研究中证实了投资者的主观情绪会对市场行情产生显著影响。在行为金融发展的早期阶段,理论和实践研究的难点来自于如何在市场中寻找到有效表征投资者情绪方向和程度的代理变量。但是,随着信息化时代的发展,数据源的丰富化、数据挖掘技术的成熟化使得相关研究由单纯的对市场方向的预测进一步发展为对市场收益波动率的研究,因而如何进一步实现投资者情绪的定量化表征成了摆在研究者面前的难题,而本文所关注的问题也是如何对投资者情绪进行更全面、有效的量化分析,以此实现对市场行情预测行为的指导。虽然,情绪的有效量化方式为实现在金融领域的研究应用中引入社会情绪经济学(Socioeconomics)思想提供了入口,但如何将情绪这种主观性的模拟信息转变为计算机模型能够识别应用的数据形式,又如何将这一变量和市场行情变量形成映射关系,又是摆在研究者面前的一个难题。尤其是随着互联网媒体新闻平台和社交平台的急剧扩张,人们在获得越来越开放的信息源的同时却又陷入了庞杂、冗余的海量数据中,这已经远远超出了个人的信息搜集和处理能力,乃至传统的计算机线性处理方式也越来越满足不了人们的需要。针对网络信息大数据获取和处理工作的应用需求,网络爬虫技术和机器学习算法获得了积极的发展,并形成了针对各类特定需求的不同方法。所以本文针对上述三方面的难点,提出了一个系统化的利用网络媒体信息实现市场情绪量化式交易策略。为实现该目标,本文研究工作主要包括了以下三个方面:1.网络信息数据的爬取及筛选工作。该部分针对实际爬取中的信息源质量、可得性等问题,以及期间网络服务商反爬虫问题、数据分布不均衡等问题,筛选出最终的目标信息源,并对泛化的爬取结果进行了筛选、信息提取和数据时间序列化处理;2.媒体信息量化以及投资者情绪量化的实现。对根据时间聚类的文本数据进行文本分析挖掘,并通过统计方法,形成文本模拟数据向量化数据的转化;同时通过网络引擎提供的搜索频率数据来实现投资者关注度变化方向和幅度的跟踪捕捉;3.实现市场上的情绪心理因素和现实金融问题的联接。在将市场情绪变量引入到金融问题的分析时,在传统市场金融模型的基础上引入了行为金融领域的情绪动量因子,弥补了传统市场风险价值评估模型中对于由投资者心理因素导致的那部分市场风险的缺失。同时以线性和非线性两种方式将媒体新闻表征的投资者情绪纳入到金融预测模型的训练拟合、测试评估中。线性方式中,基于Fama-French三因子模型的改进形式,将新闻信息量化为基于情绪方向和强度的评分,并通过线性回归方式实现对市场收益波动的刻画、预测;非线性方式中,则引入了机器学习算法,直接通过文本分析、特征提取、文本向量空间构建的方式,使网络信息和市场行情方向之间建立映射关系,从而实现对市场运动方向的刻画、预测。这三部分工作并非各自独立,而是以一个整体系统的方式,协作实现了最终期望的研究效果。这种系统性思维不仅表现在对市场行情的预测分析过程中,同时也表现在由市场模拟信息向数字信息转化的过程,以及本文信息特征空间与市场行情方向性的映射关系的建立中。这一研究工作的核心思想对于在金融模型中引入投资者心理因素的量化研究主题是颇具价值和指导意义的。