论文部分内容阅读
行为金融理论已经证实投资者情绪对于资产配置有显著作用,Black-Litterman模型的主要贡献是将传统金融学与行为金融学结合起来,在市场历史数据基础上结合投资者的主观情绪更新投资组合,从而在现代投资组合的资产配置领域得到广泛应用,更好地量化并揭示投资者的择股决策。对于Black-Litterman模型中投资者主观观点度量问题,文献研究主要依据历史收益指标等预测预期收益,然而忽略了投资者心理偏差因素对于其收益的影响,必将影响资产配置的结果。得益于互联网的快速发展和数据收集技术的进步,社交网络文本为投资者文本情绪的度量提供了新渠道。目前大多数基于数据挖掘的投资者情绪分类方法主要将书面文本作为判断情绪极性的信息来源,而忽略了用户在平台中生成的行为等数据,进而将单位时间内多文本和多用户相融合的研究较少。本文期望回答的核心问题是:第一,如何快速从海量金融社交网站数据中提取关键且有价值的情感信息?如何结合金融社交网站的特点并利用发布时间、用户的表达方式和社交网络结构等信息构建投资者文本情绪指标?第二,基于文本挖掘算法的投资者情绪指标是否更好地反映金融资产的价格走势?第三,基于文本挖掘算法的投资者情绪是否影响金融资产配置?配置结果是否得到明显改善?行业对于基金管理者进行产业权重配置起着重要作用,同时,自然人投资者在挑选和配置个股前,需要关注个股所在行业的行情,把握强势行业。因此构建投资者网络信息并用于投资者情绪的映射匹配,度量行业层面的投资者情绪指标具有一定的现实意义。文章以申银万国一级行业划分标准爬取东方财富网行业吧贴吧作为文本库,并将文本转化为结构化数据矩阵。比较分析词汇分类字典法、基于时间注意力机制下长短期记忆网络以及基于时间和用户双重注意力机制下长短期记忆网络等三种方法的投资者文本情绪指标的有效性,构建基于社交网络文本挖掘算法的投资者主观情绪指标——文本情绪指标,从而达到更加真实准确地反映投资者情绪的目的。然后,结合筛选的客观情绪指标和构建的主观情绪指标,运用主成分分析方法合成反映行业股价走势的各行业综合投资者情绪指标,并嵌入到Black-Litterman模型中构建投资者主观观点,确定行业间资产配置比。文章的主要内容和研究结论主要分为三部分:一、基于时间和用户双重注意力机制下长短期记忆网络(LSTM)模型构建投资者文本情绪指标。将多文本信息、用户社交信息与情绪时间序列相结合,分别采用无监督学习法——词汇分类字典法和有监督学习法——基于时间以及时间和用户双重注意力机制的长短期记忆网络(LSTM)模型提取数据矩阵信息。按照股市交易日构建时序的行业投资者文本情绪指标,对投资者文本情绪指标进行分类和预测,通过比较分析三种方法的结果来提高投资者文本情绪指标的有效性。实证结果表明,新兴的深度学习法——LSTM模型比传统的文本大数据分析方法——词汇分类字典法具有更好的预测能力,时间和用户注意力机制的融合提高了信息提取的准确性,为精准度量投资者文本情绪提供了更为有效的方法。二、基于优化筛选后的6个客观情绪代理变量和1个主观情绪代理变量,运用主成分分析法构建各行业综合投资者情绪指标。由于政府对各行业制定和实施不同的行业政策,导致投资者在投资过程中所形成的情绪存在明显的差异,加之各时期内各行业的投资价值不同,使得行业间投资者情绪指标间存在明显差异。首先通过合理性检验——Granger因果关系检验对各行业的7个情绪代理变量进行筛选,再运用互相关分析法选取与收益率相关系数高的代理变量同步项、领先项或滞后项,最后运用主成分分析方法合成各行业综合投资者情绪指标。实证结果表明所构建的各行业投资者情绪指标更好地反映行业股价走势的动态。三、基于文本挖掘技术构建的行业投资者情绪指标量化为影响投资者观点误差协方差矩阵的置信程度,嵌入到Black-Litterman模型中,构建投资者主观观点,确定行业间的资产配置比。将构建的各行业综合投资者情绪指标量化为置信程度,嵌入到Black-Litterman模型中构建投资者观点误差的协方差矩阵,对Black-Litterman模型进行了一定的改进,优化行业间的资产配置比。实证检验证实了,在有效前沿上风险最小和夏普比率最高水平下,基于行业投资者情绪的Black-Litterman模型的资产组合效率和配置结果均明显优于传统Markowitz均值-方差模型,有效提高了资产配置的日均收益率。实证结果在经过允许卖空和考虑交易成本、三个季度的样本外测试以及股市暴涨暴跌阶段和较快较慢上涨/下跌阶段等多个角度调整后仍稳健,进而证实了投资者情绪对资产组合有显著影响,基于行业投资者情绪的Black-Litterman模型具有一定的竞争优势。文章的主要创新之处体现在以下三个方面:一、所采用或拓展的方法均实现了每一交易日内多文本信息的融合。在统计时间内爬取各行业股吧文本,为构建时序的投资者情绪指标,将每一交易日内的多元文本内容进行归整和融合,形成日频率数据。二、加入用户社交数据后实现了交易日内多文本和多用户信息的融合。在构建投资者文本情绪度量指标的有监督学习模型中考虑社交平台中不同用户的信息,将粉丝数、影响力和吧龄等社交数据作为长短期记忆网络(LSTM)的注意力机制,更为真实的捕捉投资者连续动态的情绪。三、将投资者情绪指标和Black-Litterman资产配置模型结合起来,以行业投资者情绪指标创建Black-Litterman模型中的投资者主观观点,实现主观观点向预期收益率的转化,建立最优规划模型,动态模拟资产的最优配置策略。基于社交网络文本挖掘技术构建投资者情绪指标,充分考虑投资者的认知偏差等因素,解决了仅依赖于预期收益或历史数据的预测模型无法直观揭示投资者心理认知和行为的局限性问题,从一个新的视角科学地解决Black-Litterman模型中投资者观点的生成问题。并且将模型应用细分到中国各行业股票市场,给出了新兴股票市场投资者情绪在资产配置中具有重要影响的经验数据,扩展了Black-Litterman模型理论体系研究,并推动了行为金融理论在资产配置中的应用。