论文部分内容阅读
近年来,随着计算机算法领域的发展以及信息处理技术的革新,文本分析逐渐成为公司金融领域的研究热点。由于财务信息主要反映的是公司过去的经营业绩,利益相关者在分析公司未来发展状况的过程中对于信息的需求无法得到满足,而金融领域最重要的就是信息,对文本信息的研究极大地拓展了信息的来源,因此越来越多的学者使用文本分析自动化的形式解决金融领域的重要问题。基于对过往文献的梳理可知,对中国股票市场超额收益的研究大多基于财务信息的视角,少有研究考察上市公司年报文本相似性等文本特征对未来超额收益的预测能力,进而说明市场的非有效性。因此,本文创新性的从文本分析的角度探讨上市公司未来获得超额收益的能力,为年报文本信息的决策有用性提供了经验证据。超额收益率是指超过正常或预期收益率的收益,本文基于Fama-French五因子模型,计算经过Fama-French五因子模型调整后的未来超额收益率,并研究影响未来超额收益的因素。研究文本相似度可以很好的衡量文本信息的变化,基于此,本文主要尝试使用多种相似性度量指标衡量年报的信息披露情况,探究上市公司年报文本相似度对未来超额收益率的预测程度。管理层讨论与分析在年度报告的非财务信息中占据重要的地位,是上市公司年报中管理层对内容拥有最大自由裁量权的部分,包含对过去经营状况的阐述以及对未来发展的探讨,有助于投资者规避风险,提高对公司未来业绩走向估计的准确性,从而使投资决策的合理性得到进一步的提升。因而,本文的另一个研究重点是管理层讨论与分析部分相似度在多大程度上解释了公司未来的超额收益。文本特征包含了额外的增量信息,即文本长度和情绪词能够影响相似度和未来超额收益之间的相关性,在控制了情绪变量和文本长度之后,文本相似度和未来超额收益率之间的相关性也是值得探究的方向。此外,本文还讨论文本相似性度量指标的影响因素和文本相似性对公司未来经营业绩的影响。为了保障实证结果的稳健性,本文通过增加公司特征层面和会计层面的控制变量、改变超额收益率的衡量方式、更换情感词典重新统计情绪词词频等方式对实证结果进行检验。本文研究结果表明文本相似度越低,即上市公司年报相较于前一年发生较大变化,风险调整后的未来超额收益越低。具体而言,当企业打破了年度报告中的常规措辞和内容时,这种变化具有与企业未来业绩相关的重要信息。在控制了情绪变量和文本大小之后,年本相似度和未来超额收益率之间的正相关性依然显著,且管理层讨论与分析部分文本相似度与未来超额收益率之间同样呈显著正相关关系。进一步分析发现,正面词语、负面词语、不确定性词、诉讼性词等情绪词的词频越高,年报文本相似度越低,此外,年报文本相似度与公司未来的利润总额与销售额显著正相关,即年报文本相似度越低,未来利润总额及销售额越低。本文主要的创新点在于:第一,不同于以往文献从财务信息的视角研究超额收益率的影响因素,本文从年报文本披露的角度研究上市公司文本信息对未来超额收益的预测能力,为年报文本信息的决策有用性提供了经验证据,丰富了年报文本特征经济后果的研究,以及国内年报文本特征在超额收益领域的应用。第二,本文通过对年报各章节文本的处理,分别考察年报全文本和管理层讨论与分析部分文本相似度对未来超额收益的预测程度,并结合有效市场假说证明市场的非有效性。上市公司年报包含多个章节,通过对年报特定章节相似性的分析,能够更全面考察相似度这一文本特征对未来超额收益的影响。最后,本文结合实证结论,提出了进一步完善年报披露制度、加强信息披露透明度等政策建议,并说明未来可能的研究方向。