基于文本分析的投资者情绪对我国股票市场的影响研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:heiying123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为金融学对传统的有效市场假说做出了修正,认可投资者情绪对资产定价的影响。近年来,内地的金融市场蓬勃发展,投资者们展现了极大的参与热情,我国股市中,散户投资者占据了绝对比例。同时,伴随着互联网的不断升级,各种股票论坛纷纷涌现,是投资者们交流分享的重要途径。投资者们的情绪通过网络不断传染壮大,成为影响我国股市的一股力量。本文通过网络爬虫获取论坛上大量发帖信息,组建合适的情感词典进行文本情感分析,构建多维度的投资者情绪指数,并在建立回归模型后得出投资者情绪与股票收益率的关系。目前国内外研究中,研究投资者情绪主要有三种方法。其一是通过问卷调查法直接获取受访者情绪,最为直接,但对样本的选取、问卷的设计等要求较高,且需要整理归纳的时间较长,结论具有一定的滞后性。其二是通过市场交易数据构建投资者情绪指数,该方法客观便捷,但对于交易数据的选取没有定论,且忽略了政策和市场环境对投资者情绪的影响。其三是通过文本分析法构建情绪指数,时效性和真实性比较高,近年来这种方法逐渐兴起,本文也采用了这种方法构建指数。之后在解读了投资者情绪的相关理论后,提出了四项假设。假设1:投资者情绪极性与股票收益率正相关。假设2:投资者情绪分歧度与股票收益率正相关。假设3:投资者浏览频繁程度与股票收益率负相关。假设4:发帖频繁程度与股票收益率负相关。本文选择东方财富股吧中的上证指数吧作为文本数据的来源,通过编写python爬虫脚本,获取发帖时间在2020年1月1日至2020年12月31日之间的帖子内容及其发帖日期和阅读数。随后将数据进行筛选和预处理,选择jieba工具对文本进行分词。之后构建文本情感词典,包括正面情绪词典、负面情绪词典、否定词典、停用词典和程度副词典。最后编写情感分析脚本,根据情感词典,将所有的文本数据分为三类:积极、消极和中性。本文构建了四项情感指标用于刻画投资者情绪。情绪极性是刻画投资者心态倾向为积极、消极或者中性的指标。情绪分歧度衡量了投资者情绪的统一程度,判断投资者情绪是否有相同的倾向。投资者关注度衡量了投资者浏览股吧中帖子内容的积极程度。活跃度衡量了投资者发帖的积极程度。考虑到沪深300指数收益率既能代表沪深两市的情况,又有较强的流动性容易受投资者情绪影响,本研究中将其作为研究的对象。同时,引入隔夜SHIBOR利率、香港恒生指数收益率和沪深300指数成交量作为变量,加上投资者情绪极性、投资者活跃度、情绪分歧度和投资者情绪极性共同构成解释变量。本文先研究了投资者情绪与整体沪深300指数收益率的关系,随后根据当日沪深300指数收益率的正负,将数据分为股票上涨和股票下跌两类,对这三种情况下分别进行研究。首先对数据进行描述性统计,分析其数据特点。随后对数据进行ADF单位根检验和相关性检验,确保数据能够进行回归建模。最后,根据P值和调整后的R平方值,分别建立关于沪深300指数收益率的全年,上涨和下跌的回归模型。研究发现,投资收益率为正时,投资者情绪极性明显更倾向于积极,投资者情绪极性与全年沪深300收益率和收益率为正时的收益率正相关,研究结果接受假设1。对于投资者情绪分歧度而言,相比于股票上涨,在股票下跌时,投资者情绪的分歧更大,呈现两极分化,且情绪分歧度与全年收益率和收益率为正时的收益率正相关,研究结果同样接受原假设。至于投资者关注度指标,从整体股市上看,其与沪深300收益率负相关,接受假设3,投资者越积极的关注股市,沪深300收益率越低。最后关于投资者活跃度指标,当收益率为正时,活跃度与收益率呈正相关,而当收益率为负时,活跃度与收益率呈负相关。研究结果拒绝了假设4。
其他文献
21世纪以来,全球经济、贸易一体化进程不断增强,中外体育交流愈发频繁,中国承办了许多国际大型体育赛事,如2008年北京奥运会、2010年广州亚运会、2022年北京冬奥会等。语言是人类沟通的桥梁,目前大型体育赛事语言服务也在加速发展、优化。优质的语言服务,畅通的沟通交流渠道是大型体育赛事成功举办的必要桥梁,也是衡量举办国举办水平高低的重要标准之一。因此,大型体育赛事语言服务对翻译者乃至翻译软件设备等
会议
目前,银行业的信贷风控问题较为严峻,银行内的不良资产,不仅会对银行金融机构本身造成影响,严重的还可能在金融机构间造成违约风险的传染进而影响社会经济的发展。当前,对于公司信贷业务的风险把控主要还是依靠人为主观判断,手段和方法比较单一。机器学习的发展给银行业信贷业务风控管理带来了新的理念和机遇。借助机器学习算法,学习公司信贷客户多维度的全面信息,预测贷款违约的可能性,尽早采取对应措施、调整授信策略,将
学位
近年来股票市场的发展越来越受到大众的关注,科创板上市,创业板涨跌幅改革等,为市场注入了新的活力,新增投资者数较以往也有大幅度的提升,现有投资者已近1.9亿(数据来源:上海清算网,截至2021年8月数据),80、90甚至00后加速进入市场,信息获取及互动交流的渠道与方式也已有很大不同,更侧重个人情绪表达,反馈方式也更加直观高效。券商针对当前形式衍生出的新型需求,同时也在积极进行服务方式探索,如直播、
学位
<正>带电粒子在速度选择器中的速度大于或小于E/B时,其运动轨迹是圆摆线,一般的处理方法是将运动轨迹分解成匀速直线运动和匀速圆周运动。很多学生对此感到困惑:这样的分解真的合理吗?当粒子偏转时,电场力做功,速度发生变化,洛伦兹力的大小和方向也都发生变化,这难道不会对圆周运动轨迹的半径产生影响吗?关于这个问题,网上亦有相关证明,但都是利用微积分和常微分方程解决,超出学生的认知水平。下面,探讨如何帮助学
期刊
股票市场是反映国家经济情况的晴雨表,股价趋势也受到广大金融投资者的密切关注,因此对于股价的预测始终是非常重要且热门的主题。传统的股票分析主要是基于技术面和账面价值的分析。前者主要寻求依靠股价在时间周期上的波动来发觉价格变动规律,后者追求的是股票能带来的现实股利和账面价值。更进一步的办法是结合上述因素再构建的量化模型,通过因子筛选构建数学模型以解决预测问题。随着近年来深度学习技术的飞速发展,其自我优
学位
<正>理解核心概念是培育核心素养的关键。准确把握学生的学习起点、过程和结果,在单元整体教学中做好种子课、生长课和衔接课的教学,有助于促进学生深度理解教学内容。在单元教学中,重视“计数单位”这一核心概念的植入,有助于实现数的意义和运算整体性理解的学习进阶。核心概念教学要求把主题内零散的内容联系起来,促进知识与方法的迁移,它是促进有意义的、联系紧密的知识学习的一个实用而强大的工具。教材中教学内容的编排
期刊
随着投资意识的提高和基金行业的发展,基金为大众所熟知,但人们面对如此繁多的基金很难做出选择,况且大部分人对如何投资基金并没有规划,不能有效分散风险。而FOF因其专业性强、双重分散风险的特点,正能满足投资者稳定收益以及多样化资产配置的需求。FOF分散风险、稳定收益主要是通过大类资产配置、精选基金来实现,大类资产配置是FOF的投资框架,是FOF的重中之重,而如何有效预测风险是资产配置的关键问题。传统预
学位
外国直接投资(FDI)是国际转移的重要组成部分,在全球经济中发挥着重要作用。虽然大量的外国直接投资流动发生在经济合作与发展组织(经合组织)国家之间,但对发展中国家也特别重要。外国直接投资被视为增长催化剂,因为它可以为东道国带来管理技能,专门知识,进入国外市场的机会和技术。蒙古国是一个发展中自然资源丰富的国家,其经济越来越依赖采矿业。自2011年达到峰值以来,蒙古的外国直接投资一直在下降,蒙古政府采
学位
当今社会,随着经济不断发展,汽车成为家庭主流的代步工具。回看近十年各大汽车品牌在国内的销售排行发现,一批国内本土新品牌如春笋般拔地而起,其主要原因就是近些年传统汽车行业的衰退,以及新能源电动技术的发展,伴随着的人工智能,物联网(车联网)的兴起,大批软件公司和互联网巨头都纷纷选择投入到新型汽车产业中。这样的状况与趋势势必对产业链上的零部件研发企业带来了巨大的挑战。对于汽车零部件研发企业来说,其核心竞
学位
<正>带电粒子在均匀电磁场中的运动是电磁学的一个非常重要的内容,因为带电粒子在均匀电磁场中同时受到电场力和洛仑兹力的作用,而洛仑兹力又是一个变力,所以解决此类问题,常常要用到牛顿第二定律、动量定理、动能定理等知识,比较繁琐,容易出错.如果我们先给带电粒子配上一对大小相等、方向相反的速度,用以抵消它受到的电场力,则会使问题大为简化.
期刊