互联网财经新闻与股价波动的关系研究

来源 :首都经济贸易大学 | 被引量 : 4次 | 上传用户:daifei147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,越来越多的人会通过互联网来关注财经新闻,毫无疑问,大部分股民也会通过财经新闻来关注股价的走势情况。那么互联网财经新闻与股价走势到底有没有关系,哪些类别的词语与股价走势有关系,这都是股民所关注的事情,也是本文研究的重点。本文基于文本处理技术和回归分析技术,以新浪财经网站为例,通过网络爬虫获取到2015年1月1日到2016年9月30日新浪财经网站上所有关于融资融券类股票的新闻文本,利用文本分词及量化技术,对新闻文本进行量化处理,然后将量化后的数据进行分类处理,总共分为6个类别的词语。最后利用命名实体的方法将量化后的新闻文本数据与在Wind数据库中获取到的股票价格分钟数据进行匹配,得到用于回归分析的数据。本文以6个类别词语的权重值为自变量,以股票价格波动幅度和涨跌方向为因变量,利用多元线性回归模型探讨在总样本和沪深两市的两分样本下新闻文本中不同类别的词语与股票价格波动关系的差异;同时由于直接对股票价格涨跌幅度进行预测的效果非常差,因此本文尝试运用Logistic回归对股票价格涨跌方向进行预测。通过实证分析,得到以下结论:从总体来看,财经新闻文本与股票价格波动存在一定关系,各类别的词语与股票价格波动的关系存在一定差异。消极性的词语与股票价格波动有负向关系,积极性的词语与股票价格波动有正向关系。专有名词(公司经营状况类和交易类)与股票价格波动关系的密切程度大于情感词与股票价格波动关系的密切程度。在总样本和沪市样本下,6个类别的词语会随着时间的推移,与股票价格波动关系的密切程度会有细微变化。总体上来说,随着时间的推移,股票价格波动与经营状况类词语关系的密切程度基本呈下降趋势,与交易类词语呈上升趋势,而对情感类词语而言,它们之间关系的密切程度基本无变化。采用Logistic回归以财经新闻中的6个类别的词语为自变量对股票价格涨跌进行了预测,并对预测效果及原因进行了分析,为投资者及相关研究人员提供了一定的参考。对沪市股票价格涨跌的预测准确率高于对深市股票价格涨跌的预测准确率,新闻文本对融资融券类股票价格涨跌的最佳预测时间在10分钟左右。
其他文献
<正>一、设计说明与准备"社会主义建设道路的初期探索"是人民版必修二专题七"苏联社会主义建设的经验与教训"的第一课。相关的课标要求是,了解俄国国内战争后苏维埃政权面临
<正> 在现代经济社会中,交通运输是确保正常的社会生产和流通以及人们社会经济生活的基本条件之一,是社会经济的动脉。公路是汽车运输所不可缺少的最基本的交通设施。不仅如
麻醉学专业型硕士研究生和住院医师规范化培训的联合培养,是我国医疗卫生人才培养的重要战略,同时也向从事临床教学工作的教师提出了更高的要求。对于麻醉专业的学生,石河子
<正>肺癌是全球最常见恶性肿瘤之一,其发病率与病死率在过去的几十年内迅速增长,迄今为止,肺癌的病死率已居恶性肿瘤之首[1]。肺癌分为小细胞癌和非小细胞肺癌(NSCLC),NSCLC
当前,随着我国劳动力成本上涨、人口红利逐渐消失,构建以智能制造为特征的新型制造体系迫在眉睫。2015年5月,国务院印发了《中国制造2025》,部署全面推进制造强国战略,明确要大力
报纸
本文论述了包头市放射性污染源现状、分布、三废排放、污染源治理、废物处置、处理及评价。查清了放射性同位素种类、数量、活度及存放情况。为今后管理工作提供了依据。
<正> 中华民族是一个具悠久历史和文化传统的民族。由文化凝聚积淀的园林景观,清幽中见画意,细腻中见诗情,平淡中见蕴藉,变化中见新奇,可谓异彩纷呈,琳琅满目。中国园林(主要
<正> 由中国社会科学院少数民族文学研究所理论室、文化部民族文化司社文处、中国作协创联部民族处联合主办的全国第一届少数民族文学理论研讨会于一九九一年八月十八日至二
改革开放40年来,我国教研员承担了教学研究、教学指导、考试组织、教师培训、教育决策服务、课程政策研究、校本课程领导等多种任务,但受专业制度缺失、行为习性固化、理论研
伴随着中国经济的发展,金融市场与人们的生活越来越息息相关。研究表明突发金融信息会迅速给金融市场带来强烈扰动影响,而随着互联网技术和社交网络的快速发展,这种影响会被