与股票关联的财经新闻文本分类分级研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:qjinglihong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
财经新闻对股票市场的影响巨大,受到各类市场参与者的密切关注。计算机网络与便携设备提供了便捷的信息发布与传播渠道,也使得人们陷入“信息迷航”。如何从海量财经新闻中抽取出对某支股票而言价值最高的新闻,并根据信息价值量进行重要程度分级是值得探究的问题。这不仅可以实现信息序化,挖掘新闻价值,还可以作为基础性设施支持应用层的各类知识服务项目。本文拟从基础理论出发,利用机器学习相关技术方法,从海量的财经新闻中自动获取与某支股票相关联的财经新闻,并基于新闻价值量完成分类分级。为此,本文基于新闻价值量化理论,融入股票-新闻价值关联关系,建立“与股票关联的财经新闻价值量化指标体系”。利用自然语言处理、命名实体识别、主题词抽取、统计分析等技术方法从新闻数据与股票数据中提取特征,针对本文的研究情境构建相应的股票画像与新闻画像。以此作为数据基础,类比推荐系统的“召回”与“精排”过程,完成财经新闻的“分类”与“分级”。从理论上来说,本文提出新的分类思路,基于信息学、新闻学、金融学等各领域的科学理论建立与股票关联的财经新闻价值量化体系,面向不同股票评估新闻价值。在技术方法上,创新性地引入推荐系统框架解决文本分类问题,将与股票关联的财经新闻分类分级问题具像化为一个广义的推荐问题。不仅可以描述新闻与股票之间更为复杂的关系,而且支持各类外部辅助信息的融合,具有较强的可解释性、可扩展性和可移植性。其次,作为一项基础性设施,可以支撑不同的应用场景,例如股票投资者新闻推荐、股票市场波动分析等,具有广泛的实践意义。本文的局限性主要体现在股票和新闻关联关系的发现和抽取过程中。本文抽取股票与新闻的关联关系时,用到的主要是实体类、主题类等内容维度的信息;而股票与新闻之间还可以通过诸如关键人物、投融资关系等进行关联。后续研究可以考虑将股票画像与新闻画像中各个维度的信息通过知识图谱方式组织起来,抽取出更为含蓄、复杂的关联关系,更准确地衡量每条财经新闻与每支股票间的关联程度。
其他文献
2018年5月5日,正值马克思诞辰200周年,全球各国媒体掀起了一股纪念马克思的热潮。作为一个资本主义的批判者和共产主义的倡导者,“马克思的复活”在当今全球社会引发了一系列的争论,由此触发了全球媒介如何面对马克思的问题。本研究以全球记忆的理论视角出发,结合内容分析与话语分析的方法,以马克思诞辰200周年的媒体纪念报道文本为样本进行平行比较研究,考察各国媒介对马克思进行差异化解读背后的内在机制和结构
学位
媒介变革的网络社会新形态,重构着群体/共同体,同时也为个体认同带来新挑战。“性别认同”概念本身确定缺席的是“跨性别”,其始终围绕着“跨性别”的状态建构意义,然而目前“跨性别”一方面需要承受传统性别框架的压力,易被人们误解、歧视,影响日常生活和人际交往,另一方面整体上仍缺少学界和大众的关注,缺席主流和公共话语。本文以跨性别女性“药娘”为研究对象,主要采用网络民族志方法,从传播符号学角度关注,跨性别者
学位
作为承载着电视创作者的意图、蕴思、人物自身的性格信息,依托电视技术的多元表现,由身体中各个基本元素构成的活跃于屏幕之中的艺术形象,身体影像并不是身体本身,而是影像的身体。身体影像具有的诸多功能,尤其是其拥有的表征功能和沟通、投射功能,使得其不仅成为电视持有的“身体资本”,更成为人们建构社会中身体的重要坐标。因此,对于身体影像的研究就不应当是简单的艺术研究或者技术研究,而应将身体影像视为文化的客体。
学位
自上世纪80年代起,“可持续发展”理念作为应对环境危机的最高准则得到了广泛认同,而公众参与是落实“可持续发展”的重要面向。在环保公共领域生成的过程中,媒体充当着重要角色。公众依托新媒体技术的话语表达与传统的媒介生产一起,形成了保障其环境知情权、监督权和参与权等多层级、全方位的传播体系,成为环境管理中重要机制的组成部分。同时,作为个体的环境公民参与环保活动的话语表达常常使专家与政府官员的论述遭遇解构
学位
全球化浪潮的深入推进,促使文化交流在全球范围内的传播愈发频繁,构建民众的身份认同已成为当下世界的重要议题之一。2019年正值中华人民共和国成立70周年,由央视带头策划的《我和我的祖国》系列快闪活动备受关注并引发全国范围内的接力。这场激发集体情感共鸣的快闪活动在以互联网为代表的媒介助力下成为线上线下同构的文化盛宴。本文以詹姆斯·凯瑞提出的传播仪式观作为研究的理论框架,从文化的视角来探究《我和我的祖国
学位
伴随着商品经济社会以及互联网技术的高速发展,品牌广告的形式也变得更加多样化。作为一种话语,广告是对图像、声音以及文字的综合运用,具备天然的多模态特征。早期的话语分析以对文本的分析为主,忽视了其他话语表现形式。自上世纪九十年代起,西方学者开始将目光投向多模态话语分析。其中,Kress&Van Leeuwen在韩礼德的系统功能语言学基础上提出了图像的再现、互动和构图三大元功能,即视觉语法分析理论,并为
学位
隐私政策作为互联网企业公开个人信息收集、利用、共享和存储等规则的重要窗口,一直存在用户阅读意愿不高、传播效果不理想、内容不规范、企业执行不到位等问题。这些问题不但影响了用户体验,也使得个人信息保护“知情同意”的法治原则流于形式、名存实亡。基于此,本研究从用户感知出发,通过调查—实验法对影响用户阅读意愿、传播效果的影响因素进行实证研究。研究发现,隐私政策的可读性对用户的阅读意愿具有正向影响,同时阅读
学位
随着智能手机及其他移动智能设备的普及,无线网络的提速降费,人们的移动端媒介使用习惯和消费习惯发生了巨大变化:从“横屏”转至“竖屏”,竖频视频广告应运而生并呈现出强劲势头。相较于横屏视频,竖屏视频对屏幕的利用率更高,有更好交互性和代入感,受到了用户和市场的青睐。本研究从用户角度出发对竖屏视频广告进行分析和思考,选取当前在国内市场拥有庞大的受众保有量及活跃度的竖屏短视频APP抖音作为研究对象,结合当前
学位
智能营销背景下,借助大数据和人工智能技术,行为定向广告快速发展,成为网络广告市场的宠儿,既可以满足用户的个性化需求,也可以有效提高广告精准性。但是这种利用用户的数据来预测用户喜好并且进行精准投放的广告形式,会使用户产生心理抗拒和广告回避,而只有对用户这类心理形成正确认识,全面掌握与其相关的影响因素,才能够制定出减弱用户心理抗拒和减少广告回避的有效措施。本研究主要研究影响用户对行为定向广告心理抗拒水
学位
随着世界各国纷纷加入到经济全球化的进程中,跨国经济合作日益密切,越来越多的企业开始走出国门走向了国际市场,高净值人群的个人投资活动也不再局限于国内,逐渐拓宽国外理财渠道。与此同时跨国纳税人利用各国税制间的差异来减轻或避免缴纳税款的行为也越加频繁。经济全球化的不断加深也带来了恶性国际税收竞争,越来越多的国家对加大国别间税收征管合作与交流的力度的意愿愈加强烈,国际上普遍认为国家间及时有效地进行税收情报
学位