基于注意模型深度学习算法的股评文本倾向性研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:sakurabb1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们已经进入大数据时代,互联网上存在的海量数据可以加以分析挖掘其内在的信息,而其中数量最多的即是文本数据。人们每天都会在微博,贴吧或是各种评论区留下对于产品的看法,对于电影的意见以及对于股票的评论。而这些数据包含了作者的观点和看法,如果能从这些数据中提取出情感指标,对于网络舆情风险分析,商品改良,用户吸引,信息预测等领域都将提高自动化程度,减轻人工筛选成本,因此文本分析对于无论是科研还是实际应用都有非常重要的价值。深度学习是目前应用较广的方法,其被广泛应用于自然语言处理,图片分辨,语音识别等领域中。而在自然语言处理领域,注意力模型是目前研究非常多的一个理论,该模型通过对于网络输出中间量进行加权处理,使得神经网络更关注于那些对文章产生重要影响的文本,降低整个网络的运行时间并提高其精度。注意力模型一般常用于文本翻译中,用以标注原文对译文翻译结果的重要程度。本文将该算法进行改进,同传统神经网络相结合,应用于文本分类任务中,并加入了CNN层以提取局部上下文信息。为加快注意力模型初始化速度,本文在神经网络上进行改进,引入TF-IDF权重矩阵辅助衡量中间词的权重,通过实验证明,这样可以在保证精度的情况下,降低初始化时间。此外文章还设计了对比试验,验证模型的有效性。并通过对爬取的股评语料库作为训练样本,验证算法在对专有领域的可行性,并将预测结果用于验证舆情指标同投资者信心指数间的相关性。
其他文献
目的探讨全麻气管插管复合骶管阻滞麻醉做小儿腹部手术的安全性和有效性。方法腹部手术患儿60例,随机分为全麻气管插管组(C组30例)和全麻气管插管复合骶管阻滞组(F组30例)。
2009年底,印度人维贾伊·夏尔马在班加罗尔自己的车间里用竹子作骨架制造自行车。32岁的维贾伊·夏尔马是一名木匠。同时他也是一名自行车爱好者。他用竹子代替钢管制
世界在变,而且变得比我们想象的更快。2010年,发展中国家GDP占世界GDP比重在历史上首次超过50%。"这个转折点特别重要,因为一切事物都是从量变到质变,凡事越过50%的分水岭,往
在市场经济条件下,国有企业成为市场主体,企业拥有全部法人财产权,以独立的法人财产对生产经营活动负责,承担国有资产保值增值的责任。企业要自主经营、自负盈亏.自我发展、自我约
目的采用不同方法估计基于医院门/急诊伤害监测病例漏报率,比较不同方法估计结果的差异并分析原因,以期对相关研究提供线索和思路。方法采用2次独立简单随机抽样的捕获再捕获
本刊讯 为落实国家林业局和埃及农业农垦部签署的《关于林业合作的谅解备忘录》的相关精神,了解我国防沙治沙工作取得的成绩、经验,研究援助埃及开展防沙治沙合作的可行性,2013
目的 研究复合性不完全断肢再植术围术期的护理措施。方法 选择2013年5月至2014年12月我院收治的36例行复合性不完全断肢再植术患者作为研究对象,分析36例患者实施复合性不完
实验主要考察混凝-超滤膜法联用处理油田采出水中乳化油的效果。选用三种混凝剂Al2(SO4)3,FeCl3,AlCl3用于预处理过程,通过改变混凝剂用量和进料液性状来筛选出效果优异的混凝
企业党组织在企业中处于政治核心地位。发挥政治核心作用,是党章赋予的权力和义务。也是中国特色企业的重要体现,随着党的工作重心的转移和企业改革的深化,新形势对企业党组织如