情感分析方法在金融语料库中的应用

来源 :暨南大学 | 被引量 : 0次 | 上传用户:m6300
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网上每天都更新大量的金融信息,很多股民都会在网上分享自己对股票市场的看法,研究金融市场的网络舆情是对行为金融学的补充。利用互联网上的金融数据挖掘出有价值的信息,可以辅助金融机构及散户对投资的决策。本文研究情感分析的方法在金融语料库中的应用,探讨适用金融短文本的情感分析方法,可以进一步提高金融情感分析的正确率、F1值,进而更加准确判断金融市场的走势,帮助用户做出更加准确的决策。因此,本文首先在一些重要的财经网站收集了7514条金融新闻的语料,并由有金融背景的人员手工标注语料的情感类别;接着,基于以上的金融语料使用了tfidf,、ig,、chi等算法提取特征词,将上述算法提取出的特征词整合成初步情感词典,再进行手工筛选和调整,构建出较完整的金融情感词典;然后,分别使用多种统计方法将文本向量化,并对情感词的褒贬义和重要词的权值调整进行了比较研究;最后,使用SVM、随机森林、RNN、CNN、gcForest等多种机器学习方法训练情感分析模型。针对金融短文本,本文不仅对基于各种特征词的表示方法进行了探讨,而且对多种机器学习算法在金融语料中所取得的经验性结果进行了详细的比较和实验分析。
其他文献
数十年来丹麦国家政府和地方政府都不遗余力地推行区域供热政策,现代的区域供热已经成为该国供热体系之基石,同时丹麦也是在联合发电方面最有成就的欧洲国家.丹麦发展区域供
<正>教育大计,教师为本。教师队伍素质的高低直接影响着教育质量的高低,影响着人才的培养。随着课程改革的不断深入,教师队伍结构的变化、教师专业发展的需求对教师培训及教
本试验研究,以玉簪(Hosta plantaginea)带芽茎段为外植体建立无菌株系,进行离体再生体系优化,并在此基础上建立玉簪大规模试管苗工厂化生产模式。主要研究结果如下:1.玉簪无菌株系
<正>一、引言在国际政治舞台上不乏女性领导者的身影,她们和男性领导者一样在国际事务中发挥过(或仍然发挥着)重要作用。在《话语、政治及女性全球领袖》这本书中提及的女性
居民区是SAR图像中比较重要的一类地物,它的提取在许多方面有着重要的应用。给出了一种居民区提取方法,根据居民区具有的高亮度和规范的纹理特性,利用Sobel算子和Otsu阈值处
<正>思茅区位于云南省西南部,是普洱市的政治、经济、文化中心,全区总面积3928平方公里,辖5镇2乡,56个村民委员会和17个社区居民委员会、715个村(居)民小组,总人口31.05万,聚
目的研究肾移植术后就业与非就业对移植患者生活质量的影响和领悟社会支持的对比,进一步探讨系统化的健康教育内容和方法。方法采用世界卫生组织(WHO)生活质量量表简表(WHOQO
本文通过对一所高职院校英语专业学生的词汇水平测试,分析比较了构词法和定义法的词汇教学效果。三次对比测试的结果表明,接受构词法词汇教学学生的词汇水平在20天内有了显著
直肠癌是常见的消化道肿瘤,手术切除仍是其目前的主要治疗方法。早期直肠癌是指癌变仅浸润直肠黏膜或黏膜下层,近年来随着肿瘤早期诊断水平的提高,直肠癌局部切除术在临床上
目的:分析儿童头颅和垂体MRI影像学提示的鼻窦炎阳性率。方法:收集1~12岁儿童的头颅MRI图像,依据检查部位分为颅脑MRI组和垂体MRI组(均包含鼻窦层面),以扫描野中出现鼻窦炎样