基于上下文语义的文本情感分类研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:jianyu128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会化媒体,即网络社交媒体,是人们可以分享彼此观点、经验和见解等的工具或平台。如何对评论文本进行分类,提取出其中的有效信息,情感分类技术尤为重要。本研究旨在更好地捕获上下文语义信息,提取上下文语义特征,进一步提高情感分类效果,为此,在前人研究的基础上提取上下文语义特征,对特征向量进行改进,用以提高文本情感分类效果。首先,构建情感词典资源,包括基本情感词典、网络情感新词词典、否定词词典、连词词典、程度副词词典和停用词词典。前人对情感词研究较多,而对标点符号在文本中的情感作用研究较少,本文归纳了标点符号在文本中的情感作用,构建了情感符号词典,设置相应的权值。对基础词典进行扩展,通过研究,给出一种基于Simple Good-Turing平滑的SO-PMI情感词典扩展算法,构建扩展情感词集1;同时,结合Word2Vec词向量工具计算语义相似度得到扩展情感词集2;最后结合两种方法构建的扩展情感词典,进行融合、去重,人工筛选后,构建扩展情感词典。通过实验仿真表明,构建的情感词典是有效的。然后,研究句子级情感分类,提取情感单元,构建句子情感向量。根据句子是由多个不同词性和符号的组合构建而成这一特性,构建了5项情感单元,包括诸如连词、否定词、程度副词、情感词和情感符号等在内的上下文语义信息。在句子向量化中,利用Word2Vec工具对预处理后的句子进行向量表示,结合构建的情感单元,调整原词向量以获得句子情感向量,使用基于注意力机制的双向长短期记忆网络模型进行句子级情感分类。实验结果表明,该方法有效地提高了句子级情感分类。最后,结合句子级情感分类研究,展开篇章级情感分类。首先使用Doc2Vec模型将篇章进行向量化,结合句子情感倾向和句子位置等上下文语义特征对篇章向量进行调整,得到篇章级情感向量,将基于注意力机制的双向长短期记忆网络模型用于篇章级情感分类。实验结果表明,该方法有效地提高了篇章级情感分类。
其他文献
目的:探讨芹菜素对Tca8113细胞增殖、迁移、侵袭的影响及其可能的分子机制,为芹菜素的临床抗肿瘤作用提供新的实验依据。方法:芹菜素处理Tca8113细胞,用MTT法检测对细胞增殖;
颗粒物质是我们生产生活当中广泛存在的物质类型之一,表现出丰富的力学性质.它既有固体物质的性质,同时又具有液体甚至气体的性质.这一特征使得孤立波在离散非线性系统中的传
背景与目的胆管癌是起源于胆管上皮细胞的胆管恶性肿瘤,具有早期局部浸润和远处转移的特点,被认为是恶性程度最高的肿瘤之一。AKR1B10是NADPH依赖酶,在多种肿瘤中过表达,通过
Ti02能带调控的方法数不胜数,但晶态材料的修饰有着独特的优点,如精确的结构信息、尺寸可调、多元素参与等。目前,钛氧簇合物在簇核和能带调控上已经取得了非常大突破,但是成
近年来,药物经呼吸道给药作为重要的非侵入性给药系统具有明显的优势,受到研究者很高的重视。然而,众所周知的是,和传统的注射给药比较起来,包括蛋白质和肽类药物在内的疏水
面对不断增长的能源需求和化石资源的大量消耗,高效利用可再生生物质资源代替化石燃料合成高值化学品已成为生物质能源化工领域的热点课题之一。本文优选了金属氧化物改性的分子筛催化剂,研究了纤维素催化裂解制备生物基高值化学品——对二甲苯的催化反应过程。主要的研究成果包括:(1)纤维素催化裂解催化剂的设计与优选研究。通过将P205和MgO掺入HZSM-5(HZ)改性催化剂,改变分子筛催化剂的表面酸性位点和孔道
近年来,肿瘤的发病率和致死率逐年增加,已成为危害当今人类生命和生活质量的重大疾病之一。虽然药物化疗是目前临床上治疗肿瘤的重要手段,却存在着无选择性杀伤正常细胞和肿
被继承人身故以后,遗嘱的落实和遗产的分配就被提上日程,遗嘱执行人按照遗嘱的安排承担遗产的管理和分配的工作,是遗嘱继承中的关键一环。香港富商龚如心去世之后,数百亿遗产归属不明,继承纠纷轰动世界。法院根据其遗嘱,确定由龚如心创办的基金清点和管理遗产后交付继承人,在遗产继承纠纷的五年间避免了遗产被恶意侵吞,遗嘱执行人的重要作用可见一斑。本文受审判实践中的案例启发,着眼遗嘱执行人制度的研究。继而通过理论研
目的:本研究旨在探讨UGT1A1*6和UGT1A1*28基因多态性在中国江苏汉族慢性期慢性髓性白血病(chronic phase chronic myeloid leukemia,CML-CP)患者中的分布,并分析其与尼洛替尼
预应力混凝土结构以其独有的优势,在我国建筑、水利、交通、铁路等各领域得到广泛应用,如今已在我国混凝土结构中占有很大比重。在施工和使用中,由于外界环境的侵蚀,导致预应力钢筋腐蚀,这将影响结构的安全性、耐久性和使用寿命。本文结合预应力混凝土梁的腐蚀试验,开展了预应力筋腐蚀后的抗裂和截面抗弯刚度研究。主要工作如下:(1)结合自制8片预应力混凝土梁的快速腐蚀试验,获得了不同的预应力筋腐蚀水平,进而对其腐蚀