融合表情符号的微博文本情感分析

来源 :华侨大学 | 被引量 : 0次 | 上传用户:t381598972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一个综合性社交平台,因其多样性和实效性的特点受到大众的追捧,成为时下最流行的社交应用之一。微博中包含着大量的主观性文本。对微博数据进行情感分析,可以挖掘出公众对社会事件的态度、用户对产品的评价等信息,对舆情监管与预警、产品调研等应用都有重要意义。微博整体的情感极性由微博文本和表情符共同决定。但是目前大多数针对微博情感分析的研究对表情符并不重视。然而表情符号与微博情感倾向关系密切。因此,为了更加客观准确地判断微博的情感倾向,本文结合微博中表情符号的特点,进行微博情感分析,研究内容主要包括以下三个方面:(1)构建微博语料:对微博进行情感分析,需要大量的领域针对性强的微博语料和大量的人工文本标注工作。目前并不存在适合本文研究的含大量表情符且有标注的微博语料。因此,本文有针对性的构建了一个微博语料库,语料中包含有大量的表情符号。同时提出了一种融合表情符号和情感词的自动标注方式来减轻人工标注的工作量。(2)研究表情符向量化算法:如果要将表情符作为微博情感分析的考虑因素之一,就需要将表情符号进行特征提取。因此本文提出表情符向量化算法,首先定义表情符向量和描述向量,并对这两个向量的相似性建模,然后利用梯度下降算法确定表情符的向量形式。该算法能够保留表情符的语义信息,同时使表情符与词汇一样,能够应用到自然语言处理的各个领域中。(3)融合表情符的微博情感分析:卷积神经网络的网络结构决定了其能够抽取出微博文本和表情符号深层的语义信息。因此本文利用卷积神经网络的分类模型,以表情符向量和词向量为基础,训练情感分类器并进行微博情感分析。实验结果表明,相对于忽略表情符的纯文本情感分析,本文研究的在微博文本中融入表情符信息的微博情感分析能够提高微博情感分类的精度。
其他文献
马恩认为,在机器大工业的历史运动中,封闭落后的小农经济将被社会化大生产所吞没。列宁总结苏俄用社会化大生产取代俄国传统村社的实践经验,确认小农经济将长期存在。新经济政策
情感是人对现实世界的一种特殊的反映形式,反映具有一定关系的主体和客体之间的关系。教育者可以通过情感教育传达积极的情感,抑制受教育者的消极情感。本文着重探讨情感教育在
近年来,全国高校的大学生心理健康教育工作发展迅速,多数高校都构建了自己的心理健康教育模式。但是,由于我国高校心理健康教育工作起步较晚,多数高校在理论和实践等方面还存在着
木桶原理对企业进行有效领导具有很大的启发意义.企业的兴衰成败在根本上取决于领导者,取决于领导者的素质.在如何提高企业领导者素质、优化领导集体素质结构、如何改进领导
亲们,当你们看到我的这篇文章时,我正奔袭在去西藏的路上。或许正沐着雪域强烈的阳光眯起眼睛挣扎地看清前方的路;或许正在高原的刺骨寒风中伏低身体倔强地大声歌唱;或许正慵
青年毛泽东从自述其大同之鹄提出了大同之境,然在作《伦理学原理》批注时否定了其“大同之鹄”,其进行的工读活动、新村活动仅是作为一种改造社会的手段,而并无追求大同理想的意
情感教育是学校教育中的重要组成部分。本文结合笔者的教学实践,浅谈一下有关历史与社会中的情感教育。
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
为寻找更多适合天麻生产上培养蜜环菌的树材,选取桉树、天竺桂和女贞等8种贵州常见树材的枝或干作菌材接种蜜环菌,观察培养蜜环菌在生长过程中的接菌时间、色泽变化、顶端分
Taiwan was a frontier society during the Qing dynsty. Following the influx of migrants the, environment was gradually transformed. New settlements were formed a