基于情感词典与规则结合的微博情感分析模型研究

被引量 : 0次 | 上传用户:xiao531313486
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪以来,中国互联网行业得到了蓬勃的发展,网民规模也逐年攀升。微博是近年来互联网上越来越流行的消遣方式,上到政商名流,下至普通百姓,皆乐在其中,微博已逐渐变成了许多人生活中不可缺少的元素。新浪微博平台每天都产生了数以亿计的微博来分享内容、传播信息,这庞大的用户量和数据量背后伴随而来的则是潜藏的商业、社会等多方面价值。对微博进行情感分析的研究,就是发掘微博潜藏的商业、社会等多方面价值的过程,研究微博情感分析能应用于舆情发现及监控、信息预测、产品评价及改进等领域。深入研究微博内容、获取微博情感倾向是非常有必要的。目前的微博情感极性分类方法存在着准确率较低、依赖领域知识、较少考虑句内句间关系等缺点,我们的研究希望找到一种方法使分类准确率能得到提高,方法的普适性能得到加强。基于此出发点,本文对结合情感词典与规则的微博情感分析方法进行了研究,主要内容包括以下两个部分:(一)本文通过构建情感词典,获取语义规则,以情感词为中心,归纳了6种情感词组合,兼顾情感词、否定词、程度副词之间的相互作用,结合情感词典与规则,运用微博子句情感值、整句情感值计算方法,最终实现了微博情感极性分类。实验表明,本文提出的方法比表情符号判别法、情感词典判别法、SVM判别法等方法的微博情感极性分类效果都好。(二)本文在(一)的基础上,研究转折连词对微博情感表达的影响,从转折连词的4种一般使用情形,考虑微博的句内关系、句间关系,引入转折连词权重系数来改进(一)的微博子句情感值、整句情感值计算方法,提升微博情感极性分类效果。实验表明,考虑转折连词的方法比之前方法分类效果得到了提升。整体实验对比验证了本文所提出的方法不依赖领域知识,普适性较强,准确率较高。
其他文献
本文首先基于PEST分析方法对世通利方传播集团的外部环境进行解析,从横向发展、纵向发展、内部管理结构、股权结构、人力资源、财务、客户等方面对世通利方传播集团当前的内部
农业对于保障粮食安全、减少贫困以及保护重要的天然资源方面是非常重要的,然而近代农业化工和制药产业的发展,药物和抗生素的滥用,对土地、环境和其它物种造成极大的危害,食
产权与政治是最为基本的两种制度安排,产权结构的调整对民主政治建设有着重要影响。通过“百村观察”调查发现,北社村是一个经济高度依赖村庄企业的典型非农村庄,受国家政策
本文主要从培养目标、招生考试与入学标准、培养方式、课程设置与实施、学位授予与评估、师资队伍等六大方面介绍了我国数学教育硕士的培养模式.并从欧美以及亚太地区选取了
自古以来,中医药在解药毒方药的文献记载与使用方面积累了丰富的经验。为系统深入研究中医解药毒方药治则治法及其配伍规律,本课题采用文献研究方法,以中国中医药数据库检索
政府信息具有让渡著作权财产权利、有偿化提供受到限制、无障碍性使用著作权等特性。我国对政府信息著作权的立法存在相关规定不明、垄断政府信息、收费政策不完善、市场开发
本文首先阐述消防设计的疏散楼梯在大型商业建筑中的重要性,然后就商场性质、人员密度和营业厅面积等因素对楼梯疏散宽度的影响进行分析和研究.
本文以日本某高速公路两段地下开挖隧道为研究对象,分别对处于土层刚性差异较大的封闭式隧道结构和处于软弱冲击粘性土的开放式隧道结构建立有限元模型,利用大型有限元分析软件
作为旅游产品中的一个重要类型,主题公园已成为现代旅游业中成长较快的一种现代旅游资源,成为在几十年以来世界旅游业发展过程中的新星。本文主要通过探究北京国际雕塑公园经营
随着我国社会主义市场经济的发展,社区成了与人们的日常生活和工作关系最密切的活动空间,尤其本文主要讨论城市社区。社区公共服务供给一直是社区建设的一个重要组成部分,而