基于文本和图像结合的微博情感分类方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:victor530505911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,微博自2006年以来已经成为社交网络的主要应用之一。用户可以通过各种终端设备,手机或者平板电脑在微博上发布消息。近年来,从微博数据中挖掘出有价值的信息引起了很多研究者的关注,同时基于微博的情感分析已经有了很多研究,但是目前绝大多数的研究都只是基于文本,结合微博图像进行情感分类的工作较少,而图像所能传达的情感信息要比文本丰富,也更加重要。只考虑基于图像的情感分析,我们就会忽略上下文和背景信息;只考虑基于文本的情感分析,可能导致分类结果不好。本文针对微博的文本与图像数据,提出基于文本和图像特征的情感分类方法。主要的工作如下:第一,基于多视图学习技术SVM-2K,识别出图像和文本的相关性,然后基于学到的图像和文本的相关性进行多视图分类,以便有效的利用图像来减少语义表达的多样性,从而提高了微博情感分类的分类精度。通过新浪微博数据上的相关实验验证了我们提出的基于文本特征与图像特征的多视图学习方法的有效性。第二,从特征融合的层面提出了基于潜在语义分析(LSA)的特征融合方法,该方法将文本特征和图像特征做了并行融合,通过潜在语义分析得到文本和图像的语义特征。将语义特征作为训练语料学习出分类器用于微博的情感分类。实验验证了该方法有效的提高的情感分类的效果。第三,针对微博字数少、模式多等特点,我们提出了一种基于相似度的近邻情感分类器。它将文本和图像分别映射成平面里的两个坐标,利用坐标距离确定每条微博的情感类别。在实验中验证了所提出的分类器提高了微博情感分类精度,并且比现有的方法(朴素贝叶斯和支持向量机)分类效果好。
其他文献
文本作为人们使用语言交流的重要媒介之一,在人们的历史活动中发挥了至关重要的作用。文本表示作为机器对文本理解处理的第一步,也显得越来越重要。当前语义表示方法,主要是
微蜂窝相比于宏蜂窝有着发射功率小、体积小的特点。第五代移动通信(The5th Generation,5G)在系统速率和用户容量方面尤其是多址接入方式有更高的要求。非正交多址接入技术由
近年来,由温室气体排放导致的全球变暖现象正受到国际社会的广泛关注,全球变暖会引起降水量重新分配、海平面上升、冰川和冻土消融等问题。与此同时,废水、废气、废渣污染物的排放也一直在危害自然生态系统的平衡和威胁人类的生存。在我国,针对于温室气体的研究正不断开展,同时在与温室气体相关的国际会议上我国也扮演着越来越重要的角色。随着国家“十三五”战略性新兴产业发展规划、国家“十三五”控制温室气体排放工作方案和
随着城市化进程加快,城市居民消费水平大幅提高,各种社会经济活动都会产生大量的垃圾。据统计,全国三分之二的城市处于垃圾的中心,每年都有超过5亿平方米土地遭到垃圾的侵蚀,造成300余亿元的直接经济损失。今后30-50年是我国人口和城市化的高峰期,可以预见城市生活垃圾的清运系统和清运能力即将受到严峻挑战。目前,我国大多数城市是“混合收运、集中处理”的生活垃圾收运处理模式,但这种模式较为传统守旧,不仅不利
随着大数据时代的到来,人们在分享大数据带来益处的同时,也遭遇到大数据带来的麻烦。当搜索某种信息时,相关信息可能会铺天盖地而来,面对这些海量数据,人们往往无法快速定位
近年来,关于学生文化素养的研究在英语教学领域日益受到重视。但此类研究多以大学生为研究对象,鲜少涉及高中生。因此,为了更有效地提高高中学生的英语文化素养水平,有必要了解目前高中学生英语文化素养现状。本文通过对玉林市县级高中学生英语文化素养现状的调查,旨在发现学生英语文化素养现状存在的问题,分析问题原因,进而提出更好地提高高中学生英语文化素养水平的改进建议。本研究以人本主义理论为理论基础,对包括北流高
目的:评价丙泊酚/七氟醚配伍对轻度认知功能障碍(mild cognitive impairment,MCI)大鼠海马神经元GABA_A受体(GABA_Areceptor,GABA_AR)α1/α2亚基蛋白稳态和抑郁状态的影响,从而为临床阿尔茨海默病(Alzheimer’s disease,AD)高危转化状态的MCI患者围手术期优化麻醉管理、维护脑健康提供临床指导和依据。方法:本实验采用16-18月
近年来,随着钢结构发展,剖分T型钢可用来替代双角钢用在钢桁架中作为上下弦杆,同时使得构造简化,具有较好的经济效益。T型钢应用中主要的受力形式为轴压或剪心受压。目前,国内外多数钢结构设计规范在构件承载力计算时存在一些不足。如我国规范在承载力设计时,忽略板间相互作用,不考虑应变强化等。欧洲钢结构设计规范采用截面分类法对构件进行设计,根据板件宽厚比,把截面分为四类,在第Ⅱ和第Ⅲ类截面设计时存在不连续的断
针对多功能电声测试系统不能测试蓝牙电声设备的缺陷,进行了一系列改进,并对电声测试系统开发过程中遇到的一些技术问题提出了可行的解决方案。改进了多功能电声测试仪。将US
随着全面建成小康社会,脱贫攻坚之决战决胜之年的到来,我国城镇化水平进一步提高,这也使得各大中型城市的交通问题变得更加突出。现如今,虽然城市的公共交通系统日趋进步,但是现存的各类城市公共交通的组织形式仍然有待加强完善。因此,本文进一步发掘现有公交系统不足,从需求响应型公交和定制公交出发,提出一种半定制公交的概念,并且对这种半定制公交系统站点的选址和路径的设计进行了相应研究。本文主要的研究内容如下。首