基于特征关联的跨领域情感分类方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:Northbay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络数据大量、快速的产生,出现了博客、商品评论等信息,这些信息以文本的形式存在,具有情感倾向性。因而如何自动识别这些文本所表达的用户情感(如肯定或否定),在社会舆情分析、产品评估等实际应用中日益重要。然而,情感分类的准确率极易受到数据所在领域的限制和影响,某一领域的分类器难以适用于另一领域,而同时,标记信息难以及时获取,从而使得传统的情感分类算法面临着巨大的挑战。为此,跨领域情感分类的研究受到了广泛地关注。跨领域情感分类就是利用一个已标记的领域去预测一个新的未标记领域的情感极性。本文针对已有的跨领域情感分类方法中存在的问题展开研究,主要的工作如下:(1)首先对跨领域情感分类进行了总体地概述,主要包括其发展背景、意义、相关定义、主要的研究问题与分类以及研究现状。(2)为了解决跨领域情感分类中目标领域无标签问题,提出了基于特征极性调整的跨领域情感分类方法APW。该算法以共现特征为桥梁,通过共现特征极性不断调整将原始领域样本标签传递给目标领域,实现目标领域的分类。实验结果表明APW算法在分类性能和时间性能上具有较大优势。(3)为了解决特征分歧和极性分歧问题,提出了基于特征极性传递的跨领域情感分类方法TPW。该方法首先选取具有较高极性的领域通用词;针对极性分歧问题,基于原始领域与目标领域的分布距离来重置通用词的极性;针对特征分歧问题,利用通用词作为桥梁,基于特征共现关系将原始领域特征的极性传递给目标领域,从而实现目标领域样本的标注。实验结果表明,TPW算法在分类性能上取得了较好的结果。
其他文献
随着互联网技术的迅速发展和普及,人们的学习和工作对于互联网的依赖性越来越大,人们希望通过互联网来获取需要的各种信息资源,以方便自己的学习和工作。用户要想准确地获取
近年来,随着信息化进程的加快以及社会经济生活对信息技术的依赖日益加深,大众对计算机信息系统的安全性提出了更高和更严格的要求。安全问题是关于信任的问题。数据库管理系
随着电子邮件在世界范围内的广泛应用,垃圾邮件作为商业广告、恶意程序或敏感内容的载体,对系统安全和人类生活所造成的影响越来越严重,反垃圾邮件问题作为一个全球性的课题具有
行人检测及姿态估计是计算机视觉领域备受关注的前沿方向和研究热点,主要是通过智能化的分析,对图像序列或者视频流中的行人进行自动的检测并估计行人在图像中各个部件位置及
随着网络应用需求的多样化,各种新的协议、算法不断出现。在研究阶段,需要对这些新技术的各种特性进行深入的分析和比较。为了在实验室的网络环境中模拟出接近于真实的网络场
网格公共支撑平台使用网格技术将广域网上分散、异构、局部自治的巨大资源整合起来,作为一种网格中间件为网格应用工具提供一个核心的管理集合。数据管理是网格系统中的核心
高性能远程技术支持系统是信息产业部电子发展基金所资助的项目。在Internet迅猛发展的今天,由于用户对Internet服务质量的要求越来越高,所以如何更好地理解网络变化情况、如
随着信息技术的高速发展,数字图像急剧膨胀。如何快速提取感兴趣的目标图像,成为海量信息处理面临的瓶颈。聚类分析近十年来发展迅速,被广泛应用到人工智能、信息控制、医疗
Internet技术的飞速发展和计算机技术的广泛应用,给社会和人们的生活带来深刻的变革。由于越来越多的机密信息保存在计算机系统中,不但造成了数据库管理系统管理的信息越来越
对等网络(P2P)技术正在得到越来越广泛的应用,针对不同用途的P2P应用正在迅速流行。P2P技术引导网络计算模式从集中式向分布式偏移,也就是说网络应用的核心从中央服务器向网络