领域间适应性情感分类方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:forsoother
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展与普及,网络上出现了越来越多的主观性言论。对于这些主观性文本的分析和挖掘,传统的基于主题的文本分类方法已经无法满足需求。因此,人们开始关注并研究这些主观性文本的情感分类。情感分类是一个领域相关问题,在一个领域训练的分类模型通常很难应用于另一个领域。如果针对每个领域都训练一个分类模型需要大量的标注数据。而标注数据的获得,需要耗费大量的时间和精力,代价非常高昂。因此,领域适应情感分类的研究具有很重要的应用价值。针对领域适应性情感分类,本文的主要研究和贡献如下:(1)针对不同领域特征统计分布的差异,提出了一种新的结合特征相似度计算的领域间特征选择方法,通过这种方法可以选择出在两个领域中具有相似统计分布的情感特征,从而提高了分类效果。(2)提出了基于质心迁移的领域间情感分类方法,该方法利用源领域的标注文本对目标领域的大量未标注文本进行分类,选择一部分可信度高的文本加入到训练集,同时去除源领域中距离目标领域测试集质心较远的文本,通过迭代逐渐缩小两个领域间的质心距离,减小领域间差异。实验表明,该方法能够显著提高分类的效果。(3)由于同一领域内文本可能具有不同的特征,而不同领域的文本也可能具有一定相似的特征,本文提出将两个领域的文本进行聚类,针对每个小类中的测试文本分别进行分类的方法。这种方法同样能够减少领域间的差异,提高分类的效果。
其他文献
聚类分析是数据挖掘的一个重要研究领域,已被广泛应用于统计学、生物学和市场营销等领域。目前学者已经提出了许多聚类算法。然而传统的聚类算法常常遭遇“维度效应",导致算
视频序列图像中对运动目标进行检测与跟踪是计算机视觉研究中一个相当活跃的领域,其目的是使计算机通过视频序列图像认知场景中的信息,并为图像分割、图像理解、行人识别、行为
当前,生命医学研究正处于后基因组时代。系统地分析和全面理解蛋白质之间通过相互作用完成生命活动的规律成为最热的研究问题之一。特别是,从大规模蛋白质相互作用网络中识别蛋
二维卡通动画以其丰富的表现力和独特的风格深受人们的喜爱,也广泛被应用于广告、教育、娱乐等领域。到目前为止,已有大量的二维卡通动画片被创作出来。二维卡通动画的制作是
工作流挖掘的目的是从事件日志中提取任务的执行轨迹信息,建立清晰的工作流模型。目前的算法大都采用局部策略,难以处理复杂的控制流结构,且抗噪音能力比较弱。而用于工作流
足球赔率是博彩公司根据其利用几年乃至数十年所积累的大量的、丰富的与足球比赛相关的各种数据数据,利用科学的、严谨的数学理论以及投注人心理研究等模型,通过计算得出的对于
无线传感器网络以其低耗自组、容错性好、易于大规模部署等优点,被广泛应用于军事、环境、工业和农业监控等领域。在无线传感器网络的应用中,节点的位置信息起到至关重要的作
随着科技的发展,视频图像的应用越来越广泛,视频图像中运动目标的分割是所有数字图像处理的重要环节,也是后续高级处理的基础,因此有关运动目标分割的研究就显得十分必要。运动目
随着Internet技术的飞速发展,隐藏在Web后台数据库中的信息资源因为其数据量大、结构完整受到了广泛关注,这些信息资源通常是由用户在Web查询页面提交查询请求后,以HTML页面
随着无线传感器网络(Wireless Sensor Network,WSN)在多领域的深入应用,WSN的重要性和前景变得越来越明确。WSN节点有限的运算能力和有限的能量等问题,吸引了来自不同学科的科研