基于图的半监督情感分类算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:JK0803_gengjixiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网快速发展的今天,“大数据”的存储和使用,已经成为信息技术领域急需解决的问题。文本数据作为人类知识的载体,意义非凡,如何运用大量未标记样本来提升文本情感分类的精度,也变得愈发重要。本文主要研究了基于图的半监督情感分类算法,创新工作如下。(1)将半监督学习中重要的聚类核算法应用到情感分类问题中,给出了基于聚类核的半监督情感分类算法。首先在标记样本和未标记样本上,建立加权无向图后,求解聚类核。然后将该核函数用于SVM情感分类器的训练上,完成分类工作。该方法直接将未标记样本所蕴含的信息融合到核中,不需要建立多个分类器。实验表明,该算法在分类精度上明显优于基于Self-learning SVM和Co-training SVM的半监督情感分类算法,且在不同数据集上都有较好的适应性。(2)将聚类核算法同图最小分割法相结合应用到情感分类问题中,建立了基于图聚类核的半监督情感分类算法。首先在所有样本上进行构图,对邻近标记点和未标记点分别给予不同的权重。然后,求解出基于该图的聚类核,将通过聚类核从新表示后的数据带入到图最小分割法中,得到更好的分类效果。该算法更好的满足半监督学习的基本假设,有效利用了未标记样本中蕴含的信息。实验表明,该算法在分类精度上明显优于其他半监督情感分类算法,且不同数据集上都有较好结果。(3)将Graph-of-words文本表示模型引入半监督情感分类问题中,提出了两种基于Graph-of-words的半监督情感分类算法。在文本预处理过程中,使用Graph-of-words模型进行文本向量化,然后将上述模型与前面提出的分类算法想结合,完成情感分类问题。该算法考虑了文本表示方法对于情感分类算法的影响,进一步了提高半监督情感分类算法的分类精度。实验表明,基于Graph-of-words模型的半监督情感分类算法在分类精度上明显优于前面列举出的算法,改进效果明显。
其他文献
本文介绍在班级学生自主管理模式中,如何通过运用分组合作竞争的做法提高班级管理的有效和持久.比较详细谈到了小组的组建,小组的管理,以及在日常管理中的操作,同时列举许多
本篇论文主要研究几类半线性离散薛定谔方程组非平凡解的存在性问题.   第一章我们首先介绍离散薛定谔方程组解的存在性的一些研究背景及相关的概念、记号和一些定义.  
本文得到了宽相依结构随机变量列的Rosenthal型不等式,即若{X,Xk,k≥1)是一个宽相依随机变量列,共同的分布函数为F(x).则对任意1≤t≤2,p≥t,存在仅依赖p,t的常数C(p,t)使得受此启发,
随着科学技术的不断进步,化学品在日常的生产、生活中被广泛使用。近些年来,随着各类科学技术的高度发展和各种极端天气现象的不断发生,危险化学品事故造成的危害与损失也随
总氮在测定过程中存在空白值偏高的问题,从实验用水、使用仪器、试剂等过个方面进行着手实验,经过一年多的实验分析及总结,过硫酸钾试剂、水温、行业等多个方面影响着空白值。“
医学生法治教育要求广大医学生学习法律知识,培养法律素质,树立依法行医的理念,这也是全面依法治国和实施素质教育的具体要求。本文阐述了增强医学生法治观念的重要性,分析了新形
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
拥抱互联网已成为当下及未来传统零售商聚焦的关键点,但在迈向线上的转型融合之路中,大多数零售商的线上业绩、知名度、影响力都还难与纯电商相提并论。拥抱互联网已成为当下
近年来,分数阶混沌系统的研究大多都是三维或者四维的,关于分数阶高维系统的研究较少。所以这就激发我们对一些高维系统的研究,特别是一些高维数的超混沌系统。而超混沌系统的发
本文研究2维情形E-H型激波反射透射结构的稳定性.一般地,一个冲击波撞击两种介质交界面会形成复杂的激波结构.当入射波与交界面夹角小于一临界值时,会形成一个透射波,一个反射波