基于图的半监督情感分类算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户：JK0803_gengjixiang

【摘要】

：

在互联网快速发展的今天,“大数据”的存储和使用,已经成为信息技术领域急需解决的问题。文本数据作为人类知识的载体,意义非凡,如何运用大量未标记样本来提升文本情感分类的

【作者】

：

郑文静

【机构】

：

南京邮电大学

【出处】

：

南京邮电大学

【发表日期】

：

2016年期

【关键词】

：

半监督学习聚类核图情感分类文本表示模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在互联网快速发展的今天,“大数据”的存储和使用,已经成为信息技术领域急需解决的问题。文本数据作为人类知识的载体,意义非凡,如何运用大量未标记样本来提升文本情感分类的精度,也变得愈发重要。本文主要研究了基于图的半监督情感分类算法,创新工作如下。(1)将半监督学习中重要的聚类核算法应用到情感分类问题中,给出了基于聚类核的半监督情感分类算法。首先在标记样本和未标记样本上,建立加权无向图后,求解聚类核。然后将该核函数用于SVM情感分类器的训练上,完成分类工作。该方法直接将未标记样本所蕴含的信息融合到核中,不需要建立多个分类器。实验表明,该算法在分类精度上明显优于基于Self-learning SVM和Co-training SVM的半监督情感分类算法,且在不同数据集上都有较好的适应性。(2)将聚类核算法同图最小分割法相结合应用到情感分类问题中,建立了基于图聚类核的半监督情感分类算法。首先在所有样本上进行构图,对邻近标记点和未标记点分别给予不同的权重。然后,求解出基于该图的聚类核,将通过聚类核从新表示后的数据带入到图最小分割法中,得到更好的分类效果。该算法更好的满足半监督学习的基本假设,有效利用了未标记样本中蕴含的信息。实验表明,该算法在分类精度上明显优于其他半监督情感分类算法,且不同数据集上都有较好结果。(3)将Graph-of-words文本表示模型引入半监督情感分类问题中,提出了两种基于Graph-of-words的半监督情感分类算法。在文本预处理过程中,使用Graph-of-words模型进行文本向量化,然后将上述模型与前面提出的分类算法想结合,完成情感分类问题。该算法考虑了文本表示方法对于情感分类算法的影响,进一步了提高半监督情感分类算法的分类精度。实验表明,基于Graph-of-words模型的半监督情感分类算法在分类精度上明显优于前面列举出的算法,改进效果明显。

其他文献

谈谈分组管理策略在班级管理中的运用

本文介绍在班级学生自主管理模式中,如何通过运用分组合作竞争的做法提高班级管理的有效和持久.比较详细谈到了小组的组建,小组的管理,以及在日常管理中的操作,同时列举许多

期刊

班级自主管理分组管理策略运用

离散薛定谔方程组解的存在性研究

本篇论文主要研究几类半线性离散薛定谔方程组非平凡解的存在性问题.　　第一章我们首先介绍离散薛定谔方程组解的存在性的一些研究背景及相关的概念、记号和一些定义.　　

学位

离散薛定谔方程组超线性渐近线性弱环绕定理Ambrosetti-Rabinowitz条件

宽相依结构随机和尾概率的渐近性

本文得到了宽相依结构随机变量列的Rosenthal型不等式，即若{X，Xk，k≥1)是一个宽相依随机变量列，共同的分布函数为F(x).则对任意1≤t≤2，p≥t，存在仅依赖p，t的常数C(p，t)使得受此启发，

学位

随机和Rosenthal型不等式有限时破产概率复合更新风险模型尾概率渐近性

单源点危化品应急疏散问题的算法研究

随着科学技术的不断进步,化学品在日常的生产、生活中被广泛使用。近些年来,随着各类科学技术的高度发展和各种极端天气现象的不断发生,危险化学品事故造成的危害与损失也随

学位

危化品事故应急疏散累积浓度单源点允许等待

碱性过硫酸钾法测定总氮空白探讨

总氮在测定过程中存在空白值偏高的问题，从实验用水、使用仪器、试剂等过个方面进行着手实验，经过一年多的实验分析及总结，过硫酸钾试剂、水温、行业等多个方面影响着空白值。“

期刊

空白值偏高过硫酸钾水温

增强医学生法治教育的思考

医学生法治教育要求广大医学生学习法律知识，培养法律素质，树立依法行医的理念，这也是全面依法治国和实施素质教育的具体要求。本文阐述了增强医学生法治观念的重要性，分析了新形

期刊

医学法治高等教育

生态绿洲——大兴安岭黄桂林摄影作品选(一)

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

摄影作品人间仙境

经营用户是传统零售商转型关键——对话亿玛公司创始人、总裁柯细兴

拥抱互联网已成为当下及未来传统零售商聚焦的关键点,但在迈向线上的转型融合之路中,大多数零售商的线上业绩、知名度、影响力都还难与纯电商相提并论。拥抱互联网已成为当下

期刊

公司创始人融合之路线下网购移动端商业逻辑营销费用替代关系成长速度营销平台

五维分数阶超混沌Lorenz系统的动力学分析与同步

近年来，分数阶混沌系统的研究大多都是三维或者四维的，关于分数阶高维系统的研究较少。所以这就激发我们对一些高维系统的研究，特别是一些高维数的超混沌系统。而超混沌系统的发

学位

五维分数阶超混沌Lorenz系统自适应控制自适应同步稳定性动力学分析

E-H型激波反射透射结构的稳定性

本文研究2维情形E-H型激波反射透射结构的稳定性.一般地，一个冲击波撞击两种介质交界面会形成复杂的激波结构.当入射波与交界面夹角小于一临界值时，会形成一个透射波，一个反射波

学位

E-H型激波反射透射结构线性混合型方程位势流方程结构稳定性

基于图的半监督情感分类算法研究

与本文相关的学术论文