半监督文本分类综述

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:quanminyingyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  文本分类是人们日常工作中的经常遇到的一个问题,也是机器学习研究中一个引人入胜的领域。另一方面,半监督学习算法同时考虑有标记和无标记数据,显著的提升了学习的效果。近年来提出的一些半监督文本分类方法吸引了研究者相当的注意力。本文主要介绍了半监督文本分类的特点,理论和算法。
其他文献
目的:探讨Kazal 5型丝氨酸蛋白酶抑制剂(serine protease inhibitor of Kazal type 5, n SPINK5)基因突变致新生儿Netherton综合征(Netherton syndrome, NS)的临床特征及分
吊白块,为白色块状物,化学名称为甲醛合次硫酸氢钠[H_2C(OH)SO_2Na_2H_2O],常用于染布、造纸、橡胶等工业,含有原生质毒物甲醛。为了保障广大消费者饮食安全,掌握我市食品中
  选择性分类器通过删除数据集中的无关属性和冗余属性可以有效地提高分类精度和效率.因此,一些选择性分类器应运而生,但它们大都是针对完整数据的.然而,现实中的数据通常
  针对现有的学习方法主要用于一阶转换网,并要求存在具有大量完全时间对称例子的两个相邻时间片数据集,而在现实中很难满足这一条件,且对于多变量复杂转换网,效率和可靠性也很
  限制性贝叶斯网络研究是将贝叶斯分类问题应用于实际的重要环节。以往都是通过对所有网络结点统一控制的,这种限制方法忽略了不同结点的差异性。本文设计了对不同结点有不
  信息过滤是文本挖掘领域的重要课题之一。针对互动型网络媒体信息(如BBS),提出一种新的信息过滤方案,该算法主要从特征提取和分类器构造两方面对Bayesian方法进行改进,建立
会议
  空间数据集的对象之间存在空间关系,按一定的空间关系将空间数据分组,构成空间对象群.每个空间对象群包含类型多样的数量不等的空间对象.目前空间对象群聚类算法尚未见报道
会议
  AdaBoost作为一种有效的组合学习方法,但对稳定的Naive Bayesian (NB)分类算法的提升效果却不明显,本文从增加NB分类器的不稳定性和改进训练样本权重调整策略两个方面出发,
会议
一个老公,两个孩子,三年蜕变,四十不惑,那英的生活如今已经简化到一二三四就可以概括。事业的辉煌,过往的苦情,纸醉金迷的夜生活都如过眼云烟,散去了。云开雾散后,消失很久的
徐悲鸿长女徐静斐1996年患双髋关节骨头坏死,不能长时间站立,行走也比较困难。她虽然年近八旬,却耳聪目明,神清气爽,思维敏捷,毫无老态。    逃出家门投身革命    徐静斐1929年11月出生于南京,她是徐悲鸿和蒋碧微夫妇的长女。由于长期受张道藩的挑拨,蒋碧微把徐悲鸿赶出了家门,与张同居。徐悲鸿与蒋碧微于1945年12月31日正式离婚。  根据法院判决,16岁的徐静斐留在了蒋碧微的身边。她从小就