基于粗糙集的多标签文本分类算法

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:fenghuah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  文本分类由于其广泛的应用得到人们普遍关注,但研究人员多以单标签分类为主要研究对象,而多标签文本分类研究相对较少。粗糙集理论是现今学术界研究的热点,已被广泛应用于机器学习,决策分析,知识获取等领域,且近来有研究人员将其应用于单标签文本分类。本文将粗糙集优越的约简理论应用于多标签文本分类,提出了基于粗糙集理论的多标签文本分类算法,该算法利用训练阶段得到的各个类别的分类规则与测试实例逐一匹配,得出实例的类标签集合,扩展了粗糙集理论在文本分类中的应用,实验证明算法有效可行。
其他文献
研究表明,高维数据的聚类都隐含在低维的子空间内,而这些子空间就是把原始数据投影到某些维度上的交集,于是相应的聚类算法就变成如何寻找合适的子空间内容。在此提出了一种新的
本次调查选择以浙江大学、杭州师范学院的 2 0 0 1届新生为对象 ,旨在了解考进大学的中学毕业生的科学素质现状 ,为本地区中学和大学进一步开展素质教育提供依据。
目的比较5种评分系统对急性胰腺炎病情的预测价值,为临床选择合适地预测急性胰腺炎病情的评分系统提供依据。方法分析113例急性胰腺炎患者的Ranson评分、APACHEⅡ评分、BISAP
提出了一种新的支持向量机分类器的设计方法.该方法利用主成分分析(PCA)及聚类技术在原问题空间中求解,减少了支持向量机分类器中支持向量的维数,且将原问题空间与特征空间中
目的探讨微小RNA-126(miR-126)、类表皮生长因子域7(EGFL7)在子宫内膜癌发生、发展中的作用。方法选择子宫内膜癌患者57例、子宫内膜增生症患者43例,分别取子宫内膜癌组织(内
目的探讨新疆和田地区维吾尔族乙型肝炎病毒(HBV)感染后发生慢性乙型肝炎的影响因素。方法选取新疆和田地区维吾尔族慢性乙型肝炎患者54例、HBV携带者51例,回顾性分析HBV感染
紫球藻在盐逆境的胁迫下,所产生的感应反映和适应机理有可能使其适应其他的逆境.在此以生长在1.5mol/L NaCl环境下并达到对数期的紫球藻为试验材料,观察测定光抑制或低温对光
银胶菊Parthenium hysterophorusL.是危害严重的入侵植物,在我国主要分布于华南和西南地区,在山东新近发现的种群与南部种群在遗传上有明显的差异。本研究采集山东种群及3个
提出了弱T-范数的定义,并给出了一个具体的弱T-范数,在分析该弱T-范数所具有性质的基础上,给出了用普通T-余范数构造一类具有上述性质的弱T-范数的方法。在一类不确定推理模型中,可以
全国第五届运动训练专业教学与管理研讨会于11月30日至12月1日在我校召开,来自北京体育大学、沈阳体育学院、上海体育学院、陕西师范大学和华中师范大学等全国30多所院校的50