面向大文本数据集的间接谱聚类 - 论文文献免费下载 - 搜论网

面向大文本数据集的间接谱聚类

来源 :计算机应用 | 被引量 : 15次 | 上传用户：huangyuli

【摘要】

：

针对谱聚类存在计算瓶颈的问题,提出了一种快速的集成算法,称为间接谱聚类。它首先运用K-Means算法对数据集进行过分聚类,然后把每个过分簇看成一个基本对象,最后在过分簇的级别上利用标准谱聚类来完成总体的聚类。将该思想应用于大文本数据集的聚类问题后,过分簇中心之间的相似性度度量方法可以采用常用的余弦距离法。在20-Newgroups文本数据上的实验结果表明:间接谱聚类算法在聚类准确性上比K-Mean

【作者】

：

侯海霞原民民刘春霞

【机构】

：

太原大学计算机工程系,山西水利职业技术学院信息工程系,太原科技大学计算机科学与技术学院

【出处】

：

计算机应用

【发表日期】

：

2012年12期

【关键词】

：

谱聚类文本聚类大数据集 spectral clustering text clustering large dataset

【基金项目】

：

山西省青年科技研究基金资助项目（2011021014-3）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对谱聚类存在计算瓶颈的问题,提出了一种快速的集成算法,称为间接谱聚类。它首先运用K-Means算法对数据集进行过分聚类,然后把每个过分簇看成一个基本对象,最后在过分簇的级别上利用标准谱聚类来完成总体的聚类。将该思想应用于大文本数据集的聚类问题后,过分簇中心之间的相似性度度量方法可以采用常用的余弦距离法。在20-Newgroups文本数据上的实验结果表明:间接谱聚类算法在聚类准确性上比K-Means算法平均高出14.72%;比规范割谱聚类仅低0.88%,但算法所需的计算时间平均不到规范割谱聚类的1/

其他文献

现代教育技术下国外机械类创新型人才培养模式及启示

针对高等学校机械类创新型人才的培养问题，从课程设置、教学方式以及考核方式三个方面，重点分析了美国内华达里诺大学、新加坡国立大学等国外大学在现代教育技术下机械类创新型

期刊

现代教育技术创新人才创新能力modem educational technology innovative talents innovation abil

中华武术的历史及发展趋向

武术，是中华民族传统的体育项目。在其源远流长的发展过程中，它摄养生之精髓，集技击之大成，形成了较为系统的技击体系和众多的门派。由于中华武术根植于传统文化的沃土之中，蕴含了

期刊

中华武术中国传统武术攻防格斗武术套路健身化武术竞赛规则艺术化格斗技术艺术性发展现状

卷洞大桥梁体复位技术介绍

重庆市石柱县卷洞大桥在使用过程中发生梁体严重滑移,急需抢险复位。研究分析该桥特点及病害成因,采用数控同步顶升设备进行多点顶推,并对桥梁进行纵向复位,对墩柱进行纠偏复

期刊

结构连续T型梁滑移顶推复位

试论对大学生进行“终身体育”的教育

本文根据我国大学体育教育的实际情况及发展方向，论述了对大学生进行终身体育教育的目的意义。认为大学体育应为终身体育奠定基础，培养大学生锻炼身体的兴趣、爱好与习惯，培养大

期刊

大学生终身体育兴趣态度

加强教育信息化基础设施以信息化带动教育化——访河北省教育技术装备管理中心郭晋保副主任

2011年是“十二五”开局之年，河北省教育技术装备管理中心在“十二五”期间的工作主体思路是怎样的？

期刊

教育技术装备信息化基础设施管理中心河北省副主任教育化“十二五”工作主体

分子振动与温室效应——译自美国教材Chemistry In Context：Applying Chemistryto Society

温室气体是怎样捕获热量并使我们的地球维持在一个相对适宜的温度区间？在某种程度上，这个问题的答案在于分子如何对具有能量的光子做出反应，这是个复杂的话题。不过即便如此，我们

期刊

温室效应分子教材美国振动温室气体大气层热量

应用型本科独立学院网络专业实践教学探索

针对应用型本科独立学院网络实践教学的目标、现状以及存在的不足进行了详细地分析,并就网络实践课程中如何有效提高实践教学质量进行了探讨。

期刊

应用型独立学院实践教学网络专业applicability independent colleges practice teaching network

高校体育的社会学评价及其工作思路启示

本文运用社会学理论和文献资料法阐述了高校体育的工作方向、社会地位和社会价值，剖析了高校体育工作存在的不足，并据此构建了高校体育工作的新思路，提出高校体育应重视增强大学

期刊

高校体育社会价值工作思路ollege Physical EducationSociological Value WorkingDirecion

对大学高年级学生体育锻炼情况的探讨

本文通过对大学高年级学生参加体育锻炼情况的调查，分析了大学高年级学生参加体育锻炼不积极的原因，并对如何搞好大学高年级学生的体育锻炼问题进行了探讨，提出建议。

期刊

大学高年级学生体育锻炼

基于微粒群与混合蛙跳融合的群体智能算法

针对微粒群算法和混合蛙跳算法存在的早熟收敛问题，提出一种基于微粒群与混合蛙跳算法融合的群体智能算法。新算法将整个群体分成数目相等的蛙群和微粒群群体。在两群体独立进

期刊

微粒群算法混合蛙跳算法信息替换策略随机扰动协作方式Particle Swarm Optimization （PSO） Shuffled Frog L

与本文相关的学术论文