面向大文本数据集的间接谱聚类

来源 :计算机应用 | 被引量 : 15次 | 上传用户:huangyuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对谱聚类存在计算瓶颈的问题,提出了一种快速的集成算法,称为间接谱聚类。它首先运用K-Means算法对数据集进行过分聚类,然后把每个过分簇看成一个基本对象,最后在过分簇的级别上利用标准谱聚类来完成总体的聚类。将该思想应用于大文本数据集的聚类问题后,过分簇中心之间的相似性度度量方法可以采用常用的余弦距离法。在20-Newgroups文本数据上的实验结果表明:间接谱聚类算法在聚类准确性上比K-Means算法平均高出14.72%;比规范割谱聚类仅低0.88%,但算法所需的计算时间平均不到规范割谱聚类的1/
其他文献
针对高等学校机械类创新型人才的培养问题,从课程设置、教学方式以及考核方式三个方面,重点分析了美国内华达里诺大学、新加坡国立大学等国外大学在现代教育技术下机械类创新型
武术,是中华民族传统的体育项目。在其源远流长的发展过程中,它摄养生之精髓,集技击之大成,形成了较为系统的技击体系和众多的门派。由于中华武术根植于传统文化的沃土之中,蕴含了
重庆市石柱县卷洞大桥在使用过程中发生梁体严重滑移,急需抢险复位。研究分析该桥特点及病害成因,采用数控同步顶升设备进行多点顶推,并对桥梁进行纵向复位,对墩柱进行纠偏复
本文根据我国大学体育教育的实际情况及发展方向,论述了对大学生进行终身体育教育的目的意义。认为大学体育应为终身体育奠定基础,培养大学生锻炼身体的兴趣、爱好与习惯,培养大
2011年是“十二五”开局之年,河北省教育技术装备管理中心在“十二五”期间的工作主体思路是怎样的?
温室气体是怎样捕获热量并使我们的地球维持在一个相对适宜的温度区间?在某种程度上,这个问题的答案在于分子如何对具有能量的光子做出反应,这是个复杂的话题。不过即便如此,我们
针对应用型本科独立学院网络实践教学的目标、现状以及存在的不足进行了详细地分析,并就网络实践课程中如何有效提高实践教学质量进行了探讨。
本文运用社会学理论和文献资料法阐述了高校体育的工作方向、社会地位和社会价值,剖析了高校体育工作存在的不足,并据此构建了高校体育工作的新思路,提出高校体育应重视增强大学
本文通过对大学高年级学生参加体育锻炼情况的调查,分析了大学高年级学生参加体育锻炼不积极的原因,并对如何搞好大学高年级学生的体育锻炼问题进行了探讨,提出建议。
针对微粒群算法和混合蛙跳算法存在的早熟收敛问题,提出一种基于微粒群与混合蛙跳算法融合的群体智能算法。新算法将整个群体分成数目相等的蛙群和微粒群群体。在两群体独立进