R-means：以关联规则为簇中心的文本聚类

来源 :计算机科学 | 被引量 : 0次 | 上传用户：cwsyydr01

【摘要】

：

本文将k-means与关联规则(或频繁项目集)相结合,提出了一种新的文本聚类算法R-means.R-means算法以关联规则作为簇中心,通过类似于k-meams的迭代优化得到最终的簇.因此R-mean

【作者】

：

龙昊冯剑琳李曲

【机构】

：

华中科技大学计算机科学与技术系

【出处】

：

计算机科学

【发表日期】

：

2005年9期

【关键词】

：

关联规则频繁项目集簇中心关联文本聚类 R-means算法信息检索 Association rules Frequent itemset Means

【基金项目】

：

国家自然科学基金，重庆市自然科学基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文将k-means与关联规则(或频繁项目集)相结合,提出了一种新的文本聚类算法R-means.R-means算法以关联规则作为簇中心,通过类似于k-meams的迭代优化得到最终的簇.因此R-means不仅继承了k-means的简单性,而且用关联规则产生的簇描述易于为人们所理解.在几个实际数据集上的实验表明该算法可以得到高精度和高性能.

其他文献

从光缆故障看电子联行到县系统的风险

电子联行到县系统(中继行方式)的开通,对加快资金的周转速度、促进县级经济的发展起到了积极的作用.为保证到县系统的安全、稳定运行,大家都非常注意对计算机主机和通讯设备

期刊

电子联行县级经济系统风险资金开通周转发展备份计算机硬件

自治区教育厅组织集中收看全国抗击新冠肺炎疫情表彰大会

9月8日,上午10时,全国抗击新冠肺炎疫情表彰大会在北京人民大会堂隆重举行。习近平总书记向国家勋章和国家荣誉称号获得者颁授勋章、奖章并发表重要讲话,大会还对全国抗击新

期刊

国家荣誉称号北京人民大会堂党员干部先进基层党组织习近平总书记重要讲话勋章肺炎疫情

数据挖掘初探

作为一门新兴的技术,数据挖掘具有广泛的应用前景.本文着重介绍了数据挖掘的基本概念与过程,并详细讨论了数据挖掘的任务与发现方法.

期刊

数据挖掘关联规则聚类数据库数据融合知识发现

第45届国际电化学会议述评

期刊

电化学生物电化学电极过程

办公自动化系统与邮件系统并网的实现

央行办公自动化系统(简称"OA系统")是基于Lotus Notes Domino环境开发的应用软件.过去由于受总行邮件系统NOTES 4.6版用户注册的限制,我行办公自动化系统采用了独立的NOTES环

期刊

办公自动化系统应用软件电子邮件系统邮件服务器计算机网络

一种新的兼具自动性和可控性的地形生成方法

文章给出了一种面向虚拟环境的地形自动生成新方法。首先引入Perlin噪声作为地形高度生成器的基本模型,通过控制噪声的幅度和频率,生成形态各异的地形特征模板,然后从分形理论中的fBM数学模型出发,使用中点位移法对特征模板进行迭代处理,进一步生成丰富的地形细节。该方法的主要优点是自动性和可控性的结合,一方面根据设定的参数可以自动生成特征模板,以少量的数据来表征地形大致外貌,另一方面通过控制分形迭代参数

期刊