R-means:以关联规则为簇中心的文本聚类

来源 :计算机科学 | 被引量 : 0次 | 上传用户:cwsyydr01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文将k-means与关联规则(或频繁项目集)相结合,提出了一种新的文本聚类算法R-means.R-means算法以关联规则作为簇中心,通过类似于k-meams的迭代优化得到最终的簇.因此R-means不仅继承了k-means的简单性,而且用关联规则产生的簇描述易于为人们所理解.在几个实际数据集上的实验表明该算法可以得到高精度和高性能.
其他文献
电子联行到县系统(中继行方式)的开通,对加快资金的周转速度、促进县级经济的发展起到了积极的作用.为保证到县系统的安全、稳定运行,大家都非常注意对计算机主机和通讯设备
9月8日,上午10时,全国抗击新冠肺炎疫情表彰大会在北京人民大会堂隆重举行。习近平总书记向国家勋章和国家荣誉称号获得者颁授勋章、奖章并发表重要讲话,大会还对全国抗击新
作为一门新兴的技术,数据挖掘具有广泛的应用前景.本文着重介绍了数据挖掘的基本概念与过程,并详细讨论了数据挖掘的任务与发现方法.
央行办公自动化系统(简称"OA系统")是基于Lotus Notes Domino环境开发的应用软件.过去由于受总行邮件系统NOTES 4.6版用户注册的限制,我行办公自动化系统采用了独立的NOTES环
文章给出了一种面向虚拟环境的地形自动生成新方法。首先引入Perlin噪声作为地形高度生成器的基本模型,通过控制噪声的幅度和频率,生成形态各异的地形特征模板,然后从分形理论中的fBM数学模型出发,使用中点位移法对特征模板进行迭代处理,进一步生成丰富的地形细节。该方法的主要优点是自动性和可控性的结合,一方面根据设定的参数可以自动生成特征模板,以少量的数据来表征地形大致外貌,另一方面通过控制分形迭代参数
在基于优势关系下的信息系统中引入了协调近似空间的概念,并证明了在优势关系下不协调目标信息系统也可以转化为一个协调近似空间,这进一步方便了基于优势关系下不协调目标信
随着时代的发展和技术的进步,高校档案的保存和管理模式也发生了很大变化,由原来的纸质档案管理模式逐渐发展成为电子档案管理模式。本文通过分析高校传统档案管理模式以及高
XML数据的过滤和分发是XML应用领域的研究热点之一.为了提高XML文档的传输效率,有必要进行压缩.本文提出一种应用于压缩XML文档的过滤和片断分发方法.实验表明,这种方法既保