基于子类浓度可达快速发现任意形状聚类的新算法

来源 :中国科学院成都计算机应用研究所 | 被引量 : 0次 | 上传用户:bridge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在该文中,我们提出一个新的基于子类浓度可达的聚类算法——CLUDRESC(CLUster based on Density-REachability of Sub-Clusters),用于快速发现大型数据库中任意形状的聚类.在对核心子类聚类时,我们提出了新的子类直接浓度可达和浓度可达的概念,并将核心聚类定义为所有浓度可达的核心子类的集合.与已有的算法相比,CLUDRESC算法具有以下优点:1.通过于类间的浓度可达,而不是数据对象间的浓度可达,CLUDRESC大大减少了查找一个聚类所需要的时间:2.CLUDRESC用子类特征表示子类里面的所有数据对象,大大减少了所需的存储空间;3.在处理子类聚类时,CLUDRESC先对浓度高的核心子类聚类,得到聚类的总体结构,然后将边界子类分配到离它最近的核心聚类,从而发现更详细的聚类边界信息;4.CLUDRESC算法不需要领域知识来诀定输入参数,对异类不敏感.
其他文献
该文对搜索引擎系统的框架构成进行了探讨与完善,提出了一个可行的、基于P2P技术的搜索引擎系统的框架,并对该系统的部分构成模块在Linux下加以了实现.该文首先对搜索引擎技
该文通过对信息过滤一般过程的分析,将信息过滤中的相关技术引入到网络安全领域.研究了文档信息表示理论、中文信息处理的方法,利用VSM模型和TFIDF公式,实现了特定分类文档的
该文结合IP-VPN技术,对新型防火墙在Linux操作系统上的实现进行了深入研究.新的防火墙增强了TCP/IP层的安全性,通过重新编译了Linux操作系统的内核,在其TCP/IP协议栈中添加了
该论文围绕着有实际应用背景的FMS生产调度问题,主要在以下几个方面作了一些研究:1.该文给出了FMS系统的概念、组成和功能,并对FMS系统计划调度进行层次划分和层次关系的分析,
文章首先阐述了数据整合系统的实现方式.面向Web的知识表示、基于逻辑视图的查询等相关知识背景的最新研究状况;分析了数据整合系统的框架,并对现有方式进行了比较,提出通过
发动机工程数据库系统是一个具有分布数据管理能力的、面向CAD应用的数据库管理系统。本文阐述了发动机工程数据库管理系统(EDBMS)的体系结构,对事务处理与并发控制、数据库安
随着计算机自身以及计算机应用技术的发展,图像处理技术、视频技术、数字压缩技术等都得到了迅猛的发展。文字、图像和语言等多种信息形式构成了多媒体系统。目前,多媒体系统已
该文将着重讨论目前集成电路工艺在布线所引起的两个新的问题.首先,随着集成电路向着更高集成度、超小型化、高性能、高可靠性的方向发展,器件几何尺寸不断减小,芯片内部的连
该系统是与秦皇岛交通局合作开发的一个项目,目的在于开发一套比较完善的物流管理信息系统,以适应当前物流管理的需要和中国加入WTO的需要.该文详细阐述了基于客户机/服务器
在当今世界,交换信息已经是司空见惯的事。要想通过计算机进行信息交换,需要进行网络连接。在最近10年里,计算机局域网和广域网的技术和产品得到飞速增长。随着Internet的普及和