聚类问题算法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:sz_davild
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类在模式识别、系统建模、图像处理及数据挖掘等工程领域扮演着重要的角色。其基本算法广泛应用于生命科学、医学、社会科学、地理科学、工程科学等领域。聚类就是将数据对象分组为多个类或簇,在同一个类中的对象之间具有较高的相似度,而不同类中的对象差别较大,它是一种典型的非监督学习算法。本文对几种聚类算法进行了研究。主要研究内容包括: 一、本文针对传统K-均值聚类算法的不足之处,提出一种K-均值改进算法。聚类过程中,当类在调整前后变动不大时,保持该类的类中心不变。因此不必重新计算该类中心及样本与该类中心的距离。实验表明改进算法在保证精度的情况下,有效节省聚类时间。 二、提出一种基于粒度的层次聚类算法。该算法在一次迭代中,将距离小于某一阈值的两个类视为当前粒度下的邻近类,并对所有邻近类进行合并。不断重复这个过程,直到满足要求为止。实验表明该算法较之传统层次聚类算法,大大加快聚类速度。 三、CURE算法用多个点表示一个类,受其启发,提出一种基于代表点的聚类算法。首先将大量样本划分成个数相对较少的原子类,然后将所有邻近的原子类及子类合并,得到最后聚类结果。实验证明该算法能够识别任意形状、大小的类别,过滤噪声点,并具有近似线性的时间复杂度。 四、结合层次聚类与K-均值核聚类的优点,提出一种新方法。首先抽取部分样本,进行层次聚类。将其结果作为初始类中心,再进行K-均值核聚类。实验表明该方法能够有效的提高聚类精度。
其他文献
随着我国国民经济和城市化的发展,城市交通问题越来越严重。对城市交通网络进行交通疏散的计算机模拟,为安全、有序、有效的维护城市交通安全提供指导,成为了当前的研究热点。人
从2000年开始,IP多媒体子系统(IMS,IP Multimedia Subsystem)一直受到广泛的关注。IMS可以扩展新的3G业务,提供更强的业务控制和管理能力;融合固定接入网络和移动接入网络,向网络
近年来,随着多媒体技术以及网络技术的迅速发展,网络上的信息资源日益丰富。如何从海量的图像库中检索出满足人们需要的图像已经成为一个研究热点,与此同时,基于内容的图像检
近年来,虚拟化技术受到越来越多的关注。虚拟化技术作为最热门的IT技术之一,因其在降低软硬件资源消耗和提高计算资源的利用率方面的优势而受到青睐。在众多虚拟化技术中,Xen
本文在分析了现有公共卫生与医疗信息系统实现的问题与缺陷后,以公共卫生与医疗信息化的特点为基础,着重研究了以下两点内容:提出了利用Struts和Hibernate技术构建系统应用的
工作流是一个业务流程,用于表达活动及活动之间变化过程。工作流管理与工作流的控制和协调有关,它的主要特点是使处理过程自动化。它根据一系列定义的规则、把文档、信息或任
近年随着多媒体数据成指数级的增长,对于多媒体的分析和分类就变得越来越迫切。当人们在浏览和理解视/音频内容时,作为多媒体数据中标志性部分的音频,为人们的感知提供了重要
信息技术的发展对全世界来说都产生了极大的影响,是当前高技术发展中的主流技术,因为信息在人类生活中无处不在,无时无刻的不影响着人类的生活,对信息的获得和挖掘成为科学界关注
无线传感器网络作为一种新型的具有广泛应用前景的无线自组网络,其有效路由协议是目前研究的热点。随着研究和应用不断深入,对传感器网络提出更高的要求:为不同的业务提供有
虚拟现实技术是由计算机生成的人机交互的三维空间环境构成,它不仅能构建高度逼真的复杂虚拟环境,而且用户还可以和虚拟环境进行互动,增强系统的交互性和沉浸感。随着虚拟现实技