【摘 要】
:
数据挖掘就是从海量含有噪声和不规律的数据中,提取隐含在其中有趣的但并不为人们所知道的信息、规律或知识的过程。在数据挖掘领域,聚类已经在模式识别、图像处理和市场研究
论文部分内容阅读
数据挖掘就是从海量含有噪声和不规律的数据中,提取隐含在其中有趣的但并不为人们所知道的信息、规律或知识的过程。在数据挖掘领域,聚类已经在模式识别、图像处理和市场研究等领域中得到广泛地应用,所以对聚类的研究有着重要的理论与实践的意义。在聚类分析中,虽然现有的很多聚类算法能发现任意形状、任意大小的类,但用于多密度的数据集时却难以取得令人满意的结果。为提高对多密度数据集的聚类效果,文章从以下几个方面进行了研究:(1)首先简要的概述了数据挖掘的一些基本知识,同时对数据挖掘过程中的一些数据预处理方法做了简单必要的介绍。最后分析了一些常见的聚类算法的特点以及对比它们的优缺点。(2)在基于网格的聚类分析中,网格划分的方法对聚类的结果有着重要的影响,本文对网格划分方法进行了比较系统的论述,介绍了在不同网格划分方法的特点。在进行聚类分析时,网格边界点的处理对聚类的精度也有着一定的影响,所以文章又分析了几种不同的网格边界点的处理方法,并提出了一种新的网格边界点的处理方法。(3)文章在优化信息熵的基础上,提出了一种基于网格和信息熵的多密度聚类算法,它根据不同密度的网格所携带的信息熵,自动计算出密度阈值,找出在多密度数据集中不同的类。实验证明,该算法能有效的去除噪声,发现多密度的类,具有较好的聚类效果。最后,将提出的一种基于网格和信息熵的多密度聚类算法应用在图像分割上。实验证明,这种聚类算法在图像分割中是有效的。
其他文献
随着社会的不断发展,社会服务意识的不断提高,公共事业收费实现网络化、智能化已经成为一种必然趋势。自动化技术的发展推动了智能小区付费系统规范化、自动化和收费网络化的
计算机视觉技术的突飞猛进带动了整个智能视频监控产业链的快速发展,由此孕育的巨大商机激发越来越多的企业及研究机构投入到该行业的前沿技术研发中来。在这样背景下,基于图
无线Mesh网络是由无线Mesh路由器和Mesh客户端自组织成的一种新型无线网络。无线Mesh网络自组织、高容量、高冗余的特点使其得到广泛的研究和应用。目前无线Mesh网络上的路由
随着科学技术的迅猛发展,移动机器人的应用范围也日益扩大,遍及工业、农业、国防、宇宙空间、海洋开发、医疗康复等各个领域。其中,导航技术是移动机器人的核心技术,也是移动机器
深海采矿车工作于6000米深海底极其复杂的环境当中,海底稀软底质和海浪等各种扰动的存在,给深海采矿车的控制带来了极大的影响。位于深海采矿车前端的水射流采输装置担负着对
动力定位系统可以使船舶在海上保持一定的位置和方向,具有不受水深的限制、投入和撤离迅速等优点,对于许多进行海上作业的船舶来说,动力定位系统都是必要的支持系统。由于动
永磁同步电动机具有高转矩惯量比、高功率因数以及高效率等优秀特性,在高性能电气传动控制系统中得到了越来越多的应用。直接转矩控制是一种高性能的电动机控制方法,具有控制结
腹腔镜微创手术机器人在医疗领域的广泛应用,拓展了医生的手术能力,提高了手术的质量,减少了患者痛苦。鉴于腹腔镜微创手术机器人的诸多优势,针对此类机器人系统的开发已经成为世
在制药领域,新药的药效学研究是其中一个重要的方面。它主要是指对药物作用的观测和作用机理的探讨。药效学主要是在动物、离体脏器、细胞或者分子水平考察药物的作用。在细胞
伴随国际社会商品经济和信息技术的发展进步,人类社会对数据信息的依赖到了空前未有的高度。尤其近些年,随着互联网和云计算时代的到来,以及物联网概念的兴起,在各个传统行业