网格聚类算法的研究

被引量 : 0次 | 上传用户:tmdjapanese
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术可以从大量数据中发现潜在的、有价值的知识,它给人们在信息时代所积累的海量数据赋予了新的意义。随着数据挖掘技术的迅速发展,作为其重要的组成部分,网格聚类技术已经被广泛的应用于数据分析、图像处理、市场研究等许多领域。网格聚类算法研究已经成为数据挖掘研究领域中非常活跃的一个研究课题。 本文介绍了数据挖掘理论,对网格聚类算法进行了深入地分析研究。在研究了传统网格聚类算法的基础上,提出了网格边界处理聚类算法,该算法使用边界处理技术提高了网格聚类的精度;针对网格聚类算法对参数敏感的问题,提出了一种基于网格的参数自动化聚类算法,该算法使用参数自动化技术解决了算法对参数敏感的问题;在分析了传统的多密度聚类算法的基础上,提出了基于网格的多密度聚类算法(Grid-based Clustering Algorithm for Multi-density),该算法主要采用密度阈值递减的多阶段聚类技术提取不同密度的聚类,使用边界点处理技术提高聚类的精度,同时对聚类结果进行了人工干预。 本文使用Visual C++6.0实现了网格的边界处理聚类算法、参数自动化的网格聚类算法、基于网格的多密度聚类算法、SNN算法,做了大量的对比实验,其中包括基于网格聚类的正确性实验,在综合数据集上的实验,在网络入侵真实数据集的实验以及对均匀密度的数据集实验等。 实验结果表明,网格边界处理聚类算法可以很好的对边界点进行处理,从而提高了聚类结果的精度;基于网格的参数自动化技术可以很好的处理传统网格聚类算法对参数敏感的问题;基于网格的多密度聚类算法不仅能够对数据集进行正确的聚类,同时还能有效的进行孤立点检测,有效的解决了传统多密度聚类算法中不能有效识别孤立点和噪声的缺陷。基于网格的多密度聚类算法比传统的共享近邻SNN算法精度高,适合于均匀密度数据集、大部分多密度数据集,并且可以发现任意形状的聚类,对噪声数据和数据输入顺序不敏感,但对小部分多密度数据集的聚类结果不理想。
其他文献
上世纪五十年代以来,以计算机技术为主要代表的第三次工业革命席卷全球;冷战结束之后,网络技术迅猛发展,网络已经融入到人类生活的方方面面,彻底地改变了人与人传统的交往模
目的了解新媒体健康信息传播对大学生健康素养的影响情况,为制定大学生健康教育和健康促进措施提供科学依据。方法 运用偶遇抽样的方法,对东莞市内5所大学各年级570名在校大
在经历了20多年的经济高速增长后,我国拥有了全世界最富有吸引力的旅游业国内市场,这给饭店业带来了巨大的发展动力。从1991年到2002年中国饭店数量年平均增长21.4%,这一发展
目的关注肿瘤患者的情感障碍,了解肿瘤患者抑郁症发生机率和相关因素,采用中医干预治疗观察疗效。方法采用汉密顿抑郁量表(HamiltonDepressionScale,HAMD,由Hamilton于1960年
目的 :观察健脾理肠片治疗脾虚型慢性非特异性溃疡性结肠炎的疗效。方法 :随机分为治疗组和对照组。治疗组 14 6例 ,用健脾理肠片治疗 ;对照组 39例 ,用补脾益肠丸治疗。结果
通过文献资料、实验、数理统计等方法探讨了不同教学方法对篮球罚篮命中率的影响。结果显示:常规教学法,即采用传统篮球投篮技术的教学方法;程序化教学法,即在常规教学法的基
目的观察自拟热哮宁汤配合常规治疗对支气管哮喘急性发作期辨证为热哮证患者肺功能的影响。方法选择支气管哮喘急性发作期(辨证为热哮证)患者76例,随机分为两组。治疗组:热哮
随着我国市场经济的建立和经济结构的调整,中小企业大量涌现并已成为国民经济的重要组成部分,对经济增长和社会就业起到了巨大的推动作用。然而融资难已成为目前我国中小企业在
目的观察茵栀黄口服液联合血浆置换治疗高效价血型抗体孕妇的疗效和安全性,评价茵栀黄口服液用于降低夫妇抗体效价、早期干预治疗母婴血型不合新生儿溶血病的作用机制。方法
目的:1.研究血液微循环障碍即表现为血液流变学异常是否与雄激素性脱发的发生存在相关性,提示“瘀”为本病的病机之一,从而为活血化瘀法治疗本病提供客观依据。 2.研究雄激素性