基于网格密度的高精度聚类算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:balonbalon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘又称数据库中的知识发现,是指从大型数据集中发现有趣的、有用的且预先未知的知识的过程。数据挖掘是数据库研究最活跃的领域之一,通过数据挖掘可以从大型数据集中提取可信、新颖、有效并易于理解的知识、规律或高层信息,这给人们在信息时代所积累的海量数据赋予了新的意义。随着数据挖掘技术的迅猛发展,作为其重要组成部分,聚类分析和边界模式检测技术已经广泛应用于模式识别、数据分析、图像处理、市场研究等许多领域。而聚类和边界模式检测算法的研究也已经成为数据挖掘研究领域中非常活跃的一个研究课题。 本文提出了参数自动化的基于网格密度的高精度的聚类算法。针对网格聚类算法的聚类结果对用户输入参数敏感这一问题,本文提出了一种参数自动化的处理方法;另外,本文还在结合了基于密度聚类算法和网格聚类算法的优点的基础上,采用计算低密度单元中的点到相邻高密度单元重心的欧几里德距离的方法来处理边界点,这种处理网格聚类边界的方法,克服了由于网格单元内数据分布不均匀而造成聚类结果不准确的缺点,可以准确衡量出数据点的分布稠密程度趋势,从而达到使聚类结果更加准确的目的。同时,本文还在该算法的基础上提出了增量数据挖掘算法,能够对动态的数据库进行处理。 实验结果表明:该算法可以有效的检测出任意形状、不同大小和不同密度聚类的边界点,并能有效的消除噪声。并且在该算法基础上提出的增量聚类算法在不影响聚类结果的前提下可以较高效率的处理数据的增量问题。
其他文献
随着嵌入式技术在虚拟仪器方面的应用逐渐增多,系统间协同工作也日益普遍,应用范围也更加广阔,涉及到多种语言、通信介质以及操作系统,软件开发往往要求在这些异构环境下运行
随着软件产业的不断发展,软件的应用日益广泛,软件开发面临着越来越多的挑战,软件危机也随之而生。软件复用在这种背景下发展起来,并且作为解决软件危机的有效途径,越来越得到广泛
线性骨架是物体形态特征的重要体现,是物体几何形态的一种重要描述,线性骨架与物体有着相同或相似的拓扑结构。近年来,随着信息技术的发展,关于物体三维线性骨架获取的研究也越来
随着网络的普及与应用的快速发展,在线教育已成为当前教育领域一个十分热门的研究方向。可以预见,在线教育将成为教育模式中的重要一环。在下一代互联网上,网络教育无论是内容和
软件规模作为软件项目可量化的结果,是项目估算的重要参数和企业决策的重要依据。因此在软件项目需求阶段,就需要度量软件规模。在现有的规模度量方法中,功能点方法能够用于
随着手机使用的普及,人们享受着现代化通信手段带来的快捷方便,短信业务也得以迅速发展,但伴随而来的问题是垃圾短信已经严重地影响着广大手机用户的正常使用。这一现象不仅在我
近年来,互联网已成为全球最大、最广泛使用的信息库,如何有效检索其中的海量信息成为当前重要的研究课题,因此信息检索技术越来越受到人们的重视。用户将表示自己需求的查询提交
基于单目视频序列的人体运动姿态分析是计算机视觉和计算机图形学相互融合的一个重要研究方向,其研究核心是从单个或多个视频序列中检测、跟踪人体,获取人体运动数据,重建人体的
随着多媒体技术、视频压缩编码技术、网络通信技术的发展,数字视频监控系统迅速崛起。前端一体化、视频数字化、监控网络化、系统集成化是视频监控系统公认的发展方向,其中以嵌
数据挖掘是指从数据库中抽取隐含的,具有潜在使用价值信息的过程,是一种新型的数据分析技术,已经被广泛的应用于金融,保险,政府,教育,运输以及国防等领域。聚类是数据挖掘领域中最活