【摘 要】
:
本文讨论数据挖掘中聚类的相关概念、技术和算法,在对常见聚类算法进行评价的基础上,针对密度聚类的参数选取问题,提出了一种动态参数解决方案。 目前已提出的聚类算法中,
论文部分内容阅读
本文讨论数据挖掘中聚类的相关概念、技术和算法,在对常见聚类算法进行评价的基础上,针对密度聚类的参数选取问题,提出了一种动态参数解决方案。 目前已提出的聚类算法中,基本上都是基于“距离”的概念,不管是传统的欧氏几何距离还是其它意义上的距离,如常见的k-means、k-medoids算法,这类算法的缺点在于处理大数据集和高维数据集时不够有效,另一方面它能发现的聚类个数常常依赖于用户参数的指定,而这对用户来说经常是很困难的。 本文针对聚类算法中参数选取的问题,对参数选取问题给出了一种解决办法,提出了一种动态计算参数的算法。本文讨论的算法与已有算法的根本不同在于,它抛弃了距离的概念,采取一种新的思路,是一种基于密度的动态参数的单元聚类算法,它的优点在于能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;另一方面它能很好的处理高维数据和大数据集的数据表格。算法将最后的结果用DNF的形式表示出来。
其他文献
城市轨道交通系统因基建成本高,故采用高密度方式运营,而城市轨道交通系统的安全、速度、输送能力和运营效率与通信信号系统密切相关。现在国内城市轨道交通信号系统全部来自国
通过引入基于网络的存储虚拟化技术,使数据与物理设备相分离,实现数据的集中存储,统一管理。不但可以有效地消除信息孤岛,而且方便了对数据进行维护,保证数据的一致性和可靠性。存
近十几年来,Internet取得了惊人的发展,已经成为人们交流思想、传达信息和获取知识的快速和重要的渠道.多媒体技术尤其是流媒体技术的发展,使信息的传播力和影响力更胜传统的
本文介绍了一些关于XML的基础知识,以及时态数据库的基础知识。然后介绍了一种关于时态XML的模型。利用该模型可以实现时态XML文档到与时态数据库间的相互存储转换。另外,
近几年,嵌入式系统的应用越来越广泛了,Linux在嵌入式系统中被广泛的使用。但嵌入式应用中一般要求嵌入式操作系统小型化并具有实时性能,而Linux作为一种通用操作系统,对这些
JXTA技术是由Sun公司在2001年2月提出的一项新技术,主要用于提供P2P程序所需的基础服务。该技术致力于创建一个通用的平台,以简单而有效的方式构建特定的对等式和分布式服务
无线车辆自组织网络是无线网络领域的一个热门话题。它是一种移动自组织网络,用来在车辆之间或移动车辆与路边固定设备之间进行无线通信,以达到传递数据,相互通信的目的。因为无
随着对WEB应用开发效率及质量要求的不断提高,开发工作的难度不断增加。在WEB应用开发过程中存在很多直接影响开发的因素,主要包括开发平台及技术灵活多样,导航关系复杂,而且
目前,随着网络规模不断扩大,IP地址管理不可避免的愈加复杂。为了解决这一问题,网络管理员有必要建立规范的IP地址分配表、IP地址和硬件地址(MAC)登记表,并且做到实时监控。
数据挖掘在各个领域中有着广泛的应用前景,是进行数据分析的重要工具。 企业在使用数据挖掘时,面临应用的分布性和对大数据集的挖掘需求这两个应用方面的问题。此外,还有