【摘 要】
:
数据挖掘是指从数据库中发现隐含的、先前不知道的、潜在有用的信息的非平凡过程。近年来,数据挖掘在地理信息系统、遥感、图像处理、导航、环境等领域有着广泛的应用。然而,
论文部分内容阅读
数据挖掘是指从数据库中发现隐含的、先前不知道的、潜在有用的信息的非平凡过程。近年来,数据挖掘在地理信息系统、遥感、图像处理、导航、环境等领域有着广泛的应用。然而,由于数据量大,数据类型、关系复杂,从这些数据库中提取知识非常困难。数据挖掘算法是数据挖掘的关键技术,提高挖掘算法的性能和效率是数据挖掘技术发展、创新以及应用的关键。聚类指的是把数据库里的对象分组成有意义的子集,使得一个类内的成员尽可能相似,不同类间的成员差异尽可能大。聚类具有无监督学习能力,被广泛应用于多个领域中,如模式识别、数据分析、图像处理以及市场调研等。使用聚类可以发现数据分布的疏密区域,从而找出数据总体的分布模式以及数据间有趣的相互关系。然而,现有的聚类算法存在着多种不足之处,如不具有良好的可伸缩性、不能发现具有任意形状的聚类、对输入数据的顺序敏感和不能处理高维数据等。论文针对聚类问题展开研究。首先,论文对数据挖掘主要聚类算法进行分析研究,并使用实验对部分算法进行仿真和讨论,对算法的主要参数对其性能影响进行分析,总结算法优缺点。其次,对神经网络中的自组织特征映射网络模型进行研究,并通过实验对网络特性进行分析讨论。再次,论文提出一种新的相似性度量标准:拓扑相似性,使用该相似性标准为聚类问题建立数据模型,并建立拓扑相似性矩阵表示该模型。结合自组织神经网络的特点,提出自组织映射网络族的概念,在该概念的基础上,提出一种新的基于自组织特征映射网络的聚类算法,详细阐述了算法步骤。实验结果证明,该算法具有多种优点,其聚类思想可应用到各种聚类中,为数据挖掘聚类问题研究提供了一种较好的思路。最后,对研究内容进行了总结,并指出了后续的研究方向,为进一步的研究开拓了思路。
其他文献
IT技术在当今企业内的作用变得越来越明显,已经从过去的电子化办公工具发展成为企业流程变革与创新的重要支撑力量。业务流程与IT技术的融合是未来的发展趋势,而基于Web Servic
本文对交通紧急事件快速反应处理系统若干问题进行了研究。文章阐述了在交通拥挤、大型警卫任务中所涉及的一些基本概念。对“快速发现及处理道路交通拥挤、大型警卫任务自动
随着网络技术的不断发展,以及高性能计算机、网格等为代表的日益强大的计算环境的出现,极大地改变了计算的含义及计算的方式,这使得用户可以通过网络使用这些强大的计算资源完成
近年来,综合计算机技术、网络通信技术和现代教育技术,以交互式教学和弹性学制为主要特征的现代远程教育得到了迅猛发展,并逐渐被人们接受。现代远程教育的教与学具有时空分
随着计算机技术的不断发展,日益复杂的商业环境要求现代企业的解决方案具有广泛的兼容能力,能支持不同的操作系统、数据格式和多种连接方式,要求在Internet环境下,应用系统是
无线Mesh网络是下一代无线网络中的热门技术,它可以解决接入Intemet的关键问题,但是无线Mesh网络在安全性方面相当薄弱。目前这方面的研究还很少,提出的安全方案多基于同一种安
中国属于农业大国,稻谷生产占据极其重要的地位。病虫害的发生对水稻生产造成了严重影响,因此,及时、准确地对病虫害进行预测预报,有助于农业的健康发展。本文构建了一个集数据预
小波分析是80年代中期发展起来的一门新兴数学理论和方法,其理论的重要性及应用的广泛性引起了数学和信号处理学者的高度重视。短支撑、高消失矩、线性相位、高正则性是小波
国内近几年城市智能交通系统发展很快,车牌自动识别技术作为其中信息采集的关键部分,在整个智能交通系统中起着重要作用。车牌自动识别技术也可以应用在停车场自动化管理、高速
随着计算机网络应用的普及和网上商务活动的日益频繁,计算机系统的安全问题越来越突出。入侵检测系统(Intrusion Detection System,IDS)是信息安全体系结构的重要一环。计算