聚类方法及其应用研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:geshufa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,存储数据的爆炸性增长业已激起对新技术和自动信息处理工具的需求,以便将海量的数据转换化为有用的信息和知识.在这种背景下,知识发现和数据挖掘(KDD&DM-Knowledge Discovery in Database&Data Mining)应运而生,它是一个从大量的、不完全的、有噪声的实际应用数据中,提取隐含在其中的、事先未知的、但又潜在有用的知识的过程.作为数据挖掘的重要方法之一,聚类是自动地对物理的或抽象的对象分组,使其成为由类似对象组成的多个类(簇)的过程.当把聚类方法应用于实际问题时,我们经常会遇到数据集不断变化、需要使用各种约束条件,以及如何更为有效地继承以往数据挖掘过程和结果的问题.该文针对这些问题,在增量式聚类算法、带约束条件的聚类算法、数据挖掘中的可继承性问题、适宜于可继承性数据挖掘的I-DM模型及基于此的聚类算法等方面进行深入研究.主要工作包括:1)研究了数据仓库环境下的数据更新后的增量聚类问题.通过CURE聚类算法和K-NN方法,以及朴素贝叶斯方法的有效的结合,给出两种增量式聚类算法I-CUREN和I-CUREC算法,它们能够实现增量式聚类,并可以产生新的类,其时间复杂度为0(n);2)详细研究了约束聚类问题,给出约束条件的分类及常用的约束条件形式定义.分析了CLIQUE聚类方法,提出一种新的算法框架CON-CLIQUE,它能够有效的解决高维空间的约束聚类问题.3)描述了知识发现过程中的可继承性问题,通过对现有知识发现过程和挖掘算法形式化描述和分析,抽象出各个阶段的联系及其约束条件,在此基础上提出知识构件的概念.4)通过分析现有知识发现过程模型存在的缺陷,在对I-MIN过程模型改进的基础上,提出一种支持可继承性的挖掘过程模型I-DM,它是一种通用的、稳定的、可扩充的和支持可继承性的数据挖掘过程模型,并允许用户在数据集上进行交互实验和数据监控.通过对BIRCH聚类方法的改进,设计适宜于I-DM模型的聚类方法.针对航空公司常旅客数据库,给出一个设计KDS的实例,详细描述了各功能部件的设计过程.
其他文献
本文讨论了基于应用服务器JBoss的标准J2EE Web服务的设计与实现,通过对开源软件JBoss、Tomcat和Axis的深入研究,重点讨论了这些软件的总体架构,以及共同整合以支持J2EE Web服务
网络控制系统是控制科学、计算机及网络技术的综合应用。网络资源的竞争及网络时延赋予传统的控制理论和方法新的含义和研究内容,对网络控制系统调度的研究是其中重要内容之一
灰色关联理论是灰色系统理论的一个重要组成部份.整个灰色关联理论的基础是灰色关联四公理,然而在分析其与现在的所有关联度的相容性后,发现没有一种灰色关联度与灰色关联公
随着人们对社会安全要求的增加,基于生物特征识别的智能身份鉴别方法逐渐受到广泛的关注.由于虹膜识别具有高可靠性和非侵犯性,它正成为生物特征识别领域中的一个研究热点.作
迭代学习控制算法针对具有重复性和周期性运动特征的控制对象,解决对期望轨迹完全跟踪的问题。它采用系统的实际输出和系统的期望输出的偏差,对系统的控制输入进行调节,使得系统
作为当今世界节约电机耗能和控制电机转速的一种主要手段,变频调速技术被广泛应用于各种大型自动化生产过程中。针对传统生活用水供水系统中存在的电能、水资源浪费等问题,本文描述了变频调速恒压供水系统的设计和实现方法。该供水方式是在利用INTEL公司的十六位高性能单片机80C196MC对供水管道压力、流量等数据的采集和分析的基础上,利用模糊逻辑控制的先进控制方法,通过IPM智能功率模块和专用PWM生成芯片来
本文对仪器仪表的发展作了简要概述,分析了智能仪器仪表和嵌入式系统的特点以及两者与Internet相结合的必然趋势,进而引出了嵌入式智能仪表网络化的概念,讨论了智能设备接入I
最近几年,Web服务技术已经逐渐流行起来了,被广泛接受为一种分布式计算标准。它的主要目标就是在现有的各种异构平台的基础上构筑一个通用的与平台无关,与语言无关的技术层,各种
嵌入式视觉目标跟踪系统以其便携、可靠、高性价比等突出优点,被广泛应用于视频监控、智能交通、成像末制导等领域,以高速DSP为核心的高速图像处理卡和实时视频采集卡已成为视
随着嵌入式操作系统的迅速发展和地理信息系统应用领域的日益广泛,嵌入式地理信息系统的研究成为目前地理信息研究的重要领域。论文从地理信息系统在嵌入式操作系统平台上的开