面向混合属性的数据与数据流聚类算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:liu822517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是数据库研究、开发和应用中最活跃的分支之一。近年来出现了一种称为数据流挖掘的新应用,这种应用中的数据是以流的形式产生的,如传感器数据、网页点击流、实时监控系统等。这些数据流的特点是按时间顺序的、快速变化的、海量的和潜在无限的。由于数据流具有上述特点,需要开发单遍扫描的,联机的,多层的,多维的数据流挖掘方法。学术界已经对数据流聚类问题进行了不少的有价值的研究工作,但是还存在许多问题尚待解决。本文研究了基于密度的数据流聚类问题,主要做了以下几个方面的改进:1、改进了密度聚类算法。DBSCAN算法是一种基于密度的聚类算法,针对该算法在处理混合属性数据上的不足,采用面向维度的距离的思想,改进了混合属性数据的相似度度量方法,提出了一种新的适合混合属性数据聚类的算法M-DBSCAN。仿真表明新算法有效解决了DBSCAN算法无法处理混合属性数据的缺点。2、设计了一种数据流情况下的混合属性密度聚类算法。为了克服数据流聚类框架CluStream算法不能处理混合属性数据流的缺陷,提出了基于密度的混合属性数据流聚类算法MCStream。本文在微聚类中使用面向维度的距离来度量对象之间的相似度,在宏聚类中是使用改进的密度聚类算法M-DBSCAN来对微簇进行聚类。实验结果表明,MCStream算法能快速有效地处理混合属性数据流聚类问题。
其他文献
化学作为一门以实验为基础的自然学科,在实验操作中锻炼和提高学生的创新意识尤为重要.在化学实验设计教学过程中,教师应指导学生遵循科学性、可行性、安全性、简约性和环保
随着现代雷达技术的发展,对雷达系统处理的精度、实时性、可靠性、可维护性等方面的要求越来越高。而雷达显控系统作为雷达终端的核心,在雷达中起着非常重要的作用,尤其是显
由于指纹的唯一性和不变性以及指纹识别技术的可行性和实用性,指纹识别已成为当前最流行、最方便、最可靠的个人身份认证技术之一。将指纹识别应用在门禁系统中,不仅可以用于
NIHSS评分是临床评估脑卒中最常用的评分之一.尽管NIHSS评分已被广泛使用,但其仍存在一些问题.并非所有脑卒中体征皆可在NIHSS评分中得以体现.NIHSS评分的每个项目对脑卒中的
幼儿园教师要大胆突破以往只有在集体教学活动形式中专门有目的,渗透多元文化的做法,尝试将多元文化的教育内容和区域游戏内容有机融合,通过有目的、有计划地投放各种指向目
目前,随着社会科技的不断进步,我国的医疗服务行业发展迅速,极大的满足了广大人民群众日益增长的医疗消费需求。在当前信息科技不断进步,无线信息传送网络不断完善的同时,医
近年来聚氨酯行业发展迅猛,国内从事聚氨酯工业的企业已经达到数百家。但在生产控制方面,很多企业仍然采用仪表控制、人工填料方式,所生产产品的质量无法得到保证,生产安全性
ARINC429总线是目前航空电子系统中使用最广泛的串行通信数据总线之一。基于USB接口的ARINC429接口卡,充分利用了USB总线的传输速度快、使用方便、成本低廉和FPGA可配置、使
随着无线通信技术的飞速发展,频谱缺乏已经成为一个非常严重的问题。感知无线电(Cognitive Radio)技术能有效解决频谱紧张的现状。感知无线电技术是无线移动通信领域的一种革
模型预测控制是一种基于模型的先进控制技术。它产生于工业过程控制的实际需要,并在与工业应用的紧密结合中不断发展和进步。相对于其他传统的控制策略,预测控制具有相当大的优