面向数据流的数据聚类算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:whlwzn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域一项重要的研究课题。近年来,数据流在很多领域得到应用,数据流聚类也成为了一项意义深远而且很有挑战性的技术。与传统的静态数掘相比,这些数据是高速的、连续的、动态的、变化的、无限的。数据流的这些特性,给数据流的聚类算法带来了困难。另外数据流的高维、非线性特性对数据流的聚类算法提出了更高的要求。本文提出了一种不仅能很好地适应数掘流的进化特性而且能有效处理数据高维、非线性问题的数据流聚类算法。使用能很好处理非线性问题的核方法,作者提出了一种新的两层算法架构。在第一层,使用一种基于核的新颖检测算法把数据流分割为内聚性强的段。在第二层,在对数据进行聚类前先把数据映射成低维的数据。最后,通过实验表明本算法具有良好的实用性、有效性,适合处理和分析高维、非线性的进化数据流。
其他文献
近年来,随着Web技术的不断发展,怎样从Web产生的海量数据中发现隐含的规律性内容,充分利用有用的数据成了现今研究的热点。而Internet上信息量的巨大性,信息内容结构的复杂性
虚拟手术是专门用于模拟手术过程中可能发生的各种现象的虚拟现实应用系统,其与各种外部交互设备相结合可为医生提供逼真的手术场景,从而实现降低手术培训成本、提高手术治疗
随着Web应用在互联网上的比例逐年增加,Web集群服务器(简称Web集群)也逐渐成为大型网站运营商解决高访问量和高服务质量等要求的最佳选择。虽然集群能够提供高可扩展性、高可用
医学CT成像是一门重要的依序图像采集技术,医学 CT图像能够比较清晰地显示人体器官、组织的解剖结构,能够辅助医生判别各种病变类型。医生利用CT图像进行辅助诊断时通常会出现
粗糙集理论是波兰数学家Z.Pawlak于1982年提出的一种处理含糊性和不确定性问题的数学工具,已成为计算机科学与技术领域中颇具挑战力的方向之一。粗糙集理论中关于知识发现、数
近年来,国内电信运营商的盈利点已经由传统的单一的语音业务转变为以语音业务为主,数据业务和增值业务并重的多元化趋势。区别于话音业务,数据业务种类多,业务划分复杂,数据
在信息时代的今天,手写数字识别技术在文献检索、办公自动化、邮政系统、银行票据处理、表格录入等方面有着广阔的应用,因此手写数字识别技术的研究具有重大的现实意义。由于识
面向服务的体系结构(Service Oriented Architecture,SOA)是新一代的框架思想,由于它具有良好的松耦合、与平台无关等特性,很好的解决了系统的灵活性和互操作性。同时,作为SOA的一
随着因特网和电子商务的推广,信息交换的安全性日益重要。保证信息安全的最方便的办法是密码学。经典密码学分为公钥密码和私钥密码两大体系。私钥密码长期存在如何在通信双方
语音识别技术目前在嵌入式系统中的应用主要为基于小词汇量的孤立词语音识别。语音命令控制,广泛用于家电语音遥控、玩具、智能仪器及移动电话等便携设备中。人们期待着连续