聚类算法及其应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hncry
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据采集和存储技术的飞速发展,很多领域都积累了大量的数据。为了从数据中发现有价值的知识和规律,人们结合数据库、统计学及机器学习等技术,提出数据挖掘来解决这一难题。聚类分析技术是数据挖掘中的经典内容,是各学科研究的重要工具。本论文在广泛阅读相关文献、深入了解聚类算法的原理与应用的基础上,在算法的改进、应用上做了如下工作:(1)针对经典的聚类算法普遍存在的形状依赖、合理的类别参数选择及对噪声敏感等问题,联合数值归约、基于压缩数据的变种K-means算法和加权投票法,同时结合RMSSTD&RS聚类有效性指标提出了一个自动聚类算法。较好的解决了带噪声的任意形状的大数据集的聚类问题,并具有一定的增量处理能力。(2)传统的基于密度的算法和经典的CLIQUE子空间聚类算法都是从寻找数据的密集区域入手去解决问题。本文从稀疏区域的角度出发进行了子空间聚类的尝试,提出了基于竞争的修剪方式和形式化的“投影寻踪”搜索策略来得到合适的子空间并生成类。实验证明在控制计算复杂度的同时提高了算法的精度,在对输入参数的鲁棒性上也取得了较好的效果。
其他文献
焊接机器人技术在各个行业得到了广泛应用,已经成为自动化生产的主要组成部分。计算机技术与控制方法的快速发展,大大拓展了机器人技术应用的灵活性,更是对控制系统的性能、
多智能体仿真技术因在模拟复杂系统方面具有独特的优势,已逐渐成为传统数学模型之后的一种全新的建模方法。发达国家在此领域已经积累了很多的经验。从上世纪90年代开始,多智
无线传感器网络,将传感、网络、通信、微机电和控制等技术有机结合为一体,使人类与客观世界的互动更加快捷,推动信息社会的发展,成为当前的研究热点。这一新技术,提出了一系列新的
随着信息技术的发展,以工作流技术为中心的流程重组在企业生产实践中日益受到重视。工作流模型是基于某些约束条件、任务和目标、符合现代企业生产实践规范的抽象化业务过程
近年来,由于电子器件、微处理器的发展和控制技术的进步,对无刷直流系统向全数字化、无位置传感器化的发展产生了巨大的推动作用。数字信号处理器(DSP)具有功耗小、速度快、
自然界存在大量的昆虫具有可在垂直表面自由爬行,甚至几乎不受重力影响而倒挂的能力。研究表明,昆虫根据不同的外部条件能产生比自身重力大约100倍的吸附力。究其原因,文献中多
现代医疗仪器是嵌入式系统技术的重要应用领域之一,本文研究了双模块架构环境下基于ARM9嵌入式系统的血液分析仪监控管理软件的设计和实现。血液分析仪采用DSP控制器+ARM嵌入
车载自主导航系统是智能交通系统的重要组成部分,将使用者、道路网、交通运输工具三者作为一个整体综合考虑,使交通运输基础设置得以发挥最大功效,明显改善车辆堵塞和交通拥
随着IP网络技术、移动通信技术和多媒体技术的蓬勃发展,人们对未来的通信网络提出了全新的要求,IP多媒体子系统(IP Mutilmedia Subsystem, 简称IMS)作为未来通信网络的发展方
基于最近提出的一种以氨或绿色制冷剂为工质的并联正、逆制冷循环和蒸汽动力循环串接耦合的新型间接空冷技术方案中一个早期拟定方案(逆流空冷凝汽器和双相变管壳式换热器)结