基于聚类和核方法的数据挖掘算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:rogy520111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息系统的广泛使用,产生了大量的数据,如何充分利用这些数据,发掘出有用的知识,是人们非常关心的问题。聚类是数据挖掘中一种重要的方法,随着核方法的提出,将核方法应用于聚类算法成为帮助人们解决数据挖掘问题的新的重要的方法。本文主要研究聚类算法中的两种经典的算法:K均值算法与模糊C均值(Fuzzy C-means, FCM)算法。首先,对K均值算法进行研究与分析,提出了一种改进的K均值算法。其次,在FCM算法的基础上结合核方法理论,提出了两种新的基于核方法的聚类算法,本文的主要工作如下:1、提出了一种基于初始点优化与迭代优化的K均值算法,该算法不是随机选取初始聚类中心而是采用基于最小距离的初始聚类中心选取法。聚类中心的调整不是取平均值而是选用离平均值最近的点作为新的聚类中心,这样就克服了孤立点的影响。最后对迭代运算进行了优化使得算法的计算效率得到了提高。2、提出了一种基于混合核函数的模糊C均值算法,构造了一种外推与内推能力都很强的混合核函数,并将混合核函数应用于模糊C均值算法中。实验结果表明对于数据分布为非球形分布或样本边界为非线性时有很好的聚类效果。3、考虑可能性C均值算法有良好的抗噪声性能,将它与混合核函数相结合,提出了基于混合核函数的可能性C均值聚类算法;该算法克服了噪声数据对非球形数据集聚类的影响。实验结果表明该算法对于含有噪声的非球状数据有很好的聚类效果。
其他文献
入侵检测技术是一种动态安全防护技术,能够有效弥补传统静态防御技术的不足。将粗糙集(RS)和模糊支持向量机(FSVM)同时应用于入侵检测,可以有效提高检测性能。RS能有效地分析
近几年,由汽车所引起的安全问题已经越来越受到人们的重视,各种各样的车辆安全系统也应运而生,但是,所有安全控制系统几乎都遇到同样的问题,那就是如何获得车辆状态相关信息以及车
煤矿电力监控分站是煤矿电力监控系统的重要组成部分,是查询底层设备、获取线路的实时数据、运行状态、操作记录及故障事件等信息,完成数据存储、处理、显示、传输、底层设备的
近年来我国农区养猪业发展迅速,对各阶段猪群的生长环境状态进行动态监测,提高猪舍的控制管理水平,无论是对科学研究还是生产管理都很重要。当今智能化系统的不断发展为各种场合
磁悬浮平衡装置涉及到机械学、控制理论、数字信号处理等多领域的知识,每个环节都直接影响了磁悬浮平衡装置的性能,它是一个复杂的机、电、磁综合系统。本文结合磁悬浮技术的发
在许多工程应用领域内,钢丝绳是应用于运输、提升等承载设备中不可缺少的关键部件之一,并且直接关系到工作设备的安全性。所以,钢丝绳的探伤研究非常重要,目前,仍有大量的研究方法
本论文主要研究机器学习用于信息检索:排序学习、半监督核矩阵学习以及用户交互式图像检索。   排序学习已经被成功用于文件检索,Ranking SVM是排序学习中一种常用的经典算
随着现代科学技术的不断发展,综合了嵌入式系统、无线通讯、微电子等技术的无线传感器网络(WSN),正逐渐应用于智能家居、工业自动化、楼宇控制、智能计量等领域,这种能够实时监
多波束侧扫声纳在现代海洋测绘中发挥着非常重要的作用。然而该类声纳所获取的数据仅是局部的不精确的条带数据,因此为了实现对海底地貌的精确、快速的描绘,必须对多波束侧扫
柔性机械臂的连杆由轻质、柔性的材料构成,具有高荷载自重比、自身惯量小、动作响应迅捷的特点。大到在航天器上的轻型机械臂,小到硬盘驱动装置,都可以看成是柔性机械臂的实际应