数据挖掘中分类属性数据聚类研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wuzhigang3481
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代数据库和网络技术的发展,使得人们面对的数据量以惊人的速度增长,为了获取有价值的信息,提出了数据挖掘技术。发展自统计学的聚类分析已成为数据挖掘中的一个十分活跃的研究领域。本文详细介绍了数据挖掘技术,包括数据挖掘的研究内容,任务和功能,数据挖掘的一般过程,数据挖掘的常用工具,主要应用领域和发展趋势。在此基础上对数挖掘中的聚类分析作以详细地论述,总结了数挖掘中聚类分析的方法和特点,并对聚类结果的评价方法进行了讨论,重点讨论了分类属性数据聚类,具体研究了k-modes 算法及其变形,并指出了它们的优缺点。主要探讨了模糊k-modes聚类结果与原始数据的分类结构的对比方法,对现有的精确度定义和计算方法进行修正,在划分相似度的基础上,重新定义模糊k-modes聚类精确度。应用进化策略对属性进行加权,改进了fuzzy k-modes算法,以基于划分相似度的聚类精确度为聚类结果的评价准则,进行实验分析,获得了较好的聚类效果。
其他文献
可重构天线凭借其能够实时改变天线工作特性的优势,在现代无线通信系统的飞速发展过程中发挥着巨大作用。然而,可重构天线技术的研究还处于发展阶段,许多问题有待进一步地研
由于强烈的工程应用背景,复杂目标矢量电磁散射研究一直广受关注.该文采用快速多极子方法、多层快速多极子方法及其它扩展方法来分析复杂目标的三维矢量散射.该文首先回顾了
森林生态系统碳库研究及林业碳汇计量与监测已经成为了全球变化研究的核心内容之一。森林不仅本身维持着大量的碳库,同时也维持着巨大的土壤碳库,它的波动对大气CO2浓度产生
邓云乡学名邓云骧,生于1924年,故于1999年.邓公出名较早,但出大名较晚.他原有红学家之名,与魏绍昌、徐恭时、徐扶明并称“上海红学四老”,但邓公在全国出名,还是在他出版了《
期刊
首先,由于该芯片提出了新的硬件要求,所以在控制电路、低压供电电路、外部给定控制电路等硬件设计部分给出了优化实现方案,其他硬件部分主要包括输出电流的采集和处理以及输
肉果草属(Lancea),仅肉果草(Lancea tibetica)和粗毛肉果草(Lancea hirsuta)2种,主要分布于青藏高原及其毗邻地区。现有基于叶绿体基因片段与核基因片段的分子系统发育研究均未能很好
该论文的研究内容共七章:(1)绪论;(2)激光谐振腔理论;(3)非对称谐振腔—平凹腔;(4)高频振动腔镜的设计;(5)平凹腔中凹镜振动特性研究;(6)实验研究和分析;(7)总结. (1)绪论部
本文所述研究工作以研制开发一套基于虚拟仪器的飞机交流电源地面测试系统为目的。首先概括地介绍了虚拟仪器技术框架,并对虚拟仪器开发平台Labview及其编程语言作了简要论述
该文对2×2磁光开关进行了系统的理论研究与分析,详述了光路、磁路、电路各部分的设计思想和方案设计过程,并对光路部分进行了计算与验证,最后报道了器件的研制和测试结果.其
近年来,国内对交变湿热室的控制普遍采用了微机控制,一部分采用PID控制方案或改进的PID控制方案,但人工气候室固有的非线性、大迟滞、强耦合等特点,使系统的调试工作非常繁琐