数据挖掘中的聚类算法在工业园区经济发展中的比较应用

被引量 : 0次 | 上传用户:eastwood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学技术的发展,探求海量数据内在信息的需求与日俱增,对传统的数据分析提出了巨大的挑战,使数据挖掘迅速发展成为一个独立的领域。其中,建立有意义的对象分组是数据挖掘的基础方式之一,聚类分析就是一种典型的分组方法,它是将物理或抽象对象的集合分组成为由类似对象组成的多个类(duster)的过程(clustering)。本文将对多指标聚类方法作比较详尽的探讨,全文分为五个部分:第一部分是绪论,主要包括本文选题的意义,研究动态以及本文以层次分析法、主成分分析法为降维原则的聚类分析研究思路。第二部分是聚类理论概述,主要对数据挖掘和聚类算法作简要综述,并引入极大极小距离概念,比较聚类分析的各种距离算法。第三部分是研究思路和方法的说明,主要从统计学的角度,以工业园区经济发展水平的划分为目的,结合实际说明研究方法,包括指标的设计和提取(降维)、聚类的样本处理等,其中指标提取所用的层次分析法和主成分分析法是讨论重点,也是实证分析的中心环节。第四部分是园区经济发展水平的聚类分析实证研究。应用层次分析法和主成分分析法对云南省32个重点工业园区的指标进行降维,在聚类时对6种距离算法(最短距离法、最长距离法、重心连接法、类平均法、离差平方和法、极大极小距离法)作对比分析,选出最能反映园区实际的离差平方和法计算距离,得出相应的聚类结果(总共分为3类),并结合聚类结构图分析存在差异的原因及提出相应的对策。第五部分是总结以及对下一步研究工作设想。综合来看,本文在聚类算法的选取上考虑比较全面,符合研究对象的实际情况,具有较大的研究意义。
其他文献
随着近年来电子商务行业的快速发展和微信在人们生活中的广泛应用,代购行业凭着价格低,质量好的优势在微信平台被越来越多的人接受。本文将分析微信采购行业的营销现状,概述
民用航空器适航管理行政许可是我国行政许可制度的微观领域,通过对民用航空器设计、生产、使用以及维修等各个阶段的适航性予以审查、监督,以保障民用航空器安全性,促使民用航空
本课题来源于陕西省科学研究发展计划(2012K06-44)电梯无线应急通信系统。随着我国经济建设的不断发展和城市化进程的不断推进,越来越多的高楼大厦平地而起,电梯数量也不断增多,随
随着我国经济的飞速发展,我国加大了对基础设施的建设,其中铁路作为交通运输的重要组成部分,也迎来了发展的机遇。近一段时间,京沪、京广、哈大等高铁和一批城际铁路相继投入运营
教师教育的形式和有效性是教师教育研究与实践中倍受关注的问题。近年来日本许多中小学在教师校本研修基础上构建了在职教师教育实践模式———“授業研究”,其特点与实践过
考虑微带型微波功率器件的测量问题 ,运用 L RL (Line- Reflect- L ine)法对测试夹具去嵌入 ,待测件的散射参量可表为测量值的单值函数 ,消除了嵌入网络参量相位不确定性引入
近年来,随着现实生活中公益诉讼案件的不断发生,理论界对行政法学的研究也不断深入,理论界对公共利益的高度重视和实践中不断出现的案件引起了法院和检察院的关注。社会各界都逐
随着十八届三中全会提出"推进农业转移人口市民化,逐步把符合条件的农业转移人口转为城镇居民。"加之户籍制度的进一步放宽,农民市民化进程加快,城乡二元结构逐步瓦解。但是,农
在高架工程施工当中,有多种箱梁施工方法,对于现浇支架法,也有多种支架搭设方法,采用贝雷架与高支模架联合使用的搭设方法,优点颇多。但是贝雷架作为支架支撑体系的具体性能
为进一步改善OFDM系统性能,在研究循环延迟空时频(STF)编码和正交预编码STF编码技术的基础上,提出在这两种STF-OFDM系统中采用多个天线接收信号,给出了基于算术平均和最大似