数据挖掘技术中基于属性的聚类算法研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:cairaymond
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界,数据每天都在迅猛增长。人们保存如此大量的数据,一是因为计算机技术的发展使之变得方便可行,二是因为这些数据有巨大的潜在作用。由此而产生的数据挖掘概念引起了广泛地重视,出现了许多与之相关的技术和产品。权威的Gartner调查组报告显示,数据挖掘将是今后几年全球范围内重点投资研究的十大新技术之一。本文从数据挖掘的概念入手,以数据结构的角度看待数据挖掘的研究对象,对数据挖掘的重要工具“聚类”做了深入的论述,把聚类分为基于数据元素的Q型聚类和基于属性的R型聚类。着重讨论目前各类文献涉及较少、而又有着重要应用意义的R型聚类,论述了相关的概念、技术和算法。最后介绍了一个实际应用系统——医生医疗质量评价系统。 文章在全面阐述数据挖掘、聚类、基于属性的聚类及三者关系的基础上,着重讨论了以下几个方面: 1.基于属性的聚类有力地支持了数据挖掘的一些重要性能的实现。 2.在聚类分析中应用的有关模糊集理论理论基础。 3.对基于属性的模糊聚类算法进行了比较详细的讨论。 4.探讨本课题未来的工作方向和面临的挑战。 概括而言,本文以数据挖掘工具中聚类分析的一般理论和技术为基石,结合目前实际应用,提出了一些新的观点及算法设计思路,并试图在理论和实践两方面作出论述。
其他文献
随着信息产业化的快速发展,数据的产生与收集能力迅速提高。存储数据的爆炸性增长业已激起对新技术和自动化工具的需求,以便帮助我们将海量数据转变成信息和知识。数据挖掘正是
随着国民经济的不断发展,人民生活水平的日益提高,汽车已经成为人们出行的重要交通工具;我国个人汽车的持有量在不断增加,大大提高了人们出行的便捷性,但随之而来的是交通事
随着市场经济的不断发展和电力系统规模的扩大,我国现行的电气设备定期维修已经不能满足电力系统经济、可靠运行的需要,有关状态维修的研究成为目前关注的热点。由于状态维修工作涉及大量的状态信息数据的管理和分析,单靠手工方式是难以实现的。因此,应用最新的计算机及网络技术,建立专用的状态维修支撑平台,对于推动状态维修在我国的实施具有重要的意义。 本论文重点探讨了反映状态维修思想的数字化管理体系,在此基础
本文描述了一个数据仓库通用数据析取软件的设计与实现。随着社会的进步和科技的发展,分析决策成为了各行各业的生命线。数据仓库技术凭借其在数据存储与组织结构上的优势为决
本文介绍了一个面向分布式地理信息系统的空间数据库系统——SDB的设计与实现。该系统采用软件组件模型,符合OpenGIS规范,具有互操作性,支持数据共享和功能共享,易于GIS软件的集
该文提出面向业务的全面网络管理的思想,建立了以业务为核心的网络故障管理模型.该模型由网络业务拓扑、网络业务依赖图和故障-告警因果关系图有机组成,其目的是区分网络上运
基于Web的全局联网销售系统(WSMIS)是一个以鹤壁矿务局煤炭销售系统为背景的集外运、地销、合同计划、远程销售、领导查询等为一体的自动化管理系统,其特点是方便快捷的Web数
论文在分析网络传输特点和实时多媒体特性的基础上,针对IP网中实时多媒体应用存在的QoS控制问题,提出了一种分布式分层自适应QoS控制模型.该论文详细介绍了QoS控制模型在Wind
如今,软件需求一直在以极高的速度增长;软件应用从早期的硬件系统附属物变成了与用户、组织、社会系统具有直接而密切的关系;系统的软件复用已经导致软件开发范例(Paradigm)的革命
云计算的出现与发展正在改变人们使用计算资源的方式,借助于“云”,用户不再需要自己购买和维护硬件设备,而是通过向“云”提供商租用计算资源的方式,去执行其任务。基础设施