数据挖掘中的聚类算法研究

被引量 : 0次 | 上传用户:lk656lk55lk6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是目前信息处理和数据库技术领域的前沿研究课题,被公认为最具发展前景的关键技术之一。数据挖掘汇集了统计学、机器学习、数据库、模式识别、人工智能等学科的内容,是一门新兴的交叉学科。数据挖掘更强调的是从海量数据中发现隐含的知识和算法的可伸缩性,是一门很接近使用的技术,其技术含量高,实现难度也较大。聚类分析是数据挖掘的一个重要研究领域,是一种用于数据划分或分组处理的重要手段。聚类的应用非常广泛,在商务、市场分析、生物学、WEB文档分类等领域中都得到了充分的应用。本文对数据挖掘中的聚类技术进行了分析和讨论。首先分析了聚类算法的分类,系统介绍了各种聚类算法及关键技术;然后在原有算法基础上,本文给出了两种改进算法:一种是对k-means算法的改进,提出了一种新的初始化聚类中心的方法,该方法提高了聚类准确率;另一种是对模糊C-均值算法的改进,其基本思想是:通过对数据对象的模糊隶属度进行修正,以及在算法中引入模糊聚类有效性函数来自动确定最佳聚类数C。论文中对这两种改进算法进行了实验分析,实验表明改进是有效的。
其他文献
由于化学危险品泄漏的危害性,各类化学反应容器和输送管道的泄漏检测与维修已经成为石化工业安全生产、预防重大事故发生所关注的问题。在危险环境中,具有自主能力的移动机械
县域是我国社会经济的基本单元,在整个国民经济中占有重要地位,其经济竞争力问题是县域经济发展问题中的重要组成部分。县域经济竞争力的大小,不但直接决定着县域经济发展的
目的探讨大鼠IL-10质粒DNA尾静脉快速大容量注射对猪血清诱导大鼠肝纤维化的治疗作用及其机制。方法采用RT-巢式PCR和分子克隆技术构建大鼠IL-10真核表达质粒PcDNA3-rIL-10,
关于新生代农民工城市适应的研究是各个学科日渐关注的话题,本文对迄今为止的传播学相关研究进行了梳理。并从时间的角度纵向分析了研究主题、研究对象、研究结论以及理论视
<正>居住问题向来都是普通民众最为关心的话题之一,买房不论是对美国人还是中国人来说都是一项大笔的开支。相比于2006年的房价最高峰时期,如今在美国的大部分地方买房仍是首
本文从央视东莞报道引发的舆论风波出发,分析信息传播背后的深层逻辑:央视三重角色引发的价值观冲突、多元化传播平台对舆论的离散效应、央视官方背景引发的系统性对抗式解读
从古代的斩首示众,到文革时期的批斗示众,再到严打时期的游街示众,尽管饱受非议,示众行为却依然屡禁不止。现在,又出现了新的形式——将未决犯认罪过程在电视荧屏上示众。究
<正>1956年中国完成了各方面的生产资料的社会主义改造,党领导的新闻媒介不能满足群众需要的矛盾突出了。新闻少,并有较多的片面性;通讯内容贫乏,不能反映国内国际生活的现实
<正>在全球经济联系密切和文化大融合的背景下,将传统文化元素融入到现代室内设计中的作用越来越突出。坚持将中国传统文化元素融入到现代室内设计中,不断进行创新,有利于提
随着经济全球化和以IT技术为代表知识经济时代的到来,企业间的市场竞争日益加剧,企业开始将更多的注意力转移到外部效率的提升和挖掘,希望通过外部资源整合来提升企业效率,为