基于大数据集聚类分析研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:zj1280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在对前人对聚类分析研究的基础上,对聚类分析的各个方面进行了详细的论述.文章深入探讨了聚类分析的数据预处理(包括数据采样、属性子集的选取、不同数据类型的处理)的各种方法,并改进了有关的算法,提出了一些针对聚类分析的数据预处理的策略.在此基础上,又对现有的聚类分析算法进行了归纳总结,提出一个基于网络和密度的算法,该算法在网格和密度处理的基础上,得到数据集的一个代表点的数据集,然后再利用划分的方法对代表点进行聚类,最终得到一个易于描述的聚类结果.此外,根据聚类分析的一些共同的处理,文中还提出了一个处理聚类问题的框架.聚类分析既可以作为一个独立的数据挖掘过程又可以是数据挖掘其它过程的预处理步骤,在第四章通过几个应用案例对聚类分析的应用进行了详细的阐述.第五章设计了一个基于任务驱动的数据挖掘系统,在具体的系统设计和实现方面探讨了聚类分析技术和数据挖掘技术的细节.
其他文献
声学建模是语音识别领域中的关键问题之一.该文对汉语连续语音识别中的声学建模技术和参数共享策略进行了深入的研究.主要针对两个方面:一、提出并实现了半连续分段概率模型(
该文首先介绍了常用的关系数据库及数据库开发技术,根据对该系统的实际需求的分析,进行数据抽象并绘制了E-R图,完成了E-R模型向关系模型和数据模型的转换,最终完成了舌像数据
本论文讨论的是基于组件技术的开放式控制器的研究。主要工作是基于开放式系统的思想,探索在通用操作系统作为实时控制领域应用平台的基础上,以二进制组件为实现技术的开放式数
本论文提出一个具备本体论(ontology)自动分类的多代理个性化信息服务系统;提供一个自动化的机制,用自动建构的本体论知识结构对来自于网络的大量信息予以分门别类,同时根据用户
该文探讨网格计算系统的体系结构及模型.重点研究网格计算系统中通信系统的构建技术.该文主要通过参考相关资料及相关研究性项目,给出网格计算系统的体系结构及层次模型,并对
VoD系统中通过接入控制模块来保证服务质量,不仅在VoD系统中,在其它提供服务质量保证的系统中也存在接入控制模块.它是系统中一个极为重要的模块,直接影响到系统的效率和系统
该文着重探讨了计算机控制技术在高精度平整机组底层控制网络中的应用,分析了FCS与DCS、FCS与IT以及Infranet、Intranet与Internet的关系,说明了现阶段工业底层控制网中FCS与
随着我国航天事业的高速发展,尤其是载人航天工程的顺利实施,人们对于太空的探索和开发的需求越来越强烈,对空间有效载荷技术的学习和挖掘也在逐步提高。此外,各种空间应用和型号
该文首先详细分析了盘古常识知识库的组织结构.根据盘古常识知识库的组织结构建立起相应的数据模型,以此为基础并结合使用上的需求设计了这种知识查询操作语言.此外,该文作者
本文介绍电力营销决策支持系统(EPMDSS)中模型库系统的设计思想与实现技术。为了使模型具有良好的可扩展性、可重用性、支持分布式应用,我们将组件技术引入到模型库的设计与实现中,论述了用基于组件的软件开发方法来开发模型库系统的思想。文中提出基于组件技术的DSS模型设计与实现策略,并且给出一个分布式模型部件(基于组件思想)的结构。