基于连续性原理的聚类算法研究

来源 :东北师范大学 | 被引量 : 8次 | 上传用户:yymmttjjjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术与日常生活的关系已经越来越密切了,人们对数据挖掘技术在某些领域中应用的兴趣与日俱增。数据挖掘技术已在生物医学、金融业、零售业、电信业等多个行业被广泛应用于客户关系管理、市场趋势预测等领域,为管理者进行决策提供了更有价值的信息依据。同时,数据挖掘也是市场竞争的需要,它为决策者提供重要的、前所未料的信息和知识,从而产生不可估量的效益。聚类分析是数据挖掘技术的一个重要分支,它既可以作为独立的数据挖掘工具进行有效的数据分析,又可以作为其它数据挖掘方法的数据预处理步骤,为其它数据挖掘方法提供有效的数据支持。所谓聚类,就是将物理或抽象对象的集合分成相似的对象类的过程。在同一个类内的对象间有较高的相似性,而不同类间的对象具有较大差别。到目前为止,广大研究工作者针对于不同的领域和数据类型已经提出了很多种不同的聚类方法,但这些方法仅适用于特定的领域。而且在理论和方法上还存在很多不足。本文对聚类分析技术进行了详细的分析和探讨。首先介绍了聚类方法的划分,详细的阐述了各种聚类算法的核心技术。并且探讨了传统聚类算法的诸多优点和不足。针对已有聚类方法中存在的种种问题,本文根据类的定义和约束条件提出了基于数据连续性原理的聚类方法。根据连续性原理提出离散状态下相对连续的理论。确定了离散状态下相对连续的评价标准。引入了支持度和隶属度的概念来确定最终的聚类结果,并通过实验对算法进行了有效的验证。
其他文献
随着全国数字电视整体转换工程的推进,数字电视的平板化、大屏化和高清化,地面数字电视信号的开播、融合芯片的量产,以及日益丰富的高清互动应用,新型互动数字电视已深入到千家万
随着因特网的普及与发展,XML语言被普遍用于异构信息和异构平台的数据交换和数据共享。为了推动XML数据查询和处理的标准化,国际万维网组织W3C组织发展了XQuery语言,并将其作
随着通信技术的高速发展,降低传输中的数码率成为一项关键问题。为了降低传输的费用,必须对采用模/数转换技术得到的语音信号进行压缩。这也就促使了语音压缩编码技术的不断
藏语自然语言处理是一门自然科学与社会科学的交叉学科,集藏语语言学、计算机科学、数学、逻辑学和心理学,研究人与人、人与计算机之间交流的一种语言问题。相对而言藏语自然
分类问题是指通过对已知类别的样本集的学习,来预测未知类别样本的问题。对于分类问题而言,根据样本集合所拥有的标签数,可分为两类问题和多类问题;而按样本所拥有的标签数,
异常检测技术由于其在网络安全、信用欺诈和金融分析等领域的广泛应用,一直都是信息科学研究领域的关注重点,研究者们将统计学,数据挖掘,信息理论等众多技术引入异常检测的研
节点准确的位置信息是提供监测事件位置的前提,对节点定位跟踪技术进行研究具有重要的理论和实际意义。无线传感器网络移动信标节点定位机制大大减少了网络构建成本,一定程度
近年来,随着面向服务的计算模式和架构的广泛应用,越来越多的Web服务出现在Internet上。许多Web服务具有相同或相似的功能,但是服务质量(Quality of Service,QoS)却参差不齐
现代处理器体系结构的硬件设施已经具有非常优良的性能,特别是向量VLIW处理器同时具有标量和向量处理单元。与超标量、超流水等高性能的体系结构不同,VLIW的指令调度、相关性
数据加密是保证敏感数据保密性的重要手段,如何在加密后的数据上进行高效查询是数据库研究领域的一项难题。为提升加密数据库的查询性能,论文设计了一种新型的B+树密文数据库