引力聚类及其应用研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:a53825777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来热门的计算机应用技术,聚类是数据挖掘中重要的研究分支。聚类技术是将未分类的样本,通过其相似度进行分类,使得类簇内部样本间相似度最大,而不同类簇间相似度最小,从而发现数据集的特性和内部模式。然而,一些数据集的结构和分布呈现高度复杂性,数据挖掘也为聚类带来了大量亟待解决的问题。因此,聚类分析方法进一步研究的空间还很大。层次聚类方法是一种常用的聚类算法,通过分解目标数据集来创建一个层次。按照层次的分解方向,它分为自下而上(凝聚方法)和自上而下(分裂方法)两种类型。覆盖算法是构造型学习算法,通过找到一组覆盖,使得属于同一类的样本属于同一覆盖,不同类的样本不属于同一覆盖。覆盖聚类算法借鉴覆盖算法的构造性思想,找出一组覆盖,使得属于同一覆盖的样本间距离较小,不同覆盖间的样本间距离较大。我们生活的宇宙,从最初的宇宙大爆炸,宇宙所有的物质都处于混沌状态中,杂乱无章。由于万有引力的作用,使得宇宙中的物质相互吸引、靠近,进而融合形成了星系,恒星,行星等天体。这一过程和数据聚类过程极为相似,都是从最初混沌,通过对混沌中的个体进行某种聚类运算,最终得到结构清晰的聚类结果。正是由于这种相似性,我们把万有引力融入聚类算法中,改进相似度的度量方法,即从单纯的距离作为相似度,到距离与类簇的大小比值作为相似度。本文中研究了层次聚类算法(Hierarchical Clustering, HC)和覆盖聚类算法(Covering clustering algorithm, CCA),在这两个算法中,本文用引力替代距离作为相似度计算公式,提出基于引力的层次聚类算法(Hierarchical Clustering Based on Gravity, HCBG)和基于引力的覆盖聚类算法(Covering Clustering Based on Gravity, CCBG)。实验结果表明以引力作为相似度的聚类结果有一定的改进。客户关系管理(Customer Relationship Management, CRM)将最佳的商业实践与数据挖掘、数据仓库、一对一营销、销售自动化以及其它信息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域提供了一个业务自动化的解决方案。客户细分是CRM技术中一项重要研究内容,通过对客户的有效分类,采用针对性销售策略,达到销售利润最大化。在客户细分中,最重要的两个步骤是数据挖掘和决策支持,数据挖掘即通过聚类算法找出具有相似行为的客户;决策支持即通过贝叶斯分类、决策树等方法,根据某一客户的个人资料,预测他的行为。本文在数据挖掘过程中采用基于引力的层次聚类算法,并通过朴素贝叶斯分类方法,对客户的行为进行了预测。
其他文献
无线传感器网络已经在生活各领域得到了广泛的应用,尤其在军事、医疗和公共安全等重要领域。但以数据为中心的传感器网络受到传感器节点固有资源的限制,网络中传输的数据面临着
命名数据网络(NDN)是一种以内容为中心的新型网络架构,主要根据数据名字对数据进行路由和转发,解决了用户对网络中海量、异质信息高效访问的需求,同时规避了TCP/IP网络在安全性
近年来,不确定性作业车间调度问题引起了研究者的广泛关注。不确定因素的引入大大增加了对生产调度问题的分析和建模的难度。但是,同时对不确定条件下的作业车间调度问题的研
随着互联网技术和浏览器技术的快速发展,越来越多的桌面应用成功地转向了浏览器平台,但浏览器基于HTTP协议的特性,使得客户端和服务器端难以维持持久连接的状态。服务器推送
灾难现场危险的工作环境给人员搜救带来了极大的困难。随着计算机技术的发展,机器人技术得到了广泛的应用,如何将机器人应用于灾难现场的人员搜救工作是一个有重要研究意义的
无线传感器网络(Wireless Sensor Network, WSN)中的关键问题就是传感器节点能量的有限性,节能高效地使用节点能量是WSN面临的一大挑战。本文研究WSN中传感器节点能量高效控
车牌识别是智能交通系统中最关键的研究课题,有着广泛的应用前景,如交通道路监控、高速公路自动收费、停车场管理等。随着经济社会发展,机动车辆日益增加,对车辆进行安全管理
以往的生产调度一般是将产品按工件分解,加工和装配分别处理,但这些生产作业调度的算法主要适用于大批量相同产品的生产。当生产产品属于多品种小批量,特别是具有树状结构的单件产品时,将加工与装配分别处理,必然影响产品加工与装配内在的可并行处理关系,影响调度效果。因此本文研究的复杂产品加工和装配综合调度优化具有重要的理论和实际意义。表面上产品工艺树中最长路径上工序的加工时间和是产品完工时间的下界,事实上由于
机器翻译(Machine Translation,MT)是指用计算机自动地将一种源自然语言,翻译成用户需要的目标自然语言,在本课题中即是将蒙古语翻译成为汉语。机器翻译作为自然语言信息处理
电子化量身定制服装eMTM (Electronic Made to Measure)是21世纪新兴的一种服装生产方式,它利用现代三维人体扫描技术、计算机技术和网络技术将eMTM系统中三维虚拟人台生成、