基于引力的密度峰值算法研究及其应用

来源 :吉林财经大学 | 被引量 : 0次 | 上传用户:LIU73558109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会随着科技的进步日新月异,互联网、云计算、大数据等技术时刻影响着人类的思维和生活,深刻展示了世界发展的前景。互联网的兴起和信息数据的不断累积推动着整个社会向大数据时代发展,数据在人们日常生活中的方方面面扮演着重要的角色,各行各业因为大幅爆发的数据正变得蒸蒸日上,数据已成为当今社会发展的重要影响因子,而如何有效处理不断庞大的数据成为时下数据挖掘领域的难题。聚类算法作为无监督学习的一种方法,是数据挖掘中重要的工具,如今也成为科学研究领域的热点问题。密度峰值算法(DPC:Density Peak Clustering)是一种新颖而有效的基于密度的聚类算法,于2014年在Science上发表。相比其它聚类算法,密度峰值算法在处理不同大小和密度的集群上具有独特的优势,但DPC算法仍然存在一些不足:(1)决策图的中心点选择困难。由于部分具有复杂结构的数据集,其聚类中心点在决策图中辨识度不高,而DPC算法需要在决策图中人为选择聚类中心点,容易导致错选或漏选现象;(2)异常点识别困难。DPC算法在数据集低密度区域难以有效处理样本点,这也导致DPC无法识别异常点;(3)大型数据集处理过慢。DPC算法的时间复杂度为(9)),这也导致DPC在需要大量的时间来处理大型数据集,因此其在大数据时代得不到广泛使用。本文根据以上存在的问题提出了不同的改进方案:(1)针对密度峰值算法在某些复杂结构的数据集上中心点不明确的现象,本文提出基于引力的密度峰值算法(GDPC:Gravitation-based Density Peaks Clustering)。新算法使用引力的倒数作为参数替换DPC算法中的参数,通过两个算法对比实验来看,GDPC生成的决策图比DPC更容易识别中心点。(2)针对所提出的GDPC算法在异常点识别方面的不足,本文提出一种K近邻改进算法,该算法在GDPC聚类结束后对低密度区域使用改进的K近邻算法对没有识别的低密度点进行分类,使GDPC算法能够有效识别异常点。(3)针对GDPC算法在处理大型数据集上耗费时间过长的问题,本文提出了一种k-Means与GDPC相结合的k-GDPC算法,k-GDPC采用先分区再合并的策略来快速发现空间数据库中具有不同大小和密度的簇类,由于它在聚类过程中缩减了大量的数据处理,从而大大减少了时间的消耗。k-GDPC算法的时间复杂度与数据量呈线性关系,旨在处理大型数据集时替换GDPC算法。
其他文献
在战争发生的时候,人防地下室能够对人民生命财产安全起到保护作用,最大程度的降低损失。从整体上而言,我国人防工程建设还不够完善,还在不断的探索实践当中。地下室墙体结构
自2006年以来,邮轮产业在中国迅猛发展。由于我国邮轮产业发展重心一直集中于邮轮旅游市场培育,行业管理与立法方面远远落后于现实需要,因而出现了一系列诸如低价团泛滥、恶
目的:探讨不同液体(醋酸钠林格氏液组和乳酸钠林格氏液)限制性复苏对创伤失血性休克患者(THS)的凝血功能(凝血酶原时间、活化部分凝血活酶时间)和血栓弹力图(K、R、MA等)的影
针对圆极化天线轴比带宽较窄的问题,设计了一种由两个威尔金森功分器和两个环形电桥馈电的四馈双圆极化微带贴片天线。由于馈电网络不同端口在馈电时其输出信号相移方向相反,因此可以辐射左、右旋圆极化波。双圆极化馈电网络具有结构简单、性能可靠特点。辐射贴片采用顶点相对的4个三角形贴片加载T形枝节,并采用背馈的形式实现了天线紧凑的结构。在2.4~2.48 GHz频段内天线实测中心频点S11小于-15 dB,端口1的左旋圆极化轴比小于2 dB,端口2的右旋圆极化轴比小于1.5 dB,与同类型相近尺寸的天线相比具有较宽的轴
随着中国经济的飞速发展,特别是加入WTO后,世界经济正朝着全球化和一体化的方向发展,由此带来了各公司之间的人才竞争越加剧烈。而中国的公司长期以来一直受传统的经济体制制约影响,通常会忽视现在是一个“以人为本”的社会,通常使用低成本的研发人才,很少重视此类人才激励机制,进而存在许多人才出于各种原因选择辞职离开。对于A科技有限公司,近几十年来,该公司已经培养了许多优秀的人才,但是由于缺乏对研发人员激励机
在传统能源系统中,各能源子系统之间的运行结构单一、耦合关系稀疏和能量损耗严重,凸显了我国能源、环境和社会之间的矛盾,加速形成了新—代能源系统的提出。综合能源系统作
蜿蜒秀美的涪江、琼江从潼南区穿流而过。江岸两侧,青翠欲滴的青菜、清香扑鼻的柠檬树、依次排开的虾田,令人目不暇接。2016年,潼南获批退出市级扶贫开发重点县,在全市率先脱
由于经济水平的提升,企业的经济效益水平也不断升高,工作人员对工作氛围、晋升以及职业培训、薪酬待遇和福利水平的期待值也因此而升高,当企业不能为工作人员提供他们期望的这些福利待遇或者其他要素时,工作人员往往会产生负面情绪或者消极怠工,不利于企业的经营和发展。所以员工激励机制对企业人力资源管理以及经营活动的开展有重要影响。激励的作用就是激发工作人员的工作热情,发挥工作人员的主观能动性,使其更加积极主动的
在现代无线通信系统中,天线作为前端设备之一,它的工作性能对整个系统的通信质量起到了举足轻重的作用。随着科技进步和学术的发展,无线频谱已用范围越来越大,可以用于设计的频谱越来越多。然而对于上天入地需要载荷的设备,它们所搭载的天线要求的性能越来越严格,因为有成本的限制,需要尽可能缩小各种设备的体积。因为这种原因,天线技术发展的趋势逐渐向使天线轻量化、所占空间体积更小、适用多种频段、辐射多种极化等靠拢本
科技的进步推动着医药市场的快速发展,为我国医药企业带来了很多机遇。研发人员是医药企业创新的主体,掌握着核心的知识和技术,企业能否通过有效的激励措施挖掘研发人员的潜