基于密度峰值的自适应聚类改进方法研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:x1026221496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现在信息技术和计算机的发展,产生的海量数据成为了一种关键的资源,从中发现有利用意义的隐含内容非常关键。聚类能够在没有类别标记的前提下发现数据内部的关系。密度峰值聚类算法(Clustering by fast search and find of density peaks,DPC)原理易懂、便于操作、聚类准确性高,但是仍然具有一定的缺陷,因此本文提出了DPC算法的两种改进方法并对其聚类效果进行了验证。本文首先讲述了DPC算法的原理、优点与缺陷。DPC算法所定义的中心点的局部密度值较高并远离较该点密度更高的样本。然而算法的重要参数截止距离需要用户根据经验值来设置,并且需要手动选择聚类中心,这为聚类结果带来了很大的不稳定因素。其次,提出一种结合K近邻(k-Nearest Neighbor,KNN)的改进型自适应密度峰值聚类算法(KNN-DPC)。根据KNN的算法原理,给出了密度和与密度更高点的相似性的新的计算方式。同时,利用聚类中心的局部密度与到密度更高的样本的相似性的乘积大于其他非中心数据的思想,自适应的选择聚类中心。再次,提出一种基于自调节步长果蝇优化(self-adjusting step size fruit fly optimization,SFO)的自适应密度峰值聚类算法(SFODPC)。将SFO用于计算DPC算法的重要参数截止距离。SFO算法提高了果蝇优化算法(FOA)跳出局部最优的能力并加快了其计算速度。将其用于DPC的参数计算有效解决了DPC算法参数设置的难题,并提高了准确率。最后,本文采用常用于聚类算法评价的5种人工和5种真实的标准数据集对KNN-DPC和SFO-DPC进行对比实验测试,并建立了基于SFO-DPC的三维沥青路面裂缝检测系统,利用SFO-DPC算法对Gocator3100智能扫描仪采集的沥青路面三维数据进行聚类分析。实验结果表明,本文提出的KNN-DPC和SFO-DPC在解决了DPC算法参数设置和确定中心点的缺陷的同时,提高了算法的效率与准确率。本文提出的SFO-DPC裂缝识别系统能够精确高效地检测沥青路面裂缝。
其他文献
变译理论适用于文学、社科和科技三类作品,可以充分体现译者的主体性,突出原作的使用价值,满足读者的特殊需求,追求翻译的社会效益和经济效益(黄忠廉,2016:236)。本文是笔者
本研究的情境是云南省的一所特殊教育中等职业学校,学生的情况有一定特殊性,与同龄的在其他学校的学生有很大不同。学生平时的学习表现表明词汇的长期识记对他们来说是学习英
本文是基于新乡拓新药业股份有限公司的化工专利文献翻译项目所撰写的英汉翻译实践报告。报告的研究对象是三篇医药中间体专利文献,文献描述了三种医药中间体的制备工艺以及实验过程,医药中间体是用于合成药品的化工原料或化工产品。该翻译项目减少了因语言不通带来的问题,为公司研发人员学习理解国外专利技术提供便利,从而加快了该公司学习借鉴国外专利技术的步伐,促进了公司自主研发创新的进程,对公司来说具有十分重要的意义
所选文本是J.L.布莱克(J.L.Black)和迈克尔·约翰斯(Michael Johns)的著作《冷战重现》(The Return of the Cold War)中第一部分第二节的内容。《冷战重现》一书生动全面地描
近几年,处于人眼安全波段的2μm激光在医疗、大气探测和生物工程等多个领域展现出独特的优势。由于光纤激光器结构简单、经济实用并且随着2μm波段光纤元件制造技术的发展,掺铥光纤激光器已经成为2μm波段高效激光源。全光纤化的被动锁模掺铥光纤激光器不仅可以作为2μm波段的优秀非线性光纤光学研究平台,而且可以作为高功率2μm波段激光系统的种子源。单脉冲能量高、不易分裂的耗散孤子共振脉冲是激光放大系统理想的脉
防卫过当的认定与否关系着罪与非罪的法律评价,同时对于彰显司法公正,弘扬社会正义具有举足轻重的作用。但防卫过当在司法实践中的认定现状却表现为将正当防卫行为从严认定为防卫过当,而将真正意义的防卫过当认定为普通的故意伤害案件。对此,本文以近年来司法实践中的防卫过当案件作为研究样本,进一步整理分析后得出当前司法实践存在的主要问题:仅以防卫行为的损害结果认定防卫过当,对“重大损害”的认定标准不一致,将防卫人
当前有关子团队的研究中,主要关注点还是在团队内部,对于团队外部影响因素考虑较少。社会关系网络与子团队的形成和影响密不可分,团队内的成员每个人都有自己的内、外部社会
统计数据是统计工作的基础,没有质量的数据就是一堆毫无用处的数字,而它的存在还是十分有害的,所以统计数据质量的高低决定着统计工作整个过程的成与败。统计数据质量是统计
生物质具有来源广泛及可再生的优点,将其制备成为碳材料可用于超级电容器,电池及催化领域。甲壳素是自然界唯一大量存在的含氮化合物,其制备的氮参杂碳材料在超级电容器应用方面具有广阔的前景。直接碳化甲壳素会导致碳材料的比表面积有限,孔结构单一及氮含量不高的问题。本论文以改变碳电极前驱体——甲壳素的形态入手,制备了分散性较好的甲壳素纳米水凝胶,并以此纳米凝胶为基础制备了氮掺杂的多孔碳纳米材料。进一步通过引入
近年来,社会主义市场经济日渐繁荣,社会法治建设逐步推进,这使得人民群众法治意识不断增强,权利意识渐渐觉醒,当有纠纷和矛盾出现时,群众不再“厌讼”、“惧讼”,逐步开始接