面向轮廊数据的K-means聚类优化算法

来源 :云南大学 | 被引量 : 0次 | 上传用户:javaname41
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前各式各类的统计结果和科研记录的内容大量出现,数据量不断地提升。如何在这种大数据的背景之下,有效地针对不同类型数据进行分析和研究,从海量的数据中提取有用的知识成为时代当务之急的问题。数据挖掘就是顺应这种需要应运而生发展起来的数据处理技术。聚类就是观察分析各种抽象对象,或者是各种实际对象的规律和特征,并将其中具有一些相似性的目标进行分类分析,目前已逐渐成为一种非常有效的数据挖掘分析方法。然而现有的聚类算法存在很多问题:基于划分的K-means聚类算法,处理效率较高,但无法妥善处理非球状数据类型;基于层次的聚类算法,通过层次化的形式处理非球状数据,但是整体处理效率一般;而基于密度的聚类算法计算复杂度太高,处理效率较差。如何以较高效率处理包括轮廓数据类型等的非球状数据,依旧是数据挖掘领域的一个重要问题。本文在处理效率较高的K-means算法的基础上进行改进,优化其初始中心点的选取,提高初始中心点选取的质量,设计了一种面向轮廓数据的K-means聚类优化算法,以解决其在轮廓数据类型等的非球状数据上处理困难的问题。改进算法优先从端点开始对数据进行处理,设置参数以半密度方式获取初始聚类中心点集,并最终得到初始聚类中心,之后调用K-means算法完成聚类分析,提高了划分聚类处理非球状数据的能力。本文通过在人工数据集上的进行对比分析,并且在多种不同维度和不同数据量的真实数据集上进行对比测试分析,验证算法的有效性和可行性。通过实验分析表明,改进算法可以较好地处理轮廓数据,并且效率较高,整体上改进了原算法处理数据类型的种类和处理效率。
其他文献
随着国家政府部门政策资金的大力支持,我国旅游业与文化业的融合也在不断深入。国内文化行业受到越来越多用户的关注,用户需求和文旅市场的需求正日益提高。旅游文创设计的发展如同一匹黑马,引领着行业的飞速前进。楚雄地理位置优越,是云南省的交通要塞,也是滇西和滇北旅行的必经之路,这为民族特色旅游文化产业的发展提供了优渥的平台。楚雄作为彝族主要居住地区之一,是彝族传统文化与生态资源的聚集地。从彝族的纹样图案、工
学位
属性级情感分析通过对文本中某一实体的某一属性进行建模,以探究评论者对于该属性的情感倾向。现有研究多通过注意力机制或者图卷积网络来对齐属性词与相关上下文,以此获得较准确的情感表征。但上述方法忽视了词与词之间的依赖关系,致使模型会将属性词关联到无关上下文。基于此,论文通过将句法依赖关系注入语言模型以获取词与词之间的潜在句法信息,进而开展属性级情感分类和情感三元组提取的相关研究。论文的主要内容包括:1.
学位
目的:建立抗结核药物性肝损伤患者口服芍药甘草汤颗粒前后7种主成分的含量测定方法,研究芍药甘草汤血行成分变化。方法:患者血浆样本经甲醇除蛋白后,采用Thermo scientific syncronis C18反向梯度洗脱法分离各主要成分;电喷雾离子源经正、负离子模式对色谱流出物进行检测,三重四级杆质谱对各主要色谱峰进行归属。选择联苯双酯作为内标,测定各成分的药物浓度。结果:芍药甘草汤颗粒中7个主成
期刊
太阳射电爆发是一种来自太阳的瞬时增强的无线电波,这种高强度信号会严重干扰无线电通信系统和导航系统。太阳射电频谱仪记录了太阳射电波段中的太阳射电辐射强度,是研究太阳射电爆发的主要设备。对太阳射电爆发进行研究有利于促进人类对太阳活动的认知,保证人类生活的正常进行。太阳物理研究中,需要重点研究太阳的爆发现象,而太阳射电频谱是太阳活动在无线电波段的观测结果。传统的通过人工分析射电频谱找出太阳射电爆发的方式
学位
作为计算机视觉领域的一个重要分支,视频目标跟踪技术现已广泛应用于工业和生活的许多方面,例如智能监控设备,军事导弹跟踪,智能交通监测,无人机目标跟踪等。由于在现实的跟踪场景中存在众多困难挑战,例如形变、遮挡、光照变化、尺度变化等,使得开发出一个鲁棒性强的跟踪算法依然是一项困难且富有挑战的工作。现有的孪生网络跟踪器把目标跟踪定义为一个模板匹配任务。在每一帧中给出搜索区域,与初始化时固定好的目标模板进行
学位
为采取针对性措施有效预防手术室火灾,笔者通过百度、消防主管机关官方网站、CNKI数据库和中国国家图书馆搜集资料,共获得2000—2019年全国手术室火灾案例9起,把火灾资料数据输入Excel2007进行统计分析,结果显示9起综合医院手术室火灾造成1人受伤和1人死亡,涉及6个等级的9家医院、6个月份、8个时段、7个起火部位和3种直接原因,具体分析发现火灾数据在4类分组中各具特点,文章根据统计结果提出
期刊
教育在当下的社会发展中逐渐受到越来越多的关注,那么教育在日后的发展中如何更好地适应,推动幼儿以及学生的全面发展需要引起当下教育工作者的高度重视。教育首先从幼儿教育开始,在幼儿教育中,幼儿的成长与发展是极为重要的,幼儿教育作为整个教育阶段的基础,需要幼儿教师及时进行教育教学方式的创新,以便能够更好地为幼儿日后的发展打下坚实的基础。在当下的幼儿教育中,创意艺术活动的组织与发展能够在很大程度上帮助幼儿塑
期刊
空间co-location模式挖掘的目标是发现空间特征集的子集,这些特征的实例在地理空间中频繁相邻出现。然而,在许多实际情况中,空间特征的实例不仅包含空间位置信息,还包含属性信息。现有的大多数co-location模式挖掘算法只关注特征的空间位置信息,而忽略了其属性信息。虽然已经有一些研究使用一型模糊隶属度函数挖掘模糊co-location模式,但这种隶属函数存在很大的不确定性。为了解决这个问题,
学位
得益于计算机网络传输速度的飞快提高,现实世界中实体之间的信息流通日益频繁,大数据时代就此来临。图结构数据建模作为研究实体间交互、组织等关系特征的一种常用方法,在数据挖掘、分析等领域具有重要意义。此外,由于神经网络在特征编码上的强大优势,已提出许多针对图结构数据的神经网络模型在推荐系统、知识图谱等图下游任务上取得巨大成功。作为图数据分析处理的首要环节,图表示学习旨在对实体节点的属性和行为关系进行特征
学位
<正>3~6岁是培养幼儿动手能力和大脑技能的关键时期,同时也是培养幼儿创造力和想象力的重要时期。幼儿园创意艺术活动是一种幼儿教学活动,它以幼儿技能发展和个性发展为核心,以教师指导为基础,以课程主体为线索,通过多种艺术表现形式的结合,促进幼儿创意艺术能力的发展。幼儿创意艺术活动属于创意教育的范畴。教师在幼儿教育中开展创造性的艺术活动,有利于锻炼幼儿的思维能力,挖掘幼儿的创造潜能,促进幼儿更好地发展。
期刊