【摘 要】
:
聚类分析是数据挖掘中最重要的技术之一,它在社会经济的各个领域都具有重要作用,并被广泛应用。K均值算法是最经典、应用最广泛的聚类方法之一,但其缺点是过度依赖初始条件和
【机 构】
:
云南大学软件学院,云南省软件工程重点实验室
【基金项目】
:
国家自然科学基金项目(61462091), 云南大学数据驱动的软件工程省科技创新团队项目(2017HC012)资助
论文部分内容阅读
聚类分析是数据挖掘中最重要的技术之一,它在社会经济的各个领域都具有重要作用,并被广泛应用。K均值算法是最经典、应用最广泛的聚类方法之一,但其缺点是过度依赖初始条件和聚类数目难以确定,这制约了其应用范围。引入簇的内聚度和耦合度的定义与度量方法,基于"高内聚低耦合"的原理,在二分K均值聚类过程中对得到的簇进行不断的分裂和合并,并判断聚类结果是否满足要求以确定聚类的次数和簇的个数,从而实现对二分K均值聚类过程的改进。在Iris数据集上的实验测试与分析表明该算法不仅更加稳定,而且其聚类结果的正确率也较高。
其他文献
双目立体视觉模型通过模拟人眼可以实现对目标距离的测量。为了获得水上船舶实时的运动状态,提出了一种基于双目立体视觉的船舶轨迹跟踪方法。首先,通过摄像机标定、线性空间点三维重建可以测得以相机为中心到船舶的距离,得到船舶的部分运动轨迹;其次,在双目立体视觉测距系统的基础上采用常速(Constant Velocity,CV)模型的方法对船舶运动建模;最后,对建立的船舶运动模型利用强跟踪卡尔曼滤波(Stro
在我国经济快速发展的过程中,交通运输经济也取得了快速的发展,但是随着交通运输经济的不断发展,在新形势下面临着很多困境。因此,解决好交通运输经济面临的困境成为交通运输
伴随着全球化经济迅速发展,以ESP为导向的国际化专业英语已成为各个行业重点关注对象。在这种社会趋势下,高师作为专门用途英语人才培养主要基地,创新英语课程教学模式,切实
体育游戏作为体育教学实施的一种有效形式,在教学实践中起着越来越重要的作用。通过对体育游戏的特点与作用、体育游戏的创编原则、教学原则进行分析研究,探讨了体育游戏的组
本文介绍了基于控制流分析的软件源代码静态测试技术,并实现跨语言支持的静态测试引擎。通过推断源代码中变量间的关系,分析其实际特征,从而对源代码可能存在的缺陷错误进行
针对高职足球教学进行分析,教师教学过程中注重培养学生对足球的兴趣,可以通过多媒体技术教学方式,为学生播放相应的视频,从而使学生的兴趣得到充分提高。此外,教师要积极引
十八大后,习近平总书记提出了二十四字的社会主义核心价值观,在新的核心价值观中就明确了"和谐"的重要性。在两个"环境建设"中,发展环境和生态环境关系到当前与长远、国计与
在当前的社会经济条件下,劳动是大多数人的谋生手段。工资肩负着维护劳动者及其家庭生存和发展的使命。但近年来,拖欠工资现象严重,影响劳动关系和谐和社会稳定。本文从劳动
为了进行基于模型的软件测试变异分析,文中提出了一种基于模型检测的变异测试用例生成方法。基于模型检测工具UPPAAL的形式化分析与测试框架,首先用符合规范的时间自动机模型
十八大报告指出,要牢牢把握加强党的执政能力建设、先进性和纯洁性建设这条主线,同时对每一个党员从思想理论、党性教育、道德建设等方面提出更高标准。