【摘 要】
:
针对传统的代表点聚类算法对收缩因子的敏感性和聚类数不适应数据的动态变化等问题,综合研究凝聚型层次聚类问题,提出一种代表点的近似折半层次聚类算法——ABHCURE(Approxim
【机 构】
:
南京航空航天大学计算机科学与技术学院; 中国民航大学信息技术科研基地;
【基金项目】
:
国家自然科学基金重点课题项目(61139002)资助
论文部分内容阅读
针对传统的代表点聚类算法对收缩因子的敏感性和聚类数不适应数据的动态变化等问题,综合研究凝聚型层次聚类问题,提出一种代表点的近似折半层次聚类算法——ABHCURE(Approximate Binary Hierarchical Clustering Using Representatives),有效地解决了离群数据点对聚类结果的影响和聚类数的难确定问题.首先,提出单层多簇合并模式来提高算法的执行效率.其次,为了避免选择离群数据成为簇的代表点破坏原始数据分布,引入准噪声机制收集各层的准噪声数据增强算法的鲁棒性.最后,通过动态最小聚类数确定方式实现聚类数需求和确定难度的折衷.实验结果表明,该算法不仅运行时间相对较短,具有灵活的聚类数,还可以得到更高精确的聚类结果.
其他文献
目的:对本市老年妇女的健康状况进行全面调查,并分析影响老年妇女健康的相关因素。方法:采用不等比分层整群随机抽样的方法,对本市2009年6月~2010年6月不同经济水平、地理状况中
襄阳文化培养了孟浩然崇尚隐逸的趣尚,在仕途失意之后,他不得不在家乡隐居。他的隐逸和陶渊明的隐逸相比,是充满心理矛盾的,但又是充满了生活情趣的。
<正>随着2016年度上市公司年报披露的正式结束,物流业上市公司当年的经营状况也呈现在公众面前。年报数据显示,2016年物流业上市公司的整体业绩向好,部分细分领域上市公司表
随着时代的发展,各种新兴技术也开始涌现,在科学技术的发展创新下,计算机应用的范围也进一步扩大,在这种大时代背景下,我国经济的发展也取得了显著的成绩。在各种前沿技术中,
劳务公司实行“员工制”具有提高劳务服务质量、增强劳务人员工作稳定性、规范劳动力市场、提升企业服务质量、加强社会服务参与的优势,但也面临企业运营成本高、盈利能力弱
产业结构的调整与升级除了依靠内部结构的变化以外,外商直接投资也是重要的驱动力。曾经的重工业省份--辽宁省的产业结构的优化迫在眉睫。本文通过实证分析,研究了外商直接投
美国"次贷危机"的全面爆发使得人们越来越意识到财务流动性不足的危害;此后,在2009年达沃斯经济论坛上,多数经济专家对危机前美国采用无限制的消费、无限制的负债所引起的流
集胞藻6803 (Synechocystis sp. PCC 6803)是实验室内常用的研究基因工程和光合作用的一种蓝藻模式生物,其全基因组序列已全部获得。我们通过Internet检索和DNA序列对比发现,集
经济新常态下,小微企业在稳定增长、扩大就业、促进创新、繁荣市场和服务公众需求等多方面发挥着重要作用,但小微企业“融资难”“融资贵”仍是当前亟需解决的问题。$$发展存在
基于3年的流域水文原型实测资料,本文探讨了SSARR模型在紫色丘陵区小流域上的应用。在模型率定验证过程中,模拟计算值与实测结果取得了较好的吻合,初步表明该模型适用于小流