基于核集合的大数据快速Kernel Grower聚类方法

来源 :自动化学报 | 被引量 : 0次 | 上传用户:zwb1102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Kernel grower is a novel kernel clustering method proposed recently by Camastra and Verri. It shows good performance for various data sets and compares favorably with respect to popular clustering algorithms. However, the main drawback of the method is the weak scaling ability in dealing with large data sets, which restricts its application greatly. In this paper, we propose a scaled-up kernel grower method using core-sets, which is significantly faster than the original method for large data clustering.Meanwhile, it can deal with very large data sets. Numerical experiments on benchmark data sets as well as synthetic data sets show the efficiency of the proposed method. The method is also applied to real image segmentation to illustrate its performance.
其他文献
本文作者以调查问卷、面谈和课堂观察等方法对浙江财经学院80名学生的学习策略使用情况进行调查,旨在发现:1)不同性别学生在学习策略使用上是否存在差异;2)如果存在差异,则进
船舶企业的外来劳务人员(以下简称“外劳”)是指与船厂没有劳动合同却在船厂内工作的人员。一般分为两种,一种是以工程“外包内做”形式在船厂工作的外包单位员工,他们的劳动关系
初步矿产普查评价成果表明,三江北段已初步显示出巨大的成矿潜力.在该区东部,以纳日贡玛-陆日格含矿斑岩体为中心的斑岩-矽卡岩大型成矿系统已初露端倪.纳日贡玛,作为该区的
在查明搭格架铯矿床产出的地质背景、成矿阶段及其年龄、地球化学与同位素组成的基础上,本文较为系统地研究了硅华的矿物学与组构特征,加深了对硅华形成演化过程的认识.研究
英语在其全球化的过程中产生了许多变体,由此产生出来的问题是中国英语教学是否应该教授标准英语。本文在检索大量文献基础上对教授标准英语的利与弊做出一番综述,然后就教授
甲马矿床是西藏腹地冈底斯带已投入开采的大型多金属矿床,有关其成因的研究直接影响着该带多金属矿床的区域找矿方向及对冈底斯带地球动力学过程的成矿效应研究.目前对该矿床
在体育类高职英语口语教学中,实施句子—对话—转述—口头表达四步教学法以及分层评价法能够帮助基础和能力不同的体育高职生根据自己的需要来确定学习目标,每次口语课堂活动
以"自我管理、自我教育、自我服务"为主要内容的高校学生"三自"管理模式,是高校学生管理的理念创新和实践尝试.推行"三自"管理模式,必须要以发挥大学生在学生管理中的主体性
从系统的角度研究计算机自动伴奏问题,构建并实现一个为电子乐器的演奏进行实时伴奏的系统.该系统主要由乐谱跟踪和实时伴奏两个核心模块构成.为了解决乐谱跟踪问题,提出基于扩充窗和重构匹配检测器的动态规划算法,依据该算法能够在实际演奏存在相当错误的情况下实现实际演奏音符在乐谱中的实时定位.为了改善实时伴奏的效果,给出根据乐谱跟踪的定位结果以小节为单位在线加入伴奏音的伴奏策略.实验结果表明,所开发的实时伴奏
根据物点坐标计算其对应的像点坐标即坐标反投影计算,是线阵推扫式影像处理的基础.由于线阵推扫式影像多中心成像的特点,必须通过迭代计算物点在成像时刻对应的扫描行,然后再