一种基于数据垂直划分的分布式密度聚类算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:Leechen17008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域的一项重要研究课题,对大数据集的聚类更以其数据量大、噪声数据多等而成为一个难点.针对数据垂直划分的情况,提出连通点集及局部噪声点集等概念.在分析局部噪声点集与全局噪声点集以及局部连通点集与全局连通点集关系的基础上,对全局噪声点进行有效过滤,进一步设计闭三角链表结构存储各个结点的聚类中间结果,提出了基于密度的分布式聚类算法DDBSCAN.理论分析和实验结果表明,算法可以有效解决垂直划分的大数据集聚类问题,算法是有效可行的.
其他文献
在高质量的无线通信网络中,带宽不稳定和用户移动性成为影响移动事务处理的主要因素,导致事务冲突率上升、吞吐量下降和峰值情况复杂等结果.一种新的并发控制方法ASGT能够:①具有
一个企业如同一个人,也是一个生命体。这个生命体运转的是否健康、高效,取决于从人到物内外各个要素的合理配置,以及各个系统、体系之间的协调配合。在多年的企业实践中,特别是近
信息化的社会,需要会学习的人才,需要有创新意识的人才,教育的目的是促进学生的终身全面发展.文章立足于中学地理教学实际,以新课标为指导思想,尝试构建出中学地理自主学习课
在3C 产品日益激增、功能日趋复杂之际,目前3C 市场中也出现了许多让人难以分辨的"双胞胎兄弟"。这些无论在外形或功能上都十分相像的机种,不仔细研究,真的会让人弄也弄不清!
2010年12月22日,江西省永新县沙市镇田背村接到重庆市酉阳土家族苗族自治县民政局发来唁电:贵处出生的百岁流失女红军陈富莲,21日下午4点,在酉阳自治县双泉乡马家坝家中不幸病逝,
图书馆读者宣传是一项长期性的工作。文章结合实际论述了读者宣传的意义、内容以及开展高校图书馆读者宣传的方式方法。
2010年12月16日至17日,由国防大学军队党史党建研究中心、中共江西省委学史研究室主办,吉安市委党史办、永丰县委、县政府承办的纪念中央苏区第一次反“围剿”胜利80周年学术研
源自美国的次债危机最终演变成为全球金融危机,对世界各经济体产生了不同程度的影响,在各国政府联手的一系列重拳出击下,世界经济逐步度过了“最坏的时期”,步入“后金融危机时期
通过对LSCSIMD体系结构的深入研究,提出了一种支持扩展配置存储器寻址空间的配置存储器组织结构(配置指令采用立即数寻址),该结构通过增加配置存储器容量,可以有效地降低配置延迟.
SHARP Digital Viewcam VL-NZ10这是由 SHARP 所推出的数码 DV 摄影机 VL-NZ10,它除了具备轻巧的体积与充满流行的造型之外,这还是一台搭载了各种最新性能的 DV 摄影机,在右