高维Turnstile型数据流聚类算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:beichen35
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有数据流聚类算法只能处理Time Series和Cash Register型数据流,并且应用于高维数据流时其精度不甚理想。提出针对高维Turnstile型数据流的子空间聚类算法HT-Stream,算法对数据空间进行网格划分,在线动态维护网格单元信息,采用倾斜时间窗口存储统计信息,根据用户指定时间跨度离线输出聚类结果。基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性。
其他文献
软件产品复杂度在软件度量领域是一个非常重要的方面.软件开发的成本、进度和潜伏的错误数量都与复杂度有密切的关联.由于OOA和OOD被广泛运用,面向对象的软件度量已成为面向对
在普适计算环境中,用户能够在任何时间、任何地点访问资源,获得服务。但是这种无处不在性和移动性的环境带来了新的安全问题。资源的拥有者和请求者一般互相不知道。认证是安全
随着应用的深入,计算系统对性能的要求越来越高。另一方面,软件规模也越来越大,使得日益庞大的软件与有限的硬件资源之间的矛盾逐渐显现出来。在嵌入式系统、移动计算以及实时控
由于模糊 C 均值聚类算法(FCM)存在两大缺陷:(1)对于非球形的数据聚类形式鲁棒性不够;(2)只考虑图像中的数值特征信息,而忽略了像素间的空间约束关系,因此 FCM 算法在对含有噪声的图像进行分割时缺乏足够的鲁棒性。针对以上问题,本文提出了一种结合 Markov 空域约束与基于核函数距离测度的加权模糊 C 均值聚类的快速鲁棒图像分割方法。为克服缺点(1),我们使用基于核函数的距离测度取代 FC
语义Web技术应用于上下文感知的智能移动服务,通过构建上下文信息本体,使得移动服务的实体之间可以进行上下文信息共享和语义互操作,并进行上下文信息推理,实现智能服务。本
面向服务的网格工作流的研究已成为网格领域的研究热点。由网格服务:组成的工作流(GSF)的调度问题是一个典型的NP问题,由于遗传算法具有并行性和全局解空间搜索的特点,非常适合解
本文以 S3C2410和 ARMLinux 操作系统下 Web 服务器为基础,研究了视频图片压缩及其传输的实现方法。采用离散余弦变换 JPC 图像编码,应用于图像传榆中以减小数据流量。实现了具有视频采集、软件图像压缩及网络传输的低成本模块,可以直接接入以太网,能满足工厂环境或一些实时性不高的监控应用需要。
分布式结构被广泛应用于核心路由器等大型系统中,以太网是分布式系统中各个子系统之间信息传递的良好平台。本文结合工程实践,提出了分布式系统内部以太网中MAC地址和IP地址一
支气管哮喘是一种常见的反复发作的慢性呼吸系统疾病,做好哮喘患儿的家庭护理,避免或减少发作,一但发作能得到及时治疗,对于患儿早日康复具有重要意义.
小儿颈部淋巴管瘤的传统治疗方法是手术切除,近年来有学者主张采用注射疗法[1,2]。我们从1982~1999年共收治小儿颈部淋巴管瘤患者97例,其中手术治疗89例,平阳霉素注射治疗8例,现报告