数据流环境下的基于加权网格的聚类算法研究

来源 :第二十四届中国数据库学术会议 | 被引量 : 0次 | 上传用户:lconan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于加权网格的动态边缘聚类挖掘算法,通过加权值将数据对象的非空间属性映射到数据空间中,根据网格的加权统计信息,将数据空间划分为非稠密非边缘区域、稠密区域和边缘区域,并利用边缘区域的各种特性高效地对聚类结果进行调整和维护,该算法可在需要时以不同的空间粒度离线输出高精度的聚类结果。
其他文献
寻找DNA序列中的重复片段是DNA序列挖掘中的一项重要的研究内容,它是基因分析的一个重要问题。通常的方法采用特定的索引结构如后缀树、后继数组等,算法效率有待提高.提出一种新的索引结构,并在此基础上提出了MSATR算法。MSATR算法可以适用于各种不同相似度定义的DNA重复片段的查找.分析和实验表明,MSATR算法时间和空间复杂度为O(n).实验结果表明,MSATR算法有较好的查找效率,并且MSAT
概率数据流是传统数据流的泛化与扩展.在传统的数据流中,每一项都是给定值域内的一个确定值,又被称为确定性数据流.而对于概率数据流,每一项都是一个随机变量,是定义在值域上的概率分布,因此被称为概率数据流.这种新型的数据流模型对于处理概率数据、不确定数据及模糊数据等有着十分重要的作用,在数据清洗、数据集成、多传感器网络等领域有着广泛的应用。首次给出了基于滑动窗口的概率数据流上的聚集查询算法,解决的聚集查
在数据流滑动窗口上挖掘闭合频繁项集是数据流挖掘研究领域的一个热点问题,现有的算法如Moment算法存在着使用空间过大的问题。提出了基于Moment的OP-Moment算法(OP指乐观裁剪策略),使用OP-CET数据结构维护滑动窗口上的闭合频繁项集信息.该算法使用乐观裁剪策略来裁剪大量的非频繁节点,并在每个频繁节点上增加一个属性以跟踪被乐观裁剪的非频繁子节点的最大支持度变化情况;算法使用位图来记录滑
在网络入侵检测中,大量的特征增加了算法在时间和空间上的消耗,其中不相关或冗余的特征还可能导致检测精度下降.针对这个问题,提出了一种面向网络入侵检测的特征选择方法。该方法基于粗糙集理论和遗传算法,从信息论角度定义特征的重要性,并将此度量作为启发式信息对遗传算法的初始群体进行优化,在提高算法收敛速度的同时取得了更优化的结果.在KDD CUP 99数据集上检验了方法的有效性,并使用SVM分类器对选择的特
数据清洗是保证数据仓库中数据质量的必要过程,其中对重复数据的识别是数据清洗的一个技术难点.目前这方面的研究大多都是以排重算法的效率为主,还没有提出一个通用的排重模型,同时以科学数据为排重对象的研究较少.提出了一种关系型数据仓库中多级级联表的通用科学数据排重模型.还采用了分区排序的方法保证了该排重模型的效率并进行了详细的性能测试.理论和实践证明该模型针对科学数据具有高效性、稳定性和通用性。
提出了基于内存数据库的join index结构实现what-if假设数据快速访问的方法,提出了what-if更新的规则和基于join index的what-if数据视图访问算法,并与典型的what-if假设数据合并算法进行类比性能测试.实验结果显示,基于join index的what-if数据视图访问算法具有很高的数据访问速度,与在可写复本上进行的数据访问的速度非常接近,而算法的空间代价仅仅是wh
随着无线传感器网络在国民经济各个领域中的广泛应用,无线传感器网络中的数据管理技术逐渐得到学者的重视.作为多目标决策和数据挖掘的重要手段,无线传感器网络中的轮廓查询逐渐成为研究热点之一.虽然轮廓体查询在数据库领域得到了深入的研究,但是由于传感器网络的特殊性质,已有算法都无法直接应用到无线传感器网络环境中.研究了无线传感器网络中的轮廓体查询,提出了基于扩展轮廓的轮廓体查询算法(SCAES),利用扩展轮
在Deep Web(深度网)中,只能通过查询接口获得大量信息,所以一个关键问题就是查询接口的集成.目的是构造一个设计良好的查询接口,以统一访问不同的相关资源。用户在全局查询接口中填写查找需求,所有的相关数据源的查询接口都将被自动填充和搜索.查询接口的集成包括2个方面:查询接口匹配和查询接口融合.在接口匹配过程中,采用聚类技术作为接口匹配技术,并通过引入领域本体的概念映射技术发现Web接口属性间的语
提出应用领域本体知识库自动填充Deep Web入口表单的方法。首先利用通用本体和自然语言处理技术构建领域本体知识库;然后应用DOM和一个启发式规则操作HTML文档提取表单标签,并且对表单标签和领域本体知识库属性进行标准化;最后,使用语义相似度寻找与表单标签相匹配的领域本体知识库属性,用属性的值填入表单控件,完成填充.应用领域本体知识库自动填充Deep Web入口,极大地提高了Web信息检索的精度.
本文提出一种基于Arnold变换的新的关系数据水印算法。该算法针对数值型关系数据进行操作,可以将一副水印图像置乱后嵌人到关系数据中去。通过借用图像置乱技术,结合人的视觉特征,保证了一定数量的连续水印信息提取丢失不会影响到原有水印图像内容的正确识别,有效提高了关系水印的鲁棒性。