基于聚类直方图的数据流聚集查询算法

来源 :第18届全国信息存储技术学术会议 | 被引量 : 0次 | 上传用户:shaonvshashou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据流聚集查询有着应用广泛,在计算和存储资源不足条件下,必须考虑构建有效概要数据结构,获取近似聚集查询结果。针对不符合典型分布的电力通信光纤监测数据流,提出一种基于聚类的直方图构建方法,获取流数据分布的不规则子区间集合;当新到达流数据,实时更新直方图;通过控制桶内元组计数密度误差,动态维护直方图桶结构,以适应窗口内数据实际分布特征。给出基于聚类直方图的数据流滑动窗口聚集查询算法。分析了算法精度、桶数目和允许误差的关系。实验结果表明,该算法对数据流滑动窗口聚集查询是自适应和有效的。
其他文献
  目的:观察LokoHelp下肢机器人配合常规康复对脑梗塞偏瘫患者在FAC、Fagl-Meyer下肢运动功能、Berg、Barthel指数方面的治疗效果.方法:采用随机(1∶1)对照研究的方法,将2011
会议
  Web服务组合验证对增强服务安全、保证系统质量具有重要意义。为保障Web服务组合的正确运行,提出了一种形式化和在线检测结合的Web服务组合验证方法。在动态检测的实时数
  “流量本地化”技术是一种缓解传输压力的有效途径,其核心即在于解耦应用与数据存储。本文在缓解骨干网压力的“流量本地化思想”的基础之上,分析研究在网络边缘引入“通用
  Reactive oxygen species (ROS)/reactive nitrogen species (RNS) and ROS/RNS-mediated oxidative stress have well-established roles in many physiological and pa
会议
  服务资源提取是影响系统效率的重要因素。针对目前监控系统可控性、扩展性不足的问题,设计了一种能够进行大规模接入的分布式视频监控系统架构,提出了服务资源按类别先请求
  为解决数值模拟并行轨迹数据的输出与访问共性问题,本文实现了端到端的存储解决方案。提出了扩展的轨迹数据模型,支持复杂并行轨迹数据的表示与组织;提供直接易用的轨迹数据
  网络信息提取技术对于人们高速准确的从海量数据中提取所需要的信息变得非常重要,面临海量计算所带来的挑战,提出了基于MapReduce的网络信息提取方法,以淘宝网为数据源,提取
  命名实体关系抽取是信息抽取领域中的重要研究课题。本文采用基于特征向量的机器学习算法支持向量机(SVM)进行实体关系抽取实验。在现有的算法中,特征提取方法以基于关键
  抽道集是石油地震勘探数据处理过程中的一个重要的中间环节,是典型的I/O密集型应用,它在运行的过程中对I/O子系统产生了很大的压力。为了提高抽道集程序的执行效率,消除I/O
1.为什么要制定《国家安全法》?rn答:根据《国家安全法》第1条规定,为了维护国家安全,保卫人民民主专政的政权和中国特色社会主义制度,保护人民的根本利益,保障改革开放和社
期刊