【摘 要】
:
skyline查询是数据挖掘一个重要的研究方向,在基于数据的决策支持等应用中有着重要的作用.由于现实应用中存在着大量的不完整数据流,但大多数现有的skyline查询算法都依赖于如下的假设:1)任意数据点的所有维度值都是已知的;2)数据集是稳定、有界的并且可以随意访问.此外,随着数据维度的增加,skylime数据点的个数会变得过多,因此引入了k-支配skyline的概念,但是不完整数据的k-支配关系
【机 构】
:
中国科学院软件研究所 北京 100190 中国科学院研究生院 北京 100049 山东大学计算机科
【出 处】
:
NDBC2009第26届中国数据库学术会议
论文部分内容阅读
skyline查询是数据挖掘一个重要的研究方向,在基于数据的决策支持等应用中有着重要的作用.由于现实应用中存在着大量的不完整数据流,但大多数现有的skyline查询算法都依赖于如下的假设:1)任意数据点的所有维度值都是已知的;2)数据集是稳定、有界的并且可以随意访问.此外,随着数据维度的增加,skylime数据点的个数会变得过多,因此引入了k-支配skyline的概念,但是不完整数据的k-支配关系并不具有传递性,现有的skylime查询算法都无法适用.基于这些问题,考虑到数据流高维、无界、顺序性的特点,并且在某些维度上可能具有缺失值的特性,提出了一种新的基于滑动窗口的不完整数据流的k-支配skyline查询算法,实验结果表明,算法不仅可以支持不完整数据流上的k-支配skyline计算,并能够保证效率和性能.
其他文献
为了提高可信网络接入的灵活性,提出了一种基于等级划分的层次化可信网络框架,详细说明了可信属性的划分规则和可信等级的评估方法,着重指出了该框架在可信网络中的实际应用。另外,给出了在层次化可信网络中终端的接入过程。仿真实验表明,该框架在保证网络系统安全性和可信性的同时,能够增加终端接入网络的灵活性,并为各厂商可信网络设备的互联、互通和互操作提供支撑。
使用FPGA等硬件对片上网络进行验证,相对于使用行为级的验证更为快速和精确。然而,受限于硬件资源的有限性,很难在一个FPGA系统中部署计算资源来模拟真实的计算环境。采用软件模拟的方式评估所设计的片上网络系统,虽然便于实现且成本低廉,但是却不能反映数据在网络通路中传输时的真实情况且速度较慢。本文提出了一种新的验证片上网络的方法——利用软硬件协同的方式对片上互联网络进行验证。将整个基于片上网络的系统分
不确定数据查询技术在军事、金融、电信等领域中起到了越来越重要的作用。目前这一领域的研究主要是在集中式数据库或数据流上进行的。事实上不确定性数据在传感器网络,分布式Web Server及P2P系统等分布式系统中广泛存在。从这些系统中收集所有数据进行集中式查询将带来巨大的通信开销、时间延迟和存储代价。同时,由于不确定数据的特点,大多数集中式不确定查询算法在分布式环境下并不适用。本文给出一种分不确定数据
根据OLAP查询的特点和内存数据库的性能特征提出了由多个内存数据库组成的并行OLAP查询处理系统,将OLAP应用中的多维聚集查询分布到各个计算节点并行进行聚集计算并将聚集计算的结果进行合并输出.与其他并行处理方法相比,该算法充分利用OLAPDB结构中维表远小于事实表的特性,根据数据库中事实表的数据量和节点的数据处理能力进行水平数据库分片并根据聚集函数的可分布计算特性,提高查询处理的并行度,延迟并行
频繁项集挖掘是数据流挖掘中的一个热点问题.提出了一种新的数据流频繁闭项集挖掘算法MFCI-SW.首先设计了两个新的数据结构:频繁闭项集表FCIL和频繁闭合模式树MFCI—SW—Tree,在此基础上以滑动窗口中的基本窗口为更新单位,在每个基本窗口中提取出频繁闭项集的数据项,将其支持度F和窗口序列号K存到FCIL中;然后随着新基本窗口的到来,通过删除频繁闭项集表中K值最小的数据项和插入新数据项完成对F
对基于表面属性的三维模型检索进行研究,提出了基于面积颜色分布、基于球面颜色分布、基于颜色球面调和的三维模型检索方法以及基于表面属性的融合方法.通过对模型表面进行按面积均匀采样来获取其颜色分布信息后形成基于面积颜色分布的特征.通过对模型进行均匀球面采样获取颜色分布信息形成基于球面颜色分布的特征.通过首先将模型表面颜色信息按等经纬度球面采样映射为球面函数,然后对其进行球面调和变换形成颜色球面调和特征.
在分析层次工作流建模和工作流执行时互操作研究的基础上,设计了一个基于代理的邦联及子流调用框架,将层次化建模技术、流程互操作技术和异构数据模型映射和转换技术集成在一起,同时提供了异常处理和灾难恢复功能,真正从业务层次上解决了流程协作问题,并在TiPLM2.9上实现了该解决方案.流程实例之间通过代理进行交互,各个流程独立运行在自己的工作流引擎中,实现了松耦合和隔离性,增强了系统健壮性.
传统工作流系统在对任务节点进行资源分配时,只进行了组织、角色、人员的分配,而较少对不同任务节点上执行人间的潜在关系进行建模.根据企业的实际应用需求,将这种潜在的约束关系提取出来进行建模,并以规则的形式进行定义.最后采用强有力的推理工具——规则引擎——来完成对定义的规则冲突检测以及规则的实现.
深层网数据库的访问方式主要是通过查询接口,所以查询接口是外部访问深层网数据库的门户。为了能够同时访问同一领域多个Web数据库,需要对多个Web数据库的查询接口进行集成.因此,提出基于本体的深层网查询接口集成方法.首先构建领域核心本体,在模式匹配过程中,不断完善核心本体;然后,以本体作为媒介,在不同查询接口模式间建立属性映射关系,发现属性间的语义关联;最后,根据本体概念出现的频数生成集成接口.实验表
近年来,基于图形处理器的通用计算获得了广泛关注,并在多个领域取得了进展.内存OLAP减少了磁盘I/O,但基于单核或多核CPU的计算能力及cache miss成为新的性能瓶颈,从而无法保证好的效率.而图形处理器由于其众多核和高带宽能够很好地适应OLAP计算特性.通过图形处理器来加速任一cuboid的计算,从而提高整个内存OLAP系统的性能.提出了基于图形处理器的分块并行算法,并对算法进行了优化及讨论