MapReduce框架下的不确定数据Top—k查询计算

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:z8566612
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Top-k查询是不确定性数据管理中普遍采用的一种技术.基于参数化排名函数的Top—k查询语义是近年来提出的各种查询语义的统一.文中针对海量不确定数据,提出一种基于MapReduce框架的Top-k计算的有效方法.通过分析基于参数化排名函数的不确定数据Top—k查询语义,设计一种获得未计算元组的排名函数值上界的算法,避免计算所有元组的排名函数值,解决Top—k计算中的剪枝问题.在MapReduce计算模型中提出两种不同的策略来实现该算法.文中针对单机环境和Hadoop分布式计算平台进行两组不同的对比实验.实
其他文献
【目的】探讨影响非肌层浸润性膀胱尿路上皮癌复发的相关因素及其处理对策。【方法】回顾性分析我院2003年1月到2008年12月161例非肌层浸润性膀胱尿路上皮癌患者临床随访资料
局部保持投影(LPP)通过构造近邻图来保持样本的局部结构,在构图过程中,LPP面临复杂的参数选择问题.为解决此问题,提出无参数局部保持投影(PLPP)算法.首先设计一种无参数的构图方法,能够动态地获取样本的近邻点并配置相应的边权.其次,利用该构图方法,PLPP通过寻求最佳投影矩阵,用于保持样本在低维空间的局部结构.由于PLPP在构图过程中并未设置任何参数且采用余弦距离设置边权,因此PLPP计算更加
为保证水平集图像分割算法的稳定性,传统水平集方法常采用重新初始化的方法或引入符号距离函数,但这两种方法存在计算量大或计算不稳定的问题.因此,提出一种基于改进符号距离函数的变分水平集图像分割算法.首先,改进已有的Double-Well型符号距离函数约束项,改进后的约束项可避免重新初始化、提高计算效率,同时也能更好地保证水平集函数演化过程的稳定.然后,利用基于全局灰度信息和局部灰度信息的活动轮廓模型构
【目的】探讨血管紧张素Ⅱ受体拮抗剂伊贝沙坦对糖尿病大鼠心脏的保护作用及其相关机制。【方法】将30只Wistar大鼠随机分为正常对照组、糖尿病组和伊贝沙坦组3组,每组10只。
在当前的电力系统关键通信网络的建设中,长跨距光通信技术起着十分重要的作用。本文将会对光纤通信系统衰减受限长度进行系统的介绍,针对当前存在的长跨距光通信技术进行介绍
不相关空间算法是一种基于广义Fisher准则求解不相关鉴别矢量集的快速算法,但该算法要求总体散度矩阵可逆.针对高维小样本的情况,文中提出求解不相关鉴别矢量集的改进方法.该方法的基本思路是在类间散度矩阵的值空间中运用广义Fisher极小准则求解鉴别矢量集,并讨论在该子空间中进行求解的合理性.针对高维情况下类间散度矩阵值空间的计算效率问题,提出首先利用PCA算法将数据降维,然后在低维空间中求解值空间的
本文简要地介绍了变频装置问题查找的思路和处理过的一些具体的实例..
【目的】研究清开灵注射液(QKL)对小鼠T细胞体外活化、增殖、细胞周期和迟发型超敏反应(DTH)的影响,探讨其免疫调节作用及机制。【方法】不同浓度的QKL作用于小鼠淋巴细胞4h后,加入
【目的】探讨过氧化氢酶(eatalase)对高糖诱导的NIT-1胰岛B细胞成对同源异形盒转录因子6(Pax6)基因表达下降的影响。【方法】体外培养NIT-1胰岛B细胞24h,分4个处理组:低糖组(NG),低糖+
【目的】探讨组织芯片中膀胱癌cyclinD1蛋白表达的临床病理学意义。【方法】应用组织芯片制作机制作膀胱移行细胞癌组织芯片,并用免疫组织化学方法检测组织芯片中膀胱癌cyclin