基于众包的不完整数据Skyline查询处理研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:meomeo38
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去十年间,针对不完整数据的查询处理研究受到广泛关注。现有方法往往致力于数据预处理,利用机器学习技术对缺失值进行填补。此类方法的查询质量受限于机器算力。在某些情况下,群体智慧可以很好地解决机器难以解决的问题。对此,我们希望借助众包来优化查询质量。本文研究针对不完整数据的Skyline查询处理问题,提出一个基于众包的Skyline查询框架,称之为BayesCrowd。该框架包含不完整数据建模阶段和众包阶段。在建模阶段,我们借助贝叶斯网络刻画数据相关性,利用c-table模型表示不完整数据对象,并提出高效建模算法。在众包阶段,我们通过众包计算对象间支配关系,从而得到Skyline查询结果。考虑到众包预算和众包延迟,BayesCrowd需要选择性地发布众包任务。因此,本文设计效用函数来衡量众包任务的效益,并提出了三种任务选择策略来满足不同用户需求。最后,我们在真实数据集以及合成数据集上进行大量的实验,从查询耗时、查询成本以及查询延迟的角度验证BayesCrowd的优越性。
其他文献
传染病模型中,行波解是否存在表明疾病是否会传播,行波解的有界性和渐近行为决定了疾病是否迅速爆发以及最终是否消灭.因此,研究传染病模型行波解的(不)存在性、有界性和渐近
近似最近邻搜索问题是数据库、数据挖掘、人工智能等领域中的一个基本问题。一个具有实际应用价值的近似最近邻搜索算法必须同时具有极高的搜索速度以及合理的内存用量。相比
小鹅瘟是由鹅细小病毒(Goose parvovirus,GPV)感染引起的鹅病毒血症及肠道栓塞的传染病。鹅细小病毒感染性克隆的构建是研究鹅细小病毒致病和复制机制的重要技术平台。经典核定
海洋渔业作为人类长期以来生存和发展的基础,对亿万民众的食物、营养和就业有着至关重要的作用。底拖网捕捞渔业具有主动性好、经济效益较高等优点,是海洋渔业中十分重要的作
松材线虫病是我国的重大森林病害。由于针对松材线虫本身的防治工作艰难,因此作为松材线虫的主要传播媒介一松墨天牛,已然成为控制松材线虫病的主要对象,而引诱剂的使用对松
近些年来,随着移动互联网的高速发展,无线网络和移动智能设备的广泛普及,基于Wi-Fi的室内定位技术逐渐被广泛采纳。然而,在当前基于Wi-Fi室内定位技术的研究中,依然面临着诸多挑战:离线阶段构建的位置指纹数据库依赖人工现场采集指纹数据导致部署成本过高,位置指纹数据库无法针对室内环境变化及时更新造成定位精度降低,指纹信号强度不稳定等。因而针对位置指纹数据库构建难、位置指纹数据库更新开销较大等问题,本
研究目的:血液循环的重建是治疗心肌梗死(myocardial infarction,MI)的有效方法。据报道,源自血管内皮生长因子(vascular endothelial growth factor,VEGF)的特异性血管生成
折线先张法是先张法的一种,采用在张拉台座上安装转向器,预应力筋张拉过程中通过转向器进行转向、定位、弯折、成形,形成与其受力形式相适应的布置预应力筋方式,其弯矩图与荷
目的:探讨过载机械应力是否通过激活髓核细胞的RhoA/ROCK2通路促使MRTF-A入核,进而增强CTGF和α-SMA的表达并导致髓核细胞外基质成分发生改变促进髓核细胞纤维化。方法:1.免
研究目的:血管重构是高血压病发生发展和靶器官损伤的关键病理学基础。血管平滑肌细胞(vascular smooth muscle cells,VSMC)异常增殖是血管重构的中心环节。血管紧张素II(Ang