差别依赖验证的分布式算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:taodengjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据质量是大数据研究的重要领域之一。数据一致性是数据质量评估的关键度量指标,它基于数据依赖来表述数据应该遵循的质量准则。差别依赖可以描述数据间的差异性,除了相等,还可以在定义中引入大于、小于等序列关系,因而具有较强的表述能力。数据依赖验证的目的是在数据集中发现违反数据依赖的部分数据,是进一步数据质量工作的基础。利用分布式计算环境来处理差别依赖验证的问题,以应对大数据的需求。提出分布式的随机三角分布算法,可以正确而高效地完成差别依赖在数据集上的检测;基于差别依赖的性质和数据分布特征,提出排序三角分布算法,更
其他文献
本文主要对影响急诊护理服务质量的影响因素以及对策进行综述,急诊科护理服务质量主要受护士专业程度、医疗制度及强大的劳动程度影响,另外,护士心理也会对护理质量产生影响
通过对桥面防水混凝土铺装和桥面柔性防水涂层两种施工方法的介绍,提出了如何有效抵御路面水对桥梁结构的侵蚀损害,从而提高桥梁的耐久性、安全性。
以贵阳市为例,通过分析区域森林资源现状,指出贵阳市近年来森林资源建设成效和存在的森林资源总量不足、森林质量不高、结构不合理、利用率不高等问题,并对今后森林资源管理
以牛蒡、桑叶和灵芝组方,研究其水煎煮液降血糖作用。通过尾静脉注射四氧嘧啶诱导糖尿病小鼠模型。检测给药前后糖尿病小鼠血糖、肝糖原以及血清中TG、TCH、SOD和MDA含量的变
针对高压直流电源与传统-48V直流电源以及UPS系统进行比较,分析高压直流电源的具体优势体现,从节能环保、经济实用、安全规范等方面展开研究。
本文阐述了客车市场的大客户终端营销的内涵及其策略优化意义;从客车市场目标客户定位问题、销售渠道结构问题和客户关系管理问题等方面解析制约客车市场大客户终端营销效能
大会在审议2003年各国申报的世界遗产名单过程中,审议通过了我国云南的“三江并流”为遗产项目,其中大会全票通过北京明十三陵和南京明孝陵为“明清皇陵”的扩展项目。 大会
语言是人与人互通信息、用发音器官发出来的或系统的行为方式。也是人们在社会生活中广泛运用的交际工具,我省是一个多民族省份,护士在掌握全部护理知识的前提下,必须重视学习一
研究了粉末冶金法制备的SiC颗粒增强铝基复合材料薄板的常温及高温力学性能。结果表明 ,铝基复合材料薄板在常温下具有较高的强度 ,薄板性能基本呈各向同性 ,其断裂机制主要
地方志是全面记载某一时期某一地域的自然、社会、政治、经济、文化等方面的书籍文献。人参作为吉林省最重要的道地药材,在清政府取消人参封禁之后的清朝末年至新中国成立前