【摘 要】
:
针对多源异构大数据中传统真值发现算法可扩展性不足、增量真值发现效果差等问题,本文将Map-Reduce框架和贝叶斯真值发现模型相结合,提出了基于Map-Reduce的并行真值发现算法
【机 构】
:
黑龙江大学计算机科学与技术学院,哈尔滨工业大学计算机科学与技术系
【基金项目】
:
国家自然科学基金面上项目(81273649);黑龙江省自然科学基金面上项目(F201434)
论文部分内容阅读
针对多源异构大数据中传统真值发现算法可扩展性不足、增量真值发现效果差等问题,本文将Map-Reduce框架和贝叶斯真值发现模型相结合,提出了基于Map-Reduce的并行真值发现算法;在MPTF算法基础上,引入Incoop增量框架和基于投票机制的分类器集成策略,并优化了Map过程和Reduce过程,提出了一种高效的大数据增量真值发现算法;实验表明:该算法不仅提高了分类器的准确性,而且实现了新增数据源的真值发现。通过理论分析和实验对比证明,该算法具有高效性和广泛适用性,同时可以兼顾多种现实中的复杂情形。
其他文献
近年来,随着全球经济的发展,各国基础建设发展居增,自动扶梯作为公共设施已在各种建筑大量使用,同时对系统的安全性能要求也越来越高,基于此要求,自动扶梯新国标GB16899-2011
人体细胞中DNA损伤后会引起细胞一系列反应,主要包括损伤信号的传导、损伤与修复、诱导细胞死亡等。肝癌的发生正是由于这些诱因同时作用于损伤修复系统的某个环节,使DNA损伤
采用砂型铸造工艺试制材质为RTCr大型矩形阀板时,阀板产生了变形、冷隔等铸造缺陷。为解决上述缺陷,缩短试制时间和减少费用,采用了基于ANSYS数值分析及以蜡代替铁,以蛭石代
<正>运动时需要补水这是人人都知道的,但运动时如何补水也大有学问,补得不好就可能适得其反。在条件允许的情况下,补充运动饮料是运动补水的最佳选择。运动饮料一般都含有糖
<正> 腹胀是慢性重型肝炎常见的并发症。临床上常用胃复安、吗叮啉等药治疗,但疗效不显著。我们从1995年起使用大黄乌梅煎剂保留灌肠来治疗慢性重型肝炎患者的腹胀,取得了较
利用响应函数对MOS器件时间关联辐射响应几个物理过程的实验数据进行拟合计算,包括空穴输运引起的短期恢复、深层俘获空穴引起的长期恢复以及界面态的长期建立。详细分析了俘
目的探讨唾液酸酶法(仪器法)和Amsel法检测细菌性阴道病(BV)的敏感性、特异性和总符合率。方法采集2015年12月至2016年1月611例该院妇科门诊就诊的疑似BV患者。结果 611例患者采
<正>一、概念的引入,源于数学化的需要数学的基本概念一般都具有丰富的现实原型,用数学概念来描述与刻画这些现实原型,是源于数学化的需要,是数学发展的需求,也是人类认知的
目的探讨CT检查在结节性甲状腺肿(NG)及甲状腺癌(TC)鉴别诊断中的应用价值。方法随机选择2014年1月—2015年6月该院收治的45例甲状腺癌患者及45例结节性甲状腺肿患者,将其分别纳
随着社会的快速发展,我国园林工程建设也在快速发展。而随着人们对我国园林工程建设要求的提高,我国园林工程建设的压力也在不断加大,园林工程建设的发展问题也就成为了人们