基于数据源分类可信性的真值发现方法研究

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:szgang052809
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的普及和电子商务的发展改变了人们信息获取以及消费的方式.Web已经成为大多数人获取信息的重要来源.与此同时,互联网信息质量问题也逐渐凸显.Web中存在大量过时、错误、虚假、片面的信息.其中,不同网站为相同对象提供冲突信息的问题尤为突出.如何从这些冲突信息中找到正确信息成为亟待解决的问题,这类问题又被称为真值发现问题.通过对现有真值发现问题解决方法的调研,发现现有方法均未考虑数据源分类可信性差异对真值发现的影响.因此,提出基于数据源分类可信性的真值发现问题.提出2种方法探测数据源分类可信性差异,并采用贝叶斯的方法迭代计算数据源分类可信性和属性值准确性.另外,通过考虑数据源覆盖率和对象难度对真值发现的影响,进一步提高真值发现算法的准确性.一个真实数据集的实验结果表明,所提方法可以显著提高真值发现的准确性.
其他文献
分析环型刀五坐标加工的残余高度误差和加工效率,提出一种高效的刀位轨迹的规划方法。
配电网抗灾变能力普遍较弱,一旦出现灾变,容易引发大范围的配电故障。文章对配电网的特点以及我国城乡防灾应急管理现状进行概要阐述,在借鉴日本、中国台湾配电网的防灾经验
目的探讨急救护理工作中定位分工抢救配合法的应用效果。方法 2013年9月至2014年9月该院急诊科从收治的患者中随机选择125例设为观察组,采用定位分工抢救配合法进行急救护理;
目的观察替格瑞洛对急性冠脉综合征行经皮冠状动脉介入术(PCI)患者外周血管内皮功能的影响。方法将2017年2月—2018年4月定州市人民医院收治的86例急性冠脉综合征患者随机分
给出了功率MOSFET的等效电路模型,详细分析了栅极驱动电路和功率输出负载对功率MOSFET开关速度的影响,并给出了实用的栅极驱动电路。
摘要:目的了解中职护生患病后的自我诊疗现状,分析探讨其原因及危害性,为规范中职护生的就医行为提供建议。方法采取整群随机抽样法,对伊犁州某卫生学校在校一、二年级护生进行自
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的分析中国期刊全文数据库(CNKI)近10年中医药治疗甲状腺术后甲减的组方规律,为临床治疗选方用药提供依据。方法筛选并收集CNKI中近10年治疗甲状腺术后甲减的方剂,建立数据
目的探讨通督调神针法联合多奈哌齐治疗脑卒中后轻度血管性认知障碍的临床疗效及对血清相关因子的影响。方法将辽阳市中心医院2018年2月—2019年2月收治的122例脑卒中后轻度
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技