基于主动学习的数据清洗系统

来源 :软件工程 | 被引量 : 0次 | 上传用户:mllx03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ADC(Active learning based data cleaning system)运用主动学习的方法,在高效的清洗过程中,部分利用用户交互,提升模型清洗能力,提高数据质量。ADC包含学习模块和选择模块。在学习模块中,模块维护一个概率分类器,计算确定度(模型对修复结果的确定程度),利用确定度为数据修复做决策。在选择模块中,模块运行数据选择算法,选择最不确定、最有利于数据质量提升的数据交给用户清洗,再选择高分类贡献度的干净数据补充到训练集中,逐步提升模型的修复能力。系统演示表明,ADC系统只需要很
其他文献
在通常的意义上,外科是一种通过制造创伤来治疗疾病的手段,所以有手术创伤和身体对创伤的反应。创伤之后,身体动员一切内在贮备,此时,维持生存、愈合创伤作为一切生命活动的
期刊
我院于1998年~2005年采用超选择性灌注化疗加胃周血管离断术治疗不能根治切除的胃癌54例,在近期疗效及生存率方面均收到良好的效果,现报告如下。
随着信息技术的发展普及,电子商务也随之发展起来,新的商务模式的出现产生了更多的商业机会。O2O商业模式和移动电子商务的结合,将成为时代发展的必然趋势。本文主要从O2O模
先天性腹内疝临床少见,术前诊断困难。我们于1989年8月2005年8月共收治9例,现报告如下。
我院自1999~2004年间共收治腹壁韧带状纤维瘤共9例,并采用聚丙烯网片对切除后的腹壁缺损进行修补.现报告如下.
目的探讨十二指肠镜下行乳头球囊扩张术治疗胆总管残留结石的效果.方法对2002年6月~2004年6月用乳头球囊扩张术治疗12例胆总管残留结石的临床资料进行回顾性分析.结果8例胆囊
目的探讨肠系膜上静脉血栓形成(MVT)的诊断与治疗.方法回顾性分析我院2000年~2004年收治的32例MVT的临床资料.结果本组行手术治疗14例.其中,有2例行二次手术治疗.治愈29例,死
目的探讨手术治疗结肠造口狭窄的新方法并初步评价其效果.方法采用移行皮瓣成形术治疗10例结肠造口狭窄病人.结果10例病人均解除梗阻症状,造口恢复正常排便功能,随访1~2年无狭
随着我国经济的快速发展,企业的发展也越来越快。企业文化是整个企业最重要的灵魂和精神支柱,所以为了建立优秀的企业文化,就应当对企业的人力资源进行有效的管理。这样不仅
本文阐述了小学美术教学中分层教学的意义,并对实践中常见的一些问题进行了反思。在此基础上,对如何继承与实施分层教学提出了建议。