一个基于领域知识的数据清洗框架

来源 :信息技术与信息化 | 被引量 : 0次 | 上传用户:qinzi9509
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在给数据挖掘这类应用准备数据的过程中,面临着一系列数据清洗问题,而成功的数据清洗往往需要领域知识的支持.本文设计了一个基于领域知识的数据清洗框架,它在领域专家的支持下,通过抽样数据获得清洗规则;专家系统引擎利用获得的知识,在整个数据集上进行清洗;它具有自学习能力,在清洗过程中不断的优化清洗规则;它的知识库易扩展,框架通用性较强.
其他文献
<正> 在一项对特异性类胡萝卜素如何预防特殊类型和阶段的结肠癌进行检查的研究中发现,黄体素(Lutein)具有最强的防癌作用。类胡萝卜素存在于许多蔬菜和水果中,研究人员在菠
新闻公关和信息披露之间的关系以及由此延伸出的客户和投资者的关系、公司利益与社会价值之间的关系是上市公司新闻公关经常面对的三对关系,且处理不好容易发生冲突.为维护上
为了探讨芽孢杆菌加寡聚酸碘对棉花黄萎病的防治效果,通过采用药剂拌种、喷雾、穴施和灌根不同施药方式进行防效试验。试验结果表明,以穴施的防治效果最佳,棉花移栽后60 d(初
随着社会的发展,电力系统得到进一步发展。电力系统中非常重要的部分是继电保护,其能够有效的确保系统的正常运行,因此也是越来越受到重视。电力系统和继电保护之间存在相互
近年来,对于有毒赤潮及其危害效应的研究越来越受到关注。有毒赤潮的危害不仅取决于赤潮的生物量,还受到藻细胞毒素含量的影响。对于能够形成有毒赤潮的甲藻,其生长和毒素产生受
目的:观察鞣花酸对S180,H22荷瘤小鼠肿瘤生长及微血管生成的影响,以及对血小板衍生因子B(PDGFB),转录激活因子-3(STAT3)及磷酸化STAT3(p-STAT3)基因和蛋白表达的影响,探讨其