基于规则和数据学习的清洗模型研究

来源 :陕西教育学院学报 | 被引量 : 0次 | 上传用户:gqy2004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据质量在信息管理系统中具有重要意义。然而,由于用户拼写、录入、系统升级等原因导致各种数据质量问题的出现。数据清洗的目的就是检测出脏数据并修复它们。而当前的清洗工具缺乏灵活性和扩展性,基于此,本文提出了一个基于规则和数据学习的通用清洗模型。模型实现了动态规则学习和动态数据学习等关键技术。通过规则匹配和反馈学习过程实现了动态清洗规则最佳选择;通过字段学习和元表学习过程实现了动态数据的初始化。实验证明,应用该模型保证了动态数据的质量,提高了当前清洗工具的灵活性和扩展性。
其他文献
该文简介绍了《高校思想政治理论课教学艺术》一书的主内容,对该著作的主特色进行了点评,最后分享了该书带给读者的启示。
石河子大学绿洲社会经济与屯垦研究中心,是石河子大学与中国社会科学院边疆史地研究中心共同组建的兵团第一个人文社科重点研究基地。经过一年多的筹建,该研究中心于2011年4月1
近几年来,我国园林景观设计行业的发展水平不断提高,这一发展形势与社会的发展步伐相契合,在风景园林景观设计过程中相关的设计人员需要做好各项因素的配置与协调,进而使得风
2011年10月11日,由对外经济贸易大学和石河子大学共建的我国西部第一个边境贸易研究中心——中国(新疆)边境贸易研究中心在石河子大学成立。
麦克卢汉的"冷热"媒介观是学术界否定倾向较强烈的论点,但同时也是非常有影响力的观点.早在尼克松与肯尼迪角逐总统的大选时刻,麦克卢汉就运用这一理论对选举结果进行过惊人
大学生思想教育的实效性,受到社会大环境、家庭小环境和学校环境等外在因素的制约。上述三要素存在诸多负面因素,且相互之间存在不和谐的状况。努力探索增强大学思想教育的实效
晋文公重耳即位之后,有些诸侯小国却不愿臣服于他。原国虽小,可是得知始封之君是周文王的儿子,怎么甘愿承认从国外逃亡归来的重耳作为他们的霸主呢?于是不斷挑衅,制造事端。晋文公为平息动乱,完成霸业,决定讨伐原国。  战前,晋文公亲自部署作战方案,到士兵中作战前动员,他与士兵约定:“根据我们的军事力量和原国的战斗实力,我们能够速战速决。以七天为期,降服原国。”  战争的进程出乎意料。原国的将士在强大的晋国
期刊
<哈姆莱特>被公认为是莎士比亚的代表作,是西方戏剧史上的奇观,人们感兴趣的并不是<哈>剧故事本身,而是哈姆莱特对复仇行为的一再"延宕".对世界和人类本体深刻的虚无和绝望体
歌唱中的心理状态,直接影响着教学效果与舞台实践,本文对歌唱心理状态进行分析探讨,阐明了良好心理因素在歌唱和教学中的重要作用;并对如何消除紧张心理提出建议,注重理论与
针对传统交叉熵算法不能解决多目标优化问题,采用单目标交叉熵优化算法提出了改进多目标交叉熵优化(Multi-Objective Cross Entropy Optimization,MOCEO)算法.首先,采用个体