大数据环境下面向知识服务的数据清洗研究

来源 :图书与情报 | 被引量 : 0次 | 上传用户:mkl119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据既丰富了知识的内涵,也增添了知识显式化的障碍。对大数据进行数据清洗是最终获取知识的有效途径。由大数据的特点对知识服务重新提出要求,不仅要提高数据的使用价值,更要使数据严密的关联,这些要求一方面通过数据清洗满足数据质量的提高,另一方面容忍非清洁数据实现知识服务效率与水平的同步提高。文章给出了数据清洗的基本框架模型及其局限,从而进一步提出非清洁数据的清洁度的机制。
其他文献
阅读是研究生积累知识和开展研究的重要手段,研究生的阅读行为与其研究能力存在着必然联系,阅读质量影响着研究生的培养质量。本文通过对研究生阅读行为及其影响因素的分析,
军事隐身目标的出现,给雷达带来了严峻的挑战。检测前跟踪算法是雷达微弱目标检测和航迹处理的一种有效方法。文中对雷达微弱目标检测前跟踪算法进行了综述,首先介绍了三维匹
UML即Unified Modeling Language是用于进行系统分析设计的模型语言,目前已经成为面向对象分析与设计的主流技术。但在UML应用模型中如何支持用户任务及表示层的用户界面元素
绩效考核是评估员工如何达到目标的过程。工作描述阐明了员工需要做什么,在大多数情况下,评估注重于数量、质量、开销、时间和其他与员工表现相关的事项,在当代社会,绩效考核
民间借贷中介机构是专业从事民间抵押贷款、民间投融资的中介机构。作为一种新兴的资金中介,在我国部分城市发展异常迅速。其业务主要是为借贷双方牵线搭桥,促成投融资双方借
文章对构建数据仓库中的数据清洗研究现状进行了论述。介绍了脏数据的类型与出现原因、数据清洗在国内外的研究现状、定义和对象,重点阐述了属性级异常数据和记录级异常数据
传统的青少年工作大多从国家的需求出发,以服务于整个社会秩序和利益为目标,实施对青少年的教化和控制行为。这种教化和控制行为忽视青少年个性的发展和实际的需求,形成上下
文章从信息产品网络营销的特点出发,分析了网络环境下信息产品消费的特性,提出了在这一特性下信息产品开展网络营销应采取策略,展望了信息产品网络营销的发展趋势。
本文在国家大力实施各项支农惠农政策,努力增加农户收入,多渠道转移农民就业的背景下展开对农户兼业问题的研究。本文主要以新疆北疆固定观察点阜康市农户为研究样本,从微观
合法性是政府理论中一个重要的内容 ,它是国家公民对政府权威的认同与遵从。合法性的高低决定着政府能否拥有权威及在什么样的范围内发挥权威的作用 ,由此又影响了政府管理的