基于低频关联的大型耕地质量数据库检错方法研究

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:bluebell228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
土地数据库的准确性,尤其是耕地质量数据库的准确性和规范性是进行耕地质量评价和土地退化评估的首要前提,耕地质量数据库的错误检查是保证这些耕地质量数据库准确性和规范性的关键环节。近年来耕地问题频生,土壤污染、水土流失、有机质含量下降、吃肥持肥能力下降等现象仍在大面积增长,长此以往必将严重影响人类的物质供给和生存发展。耕地质量评价作为耕地保护的基础和前提,其评价结果将直接影响国家和政府对耕地现状的判断和对耕地未来发展策略的决定,保障耕地质量评价和土地退化评估的科学性和有效性事关重大,所以耕地质量数据库的准确性和规范性也就显得尤为重要。但目前现有的耕地质量数据库的检错方法大都依赖于专家经验和知识积累,要么直接通过传统的人工方式检错,要么借助专家知识和经验从元数据、时空逻辑关系及地物特征等几个方面总结检测规则,据此开发专门的数据检查系统,以计算机自动/半自动的方式进行耕地数据库的质量检测,没有考虑从耕地质量数据库中数据项之间潜在的内在关系(关联关系)这一角度来进行错误检查。本文探索了一种利用数据库中存在的内在关系来进行耕地质量数据库错误检查的新思路。这个思路主要基于一个假设:数据库中的错误往往低频发生,并与数据库中的其他数据项一起以低频的关联关系的形式出现。因此,本文认为可以通过数据挖掘技术挖掘和分析数据库中数据项之间的关联关系来找到这些错误。基于这个思路,本文提出了一种新方法--基于低频关联的耕地质量数据库检错方法(简称LFDA,Low Frequency Data Associations),并利用广州市2015年度耕地质量等别更新评价指标数据库对LFDA方法的检错性能进行了充分的剖析和验证。研究结果表明:(1)LFDA方法可有效找到耕地质量数据库中的绝大多数错误,这对保证耕地质量数据库的准确性和规范性具有重要贡献。(2)与耕地领域现有的传统手工检错方法相比,LFDA方法可在同等条件下将数据检错的工作量减少90余倍,甚至更多,大幅提高了耕地质量数据库的检错效率。(3)LFDA方法可以针对不同的数据库迅速挖掘关联关系,无需预设规则,是以能灵活的应对不同的耕地数据库和日新月异的错误类型,现有的耕地质量数据库错误检查方法还不能做到这一点。结论:利用数据项之间内在的低频的关联关系来检测耕地质量数据库的这一思路是可行的,这项研究不仅为耕地质量数据库开辟了一个新的检错方式,还能高效便捷地找到耕地数据库中的错误记录。所以无论从数据科学的理论角度还是从提高耕地数据库的质量的实际应用角度,本研究都具有重要意义,值得在地学领域被广泛应用。
其他文献
大豆是我国重要的粮油作物,也是动物饲料的重要蛋白来源。磷作为构成生物体的必需营养元素之一,也是肥料三要素中重要的组成元素。土壤中有效磷含量低,会严重抑制作物生长。以往的研究结果表明根系分泌的苹果酸参与活化了土壤中的难溶性磷,促进了植物对磷的吸收利用。因此,深入解析苹果酸在大豆耐低磷胁迫过程中的生理与分子机制对培育磷高效的大豆品种有重要理论意义。本研究首先以28份大豆品种为材料,比较分析低磷胁迫下大
学位
佛手(Citrus medica var.sarcodactylis(Noot.)Swingle)为芸香科柑橘属植物,具有较高的药用、食用及观赏价值。目前,关于佛手的研究主要集中在佛手挥发油成分测定、药理作用及食品加工等方面,而对佛手的种质资源目前仍缺乏了解。因此,本研究对我国佛手主要产区的14个佛手居群进行形态变异分析。同时,采用SLAF-seq方法开发佛手的SNPs,并用其对15个佛手居群的遗
学位
本文主要研究了分数阶的Cahn-Hilliard方程和伪抛物方程等非线性方程解的性质,这些方程在模拟合金等二元材料的分离过程和流动的三级流体的数学模型等问题中有着广泛的应用.利用能量估计的方法,研究了这两个方程在不同初始条件下的弱解的存在性和唯一性.本文由六章组成:第一章,介绍了分数阶的Cahn-Hilliard方程和伪抛物方程等非线性方程的物理背景,回顾了一些已有工作,给出本文的结构安排以及一些
学位
香蕉是一种营养丰富的水果,也是世界上非常重要的粮食作物,具有重要的经济价值。近年越来越多研究表明,果胶裂解酶(Pectate lyase,PL)与果实成熟软化密切相关,进而影响果实采后的贮藏与保鲜。然而,目前对香蕉果胶裂解酶的具体功能及其调控机制知之甚少。为了筛选鉴定香蕉中可能与果实成熟密切相关的PL基因,进一步明确与成熟相关PL基因的具体功能和主要的上游调控因子。本研究首先系统分析了香蕉A基因组
学位
社会流动的固化不利于社会的稳定和可持续发展。改革开放以来,我国的贫富差距以及收入分配问题日益凸显,而对外开放作为一项重要的基本国策,不仅给我国带来了巨大的政治、经济和社会变迁,同样也对整个社会的收入分配和代际流动产生了深刻影响。且通过梳理以往相关文献发现,对外开放程度和代际收入流动存在相同变化趋势,因此,研究对外开放这一宏观的经济政策对微观层面的代际收入流动的影响具有重要的现实意义。本文从理论角度
学位
本文主要围绕解析函数空间上复合算子的相关成果展开研究,得出了两种Dirichlet空间中复合算子的可逆性与Fredholm性的充要条件,其一为复平面内一般域上的Dirichlet空间,其二为带测度权Dirichlet空间。全文主要由以下几部分构成:第一章,主要对复合算子的发展历程进行概述;第二章,简要介绍几种空间上复合算子的有关概念及结论;第三章,首先给出了一般域上Dirichlet空间的定义以及
学位
广陈皮(Citri Reticulatae Pericarpium Chachiensis)是特指产于广东江门市新会区的陈皮,其药材质量胜于其它产地,新会地区是广陈皮药材的道地产区。广陈皮化学成分复杂,活性物质丰富,且受环境影响极大。即使是同一味药材,因为不同产地气候和环境因素不同,蕴育出来的药材成分的组成和含量均有不同,从而造成药材质量和疗效有差异。为了探讨不同产地环境对广陈皮药材品种的影响,本
学位
随着我国城镇化加快,农村劳动力向城镇转移,非农就业人口逐渐增多,农户兼业化经营成为我国农业生产的新常态。农户兼业化经营会引起农村劳动力外移,进而造成农村务农劳动力数量不足,给粮食生产带来负面影响。然而,农户兼业化经营的收入效应又可以支撑农户在农业生产中投入更多的资金,农户可以利用非农收入购买种子、化肥等提高粮食产量,购买农机、农具等来弥补劳动力的不足。农户兼业是否会引起农业生产减产,目前还存在较大
学位
在代数图论中,确定不同图类中拓扑指数(图谱)的极值结论是被广泛研究的一个课题.通过对已有文献结论的比较,发现很多拓扑指数(图谱)的极值研究结果相同或类似.因此,用统一的方法研究拓扑指数(图谱)的极值结论是十分有意义的.本文利用优超定理,分别确定树,单圈图,双圈图中给定顶点数,悬挂点数,最大度,独立数,匹配数和控制数时若干拓扑指数的统一极值以及相应的统一极图.
学位
山梅花族(Philadelpheae)隶属于绣球花科(Hydrangeaceae),含6属,以山梅花属(Philadelphus L.)、溲疏属(Deutzia Thunb.)为核心类群,连同4个单种或寡种属,包括黄山梅属(Kirengeshoma Yatabe.)、木银莲属(Carpenteria Torr.)、沙黛梅属(Fendlerella(Greene)A.Heller.)和林黛梅属(Wh
学位