农产品产地污染综合知识挖掘系统的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:cj304465902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决产地污染数据综合利用问题,开展产地污染分析与评估,特立此课题进行研究。本课题的研究目标是:对农产品产地污染监测结果及相关空间数据进行知识挖掘,建立一个产地污染综合知识挖掘系统。该系统由四部分组成:数据清洗系统,非空间谓词挖掘系统、空间谓词的提取系统,空间-非空间关联规则挖掘系统。本文采用属性清洗和重复数据清洗技术完成产地污染数据清洗工作。针对属性清洗,文中提出了统计分析清洗方法、聚类清洗方法、基于模式的清洗方法、关联规则清洗方法;针对重复记录的清洗,运用了DBSCAN聚类方法提取相似重复记录集,然后采用蚁群算法进行合并和删除重复记录,创造了一种新的数据清洗方法。本文将产地土壤污染非空间谓词的提取分为两部分,一是非空间背景知识的提取,二是产地污染原子命题集的提取。首先,采用了关系演算方式,以关系(元组、属性)建立笛卡尔积的形式获取非空间背景知识;然后,建立了一种产地污染预测与评估和原子命题集提取的新方法,即:利用PCA主成分对污染数据降维,采用RBF网络对产地污染状况进行评估预测,最后运用SWM相似权值法抽取规则的形式,提取原子命题集。本文建立了空间谓词提取新方法,引进了空间对象分层挖掘概念,改进了原有的空间谓词九交矩阵提取方法,以粗糙集理论创建了粗糙九交矩阵,并利用CART决策树完成空间谓词的提取,最后建立约束规则,对空间谓词进行归并,使得生成的分层谓词空间既精简又不丢失信息量,为后续关联规则挖掘奠定了基础。本文引进了SPADA算法来挖掘空间-非空间关联规则。在非空间谓词集和空间谓词集的基础上建立空间观察集,在分层的基础上以θ代换方式开展层内搜索和层间搜索,从而建立空间-非空间关联规则。同时,还建立了模式约束和关联规则约束,从而提高了搜索和剪枝速度。最后,本文建立了一个综合知识挖掘系统的实例。以湖北大冶的产地污染监测数据为依据,对数据清洗算法、土壤污染非空间谓词提取算法、空间谓词提取算法以及空间-非空间关联规则挖掘等进行了验证。验证结果表明,该系统挖掘出的产地污染知识较好的反映了当地产地污染现状。
其他文献
空间数据仓库的查询性能严重限制了空间数据仓库的使用。本文以商业银行空间数据仓库系统为实际应用背景,根据空间数据仓库中空间数据和SOLAP查询的特点,针对空间数据仓库中
初中语文教材中,小说占据着重要地位。它能够起到丰富学生情感体验、完善学生人格修养等作用。本文将结合自身教学经验,从鉴赏环境描写、分析情节线索、揭示人物特征、挖掘思
通过对有关决策理论与实践的分析和研究,提出了决策过程的评估理论及评估的数学模型,设计了评估的指标体系和数据处理方法,并通过实例加以论证
文章通过查阅统计年鉴,结合实际就福建省乡镇卫生院的主要卫生资源现状尤其是卫生人才现状进行分析,并归纳出原因,最后提出解决福建省乡镇卫生院主要卫生资源缺乏的建议。
随着计算机科学与软件工程的飞速发展,人们越来越强烈的意识到形式化模型对软件系统的分析与设计的重要作用。在当今软件系统的设计与开发中,人们普遍运用多种建模方法和工具
DNA分子计算的工作原理是对生物系统进行编码,以生物化学反应为基础,利用生物技术实现生物系统的状态转移来实现计算过程。自从Adleman博士1994年成功地给出用DNA计算方法求
以影响地铁热环境的通风空调系统的主要设计输入参数为研究对象,采用一维数值模拟软件建立了非封闭全高站台门地铁车站与区间隧道的热环境基准模型,研究设计输入参数对热环境
工业园一直是我国地方经济增长的热点.自改革开放以来,工业园经过二十多年的发展已取得了显著成效,对加快我国工业化和城市化进程,促进技术创新和产业升级、推动区域经济的增
在市场经济条件下,行业协会作为典型的中介组织对于推动经济和社会的发展起着重要的作用.本文试图用经济学的方法,通过对企业、协会、政府选择行为的成本--收益比较分析行业
1、涂层作为控制腐蚀的手段的有效性控制腐蚀的第一步尝试依靠的是涂层材料的应用,理论依据是管道金属如果与周围土壤环境接触隔离,则不会发生腐蚀.这个概念是完全合理的和符