【摘 要】
:
数据挖掘指的是从大量的数据中提取隐含的、事先未知的、并且潜在有用知识的技术。然而,在实际应用中各部门、各行业及各应用领域对于相同的数据概念可能有着不同的功能需求和
论文部分内容阅读
数据挖掘指的是从大量的数据中提取隐含的、事先未知的、并且潜在有用知识的技术。然而,在实际应用中各部门、各行业及各应用领域对于相同的数据概念可能有着不同的功能需求和描述,从而导致了数据的不一致性,影响了数据挖掘的质量及有效性。对数据进行规范化管理的数据标准化正是解决这一问题的有效方法,以数据元为基本单位的数据标准化通过对数据元及其属性的规范化处理,可以有效实现用户跨系统和跨环境的数据共享,为数据挖掘提供了一个通畅的数据环境。 本文以数据元为主要研究对象,剖析了数据标准化和数据挖掘的本质和流程,指出了二者的有机联系,从而提出了基于数据元表示的数据挖掘思路和技术框架。在此基础上以农业信息领域为例,对基于农业数据元表示的数据挖掘进行了详细的论述和实现。 本文的主要内容及结论: 第一,论述了数据挖掘的基本概念、本质及流程,对以数据元为基本单位的数据标准化本质进行了研究,详细分析了两者的联系,提出了基于数据元表示的数据挖掘技术框架。 第二,在对数据标准化充分研究的基础上,结合农业信息领域的特点,提出了农业数据元概念、农业数据元表示规范及基于XML schema农业数据元存储交换格式。为农业信息资源的跨系统跨环境使用提供了统一的信息表示形式、信息获取方法、信息分类编码方案、数据交换格式等一系列规范,为实现农业信息的正确表达及无误差传播,农业数据的交换与共享,集成处理与高效利用奠定了基础。 第三,在农业数据标准研究的基础上,提出了基于农业数据元表示的数据挖掘方法,并通过一个基于粗糙集理论的农业病害规则产生实例对该方法进行了验证,运用该方法推导出了具有较好质量、较好数量的规则,证明了基于农业数据元表示的数据挖掘是可行的,具有实际应用价值。
其他文献
矮塔斜拉桥由法国工程师Jacques Mathivat于1988年提出,命名为Extradose bridge。矮塔斜拉桥的特点为塔矮、梁刚、索集中,属于高次超静定结构,其力学行为取决于主梁、主塔、
国有资产管理体制是一个国家的经济体制的重要组成部分,因而国有资产管理体制必然受制于一个国家的国民经济体制状况,随着一个国家的国民经济体制的变革而变化。我国的国有资产
经济结构调整是实现经济增长方式从依赖要素投入的粗放型到依靠技术进步和效率提高的集约型转变的前提。产业结构的高度化是经济结构调整的一个主要目标。本文从理论上对产业
随着Internet的发展和网络应用的日益增多,网络安全问题逐渐成为人们不容忽视的一个问题,因而能很好解决网络安全问题的虚拟专用网(VPN,VirtualPrivate Network)安全网关也成为
为了提高我国鞋楦制造水平,增强产品市场竞争力,本文研究了鞋楦数控加工运动控制方法;对鞋楦机床的数控进给传动系统进行了优化设计和载荷匹配分析;分析了伺服控制系统的稳定
柴达木盆地北缘三台—红山地区中、新生界广泛分布,出露良好。在各露头剖面、钻井剖面地层学和岩石学研究所取得的各种定性及定量资料的基础上,采用单因素分析综合作图法,编
地理语言学选取少量的调查条目,对较多的地点进行语言调查。根据调查结果绘制语言地图,结合文献材料,对语言进行地理分类和历史比较,结合非语言因素解释语言地理分布和历史演变的
为了改善新产品开发的效率和质量,企业已将开发行为不仅仅局限于自己企业内部,而是延伸到企业外,充分利用企业外的资源,倾向与负责生产产品零部件或子系统的供应商合作开发新
资产证券化被誉为当今资本市场最具创造性的融资手段之一,但是由于我国经济环境、法律框架、信用基础、利益驱动(融资收益)等诸多因素的限制,资产证券化始终未能如期的在我国
随着现代工业的不断发展,对广泛应用于航空航天、汽车、叶轮机械等行业的各种自由曲面的质量要求不断提高,实现自由曲面的快速、精确测量已成为一个重要的研究课题。目前,主