论文部分内容阅读
数据驱动创新。当今社会,数据资源已成为与物质资源、能量资源、人力资源一样重要的战略资源,是一个国家数字主体和综合国力的体现。如何激发数据在各行各业中的活力,切实挖掘出大数据的潜在价值,是需要广大科研人员深入思考的问题。本论文围绕大数据技术在农业领域的应用进行相关研究,对于推动传统农业转型升级,助力大数据产业发展具有十分必要的现实意义和实用价值。一方面,我国农业面临农业资源短缺、农业污染加重,大市场与小生产对接困难,国内生产与国际市场不匹配等问题,迫切需要借助信息技术推动创新发展,加快农业现代化建设。另一方面,大数据发展必须与产业进行深度融合,否则大数据将是“无源之水,无本之木”,农业是高度复杂的生态系统,既是产生大量原始数据集合的源头,也是利用大数据进行处理分析、价值发现的重要领域。通过本论文实现以下目标:1)结合农业领域特征,对农业大数据进行界定,分析农业大数据处理流程,设计农业大数据总体框架、标准体系,对农业大数据发展的路径选择和技术路线进行思考;2)基于流程理论,研究大数据采集技术、管理技术、处理技术等在农业领域的应用,并结合具体实例进行探讨;3)提出关于农业大数据发展的相关见解,为进一步推动大数据技术农业应用提供参考和依据。本论文主要研究内容包括以下部分:1)梳理了大数据基本理论。大数据起源于现代科学研究,数据密集型科研又推动了科研创新,全球致力于科研信息化建设,推动数据科学发展;综述了大数据定义、特征等,分析了当前大数据重点研究的热点领域;2)深入研究了农业大数据的相关内容。对信息技术农业应用模式进行了介绍;从现代农业发展的角度,提出了农业大数据系统架构、标准体系;从信息技术与农业融合的角度提出了农业大数据的概念、内涵、特征及路径选择和激素路线;从数据流程理论,对农业大数据流程进行了阶段划分;根据农业产业链理论,对农业大数据进行阶段划分;3)系统研究了农业大数据采集的相关内容。对大数据的主要来源进行分类研究;对农业数据采集阶段进行划分;根据农业数据采集技术将农业大数据的获取划分为农业遥感数据、农业生产环境数据、生命信息数据、农产品市场数据以及农业网络数据等;利用Scrapy爬虫技术,设计并实现了一个农业网站数据自动抓取的软件脚本,实现了项目信息、会议信息等自动采集;4)系统研究了大数据管理与处理技术。介绍了NewSQL和NoSQL两大类数据库技术,梳理了当前主要的数据存储模型,利用Neo4j图数据库实现了中国农业科学院相关研究所数据、中国农业科学院院奖数据、中国农业科学院部分国际合作关系数据的可视化管理;介绍了批处理系统、流数据处理系统,利用Spark平台进行农技推广数据的切词处理。本文的创新之处在于:1)对农业大数据的若干问题进行系统思考和研究,提出农业大数据流程、体系架构、标准体系、标准体系、发展路径等,为农业大数据进一步发展提供思路和参考;2)对大数据相关技术进行系统研究,并结合具体实例对其在农业领域的应用进行了初步探索。