论文部分内容阅读
随着互联网与物联网技术的发展,在农业领域积累了海量的产前、产中、产后数据,多种多样的农业信息服务系统层出不穷,但对于农业新型生产经营主体人员而言,当前我国农业信息服务成本和门槛仍较高,面向农民、农村的信息服务系统仍然相对匮乏,农业大数据与信息孤岛现象并存。农业信息服务往往针对特定地区、特定应用、特定数据资源,造成数据开发利用难度逐渐加大,因缺乏有效的分析提炼,数据资源向有用信息的转化效率过低,造成农业领域数据资源不断丰富与农业信息服务相对匮乏之间的矛盾。为此,本文研究农业物联网、互联网数据的汇集与抽取技术,实现农业数据智能感知;针对农业数据多源异构特点以及不同农业场景下的具体业务需求,研究农业数据智能分析挖掘方法,实现数据到信息的转变;通过建立用户兴趣模型研究用户聚类与个性化推荐算法,实现用户兴趣导向的个性化精准农业信息服务。项目研究内容对提高我国农业信息服务水平与质量,推动农业现代化进程具有重要的研究与现实意义。近年来,学术界在大数据分析与个性化推荐方面已取得较为丰富的成果,但在农业应用领域还存在数据来源不稳定、数据质量不高、信息挖掘决策精度低以及服务推送针对性不强等问题。为了更好的利用信息化技术手段为农民进行服务提升农业生产经营效率,本文将按照信息感知采集、挖掘分析、个性化推荐的流程,从农业物联网、互联网数据智能感知、面向农业多源异构数据的智能挖掘分析方法与典型场景应用以及基于用户兴趣模型的个性化信息推送几个层面对农业数据感知与智能分析关键技术展开深入研究与讨论。主要研究成果和贡献如下:(1)农业复杂干扰环境下物联网数据感知汇集过程存在质量不高、稳定性与时效性差等问题,本文研究提出了一种基于数据关联分析的农业物联网高效数据汇集方法。针对农业复杂环境下信道链接不稳定问题,采用机会传输路由的方式提高了数据传输可靠性与网络数据吞吐量。同时根据农业应用场景特点,重点考虑网络的带宽、能量等资源受限问题,从节点数据间关联分析与能耗感知角度对机会路由中继选择与协调的权值进行优化,实现了农业复杂环境下的物联网数据高效感知汇集。在互联网数据采集方面,针对互联网农业领域数据纷杂,信息提取环节缺失等问题,研究了农业垂直领域互联网信息智能抽取方法。通过农业Web页面的多种特征融合,结合机器学习的规则学习算法,提出一种基于多特征与自学习的Web信息抽取方法,该方法在尽量减少人工干预的情况下正确识别农业信息网页的正文内容部分,抽取需要的农业信息实体数据,并且能够自适应网页结构的变化。(2)随着农业领域物联网、互联网技术的飞速发展,积累形成了大量的农业数据资源,如何有效挖掘其中的有用信息是需要解决的问题。本文针对农业大数据多源、异构、噪声大等特点,研究数据预处理方法,通过清洗、过滤、集成等方法步骤处理提高大数据质量,保证数据的可用性。在数据预处理的基础上,提出一种基于频繁集的Apriori改进方法进行多维大数据间的关联规则分析,发掘农业海量异构数据中的规律和价值,为农业领域实现高效信息服务提供基础。针对农产品价格供需信息不对称,影响农业生产收入水平的问题,基于互联网上抽取的农产品市场价格信息,从农产品价格时空分布角度进行数据关联分析,发现敏感、异常的波动情况,并对某类农产品价格变化趋势以及受其他农产品价格波动的影响进行预测,进而为农业生产前期决策与经营销售提供信息支撑。(3)为解决动物繁育、疫病等早期检测问题,研究基于农业物联网的数据聚类与图像识别等方法,结合动物生理、疫病行为模型,以奶牛养殖为对象,提出一种基于图像熵的奶牛目标对象识别方法,通过最小包围盒面积计算与目标对象轮廓图,实时捕获奶牛爬跨行为。结合蹄部、背部特征,融合被识别奶牛连续7d的运动量,判断影响奶牛健康繁殖的异常行为,提高奶牛养殖管理的科学化程度。(4)农业大数据在完成了有效的数据挖掘分析后依然面临着“信息过载”的问题,农业信息种类多样,分类复杂,具有地域性、时效性和周期性,用户的信息需求也随这些发生变化,如何根据用户特征实现挖掘结果的精准推荐服务是农业智能信息服务的关键环节。为此,本文提出一种基于用户兴趣模型的个性化推荐方法,通过对用户注册信息得出显性特征(如职业、种植类型、文化水平、地理位置等),根据用户浏览操作记录提取用户隐性特征(如性格偏好、种植经验、农情农事等),进而建立情境融合的用户行为兴趣模型,并基于该模型用协同过滤的产生式推荐方法实现用户信息的按需精准推送。