基于神经网络的分类器设计及优化

被引量 : 19次 | 上传用户:cs19890126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是农业数据挖掘的一项重要任务,分类器设计是决定分类性能的关键因素。随着我国数字化农业的发展,农业呈现出多样化和区域化的趋势,导致农业数据具有高维、动态、非线性、非稳定性等特点,农业分类问题的复杂程度不断增加。尤其是在处理小规模和大规模农业数据集这两个特殊问题时,传统的方法所建立的模型不能全面、科学和本质的反应农业数据的复杂特性,造成了信息量的丢失和分类准确性的不足,严重制约着农业数据分类研究的发展和进步。因此,针对不同规模农业数据的特点,构造更高效合理、有针对性的分类器,实现对农业数据的准确分类,对农业数据挖掘研究具有积极地推动作用。本研究针对小规模和大规模农业数据的特点,在分析了传统方法经验与不足的基础上,提出基于神经网络分类器的设计与优化方法,重点解决农业数据分类中的三个关键问题数据预处理环节的变量筛选问题,小规模数据的分类问题,大规模数据的分类问题,提出将神经网络与群体智能算法、云计算相结合的方法,实现对不同规模农业数据集的分类,并通过对比实验验证了方法的正确性和有效性。本文研究的主要内容及取得的成果如下:(1)研究了基于MIV的神经网络变量筛选方法。通过计算数据集中每个属性对于神经网络分类准确度的平均贡献值MIV,选取数据集中对神经网络建模效果显著的属性作为网络的输入变量,达到变量筛选、冗余消除的效果,提高分类准确性。(2)针对样本数据量不足的情况,提出了小规模农业数据集的神经网络分类方法。研究将果蝇寻优算法与GRNN神经网络相结合,通过模拟果蝇的觅食行为,实现GRNN神经网络关键建模参数平滑因子的自适应确定,完成对GRNN神经网络的优化,达到提升小规模数据集分类准确度的目的。(3)针对大样本数据量的情况,提出了大规模农业数据集的神经网络分类方法。在对传统的BP-AdaBoost算法进行分析的基础上,结合云计算思想,给出了传统BP-AdaBoost算法的MapReduce并行化方法。将改进后的算法部署在Hadoop集群上,并通过三个对比实验,验证了该算法的可行性,它不仅能处理大规模数据集,而且降低了算法的时间复杂度,具有较好的加速比和准确性。(4)设计了面向农业数据的神经网络分类系统。在Matlab2012(a)平台下,编程实现了系统的主要功能,验证了本文所提出方法的正确性和有效性,取得了良好的效果。论文研究成果对于农业数据的分类理论和方法的深入研究,构造更精确、有效的农业数据分类器,对促进数字农业和精准农业发展,具有一定的研究价值和实际意义。
其他文献
目的回顾性分析儿童缺血性脑卒中病因、梗塞血管和部位分布特征以及不同因素对患儿神经功能缺损预后的影响。方法采用回顾性病历调查方法,检索武汉市儿童医院神经内科病例数
目的探寻45例小阴茎儿童类固醇生成因子-1(steroidogenic factor-1,SF1)的基因异常情况,进一步了解突变对阴茎分化、发育及性腺功能的影响。方法收集2011年10月至2013年2月就
党的十八届三中全会明确提出要推动公共图书馆等事业单位组建理事会。理事会是公共图书馆法人治理结构建设的核心要素。在概述深圳图书馆、温州图书馆等5家单位法人治理结构
随着数字化广播电视的发展和观众对广播电视节目的需求日益增长,播出频道的增加,录制节目的数量增大,使得媒体资产再利用也越来越频繁。同时,同时,一些媒体资料和素材具有时
本文主要从中小商业银行角度和视野,分析了目前中小商业银行在发展过程中,财务管理信息化建设存在的问题及中小商业银行财务管理信息化质量要求,同时提出大力推进中小商业银
从1990年11月26日以来我国上海证券交易所和深圳证券交易所先后成立,我国证券市场已经历23年的发展历程,在不断探索和完善中不断进步,市场规模迅速扩大,基础设施和规范程度逐步
缝洞型储层的孔隙度指数、饱和度等参数的计算一直是测井界亟需解决的问题,它直接关系到储层流体性质、储量规模等方面的评价,前人在这些方面已经进行了大量的研究工作,也取
开发和保护是风景名胜区永恒的主题。我国诸多风景名胜区入口建设在风格、形态等方面均能够考虑与周边环境相协调,但主体功能忽视、人性感知忽略、交通组织不当、程序化布置、
自上世纪80年代以来,随着中国经济迅猛发展,国内建筑设计实践呈现出跳跃式的变革,海外建筑设计的输入成为这场变革的重要力量。扎哈·哈迪德以中标广州大剧院项目而闻名中国,由此
对国内外高校图书馆面向教学开展嵌入式服务的实践经验、实证研究和典型案例进行文献和网站调研。在调研的基础上,围绕"面向教学嵌入式服务"这一主题,有机整合高校图书馆的服