基于JMP的神经网络设计实例分析

来源 :软件 | 被引量 : 0次 | 上传用户:machao4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘  要: 本文利用JMP对一个复杂多项式进行拟合,从实验设计产生样本数据、神经网络设计、训练样本技巧、到结果分析进行详细阐述。使读者能够使用JMP软件的神经网络分析工具,解决实际问题。
  关键词: 神经网络;JMP;实例分析
  中图分类号: TP389.1    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2019.05.050
  本文著录格式:雷祥,陈治湘,赵涛,等. 基于JMP的神经网络设计实例分析[J]. 软件,2019,40(5):257261
  【Abstract】: This paper uses JMP to fit a complex polynomial, and elaborates sample data, neural network design, training sample skills, and results analysis from experimental design. Enables readers to solve real-world problems using JMP software's neural network analysis tools.
  【Key words】: Neural network; JMP; Example analysis
  0  引言
  当前人工智能已经应用在很多领域,辅助人类解决了很多问题,神经网络作为人工智能的基础理论,近些年也得到飞速发展,也有了TensorFlow、Caffe、Chainer等机器学习框架,能够满足用户快速搭建应用。本文使用JMP软件提供的神经网络工具,对一个复杂多项式进行拟合,并对结果进行分析,便于提升大家对神经网络的直观认识[1,3]。JMP是全球最大的统计学软件公司SAS推出了一种交互式可视化统计发现软件,被誉为“卓越绩效的统计发现引擎”[4],其主要有三个特点,一是具有操作简便、交互性强、可视化效果好的特点,专业版中还集成了预测、聚类、质量与过程、可靠性与生存、消费者研究等分析工具,适合非统计专业背景的数据分析人员使用,二是JMP还有强大的实验设计功能,几乎涵盖了所有主流的实验设计工具。三是提供强大的二次开发功能,JMP可以作为一个服务器引擎,提供调用接口,实现用户个性化需求,为用户节省大量复杂设计和计算[7]。
  1  样本产生
  神经网络的样本数据是基础,为了能够进行直观喝准确的对比神经网络的学习效果,使用下述多项式产生样本数据,再利用神经网络进行学习训练。
  使用JMP进行可视化,得到图1,显示了 , 对应Z的效果。
  使用JMP的实验设计功能,对曲面进行抽样,为了计算快速,使用空间填充设计的快速灵活填充设计方法,输入需要的样本数量,即可均匀产生样本空间。
  对X、Y进行抽样后,产生实验点,然后使用多项式进行计算,得出对应的Z值,作为神经网络通过学习样本数据,拟合出模型。(注:使用该多项式,目的是为了产生准确的样本数据,神经网络中不需要这个多项式模型,预先也不知道该模型)。
  2  神经网络的设计
  神經网络本质是高维模型的拟合,也是一种回归思想,找一个模型来对多维数据进行拟合,但这个模型不是经典的线性模型、二次模型、或者指数模型等,而是一组矩阵参数,通过修改参数来使得样本值与实际值的误差最小,或者误差稳定[6,9,10]。在JMP中,设计神经网络结构主要是要设计隐层的数量和每一层的节点数量。理论上节点和层数越多,拟合效果越好,但是层数和节点越多,计算量越大,容易导致过拟合。JMP中提供了2个隐藏层、三种激活函数,可以根据具体情况进行选择和设计[8]。
  
  2.1  设计基本原则
  首先确定网络层数、然后确定节点个数。网络层次在大多数情况下,使用1个隐藏就够,不宜太多。节点个数一般从3个开始,不断增加,如果维度比较多,那么节点个数一般要大于维度,后面层次的节点个数不宜太多。这些原则并没有什么科学依据,都是同行的经验。
  然后是训练结果分析,通过观察测试误差,是否达到我们的精度要求来衡量神经网络的优劣,是否需要改进。训练结果中主要关注训练集和验证集的R平方这个指标, 被称为判定系数,是衡量拟合效果的重要参数。R平方的范围是[0,1],越趋近1,说明拟合效果越好,越趋近与0,效果越差。另外,还可以把预测值与实际值进行可视化比较,直观比较预测效果。最后,修正网络结构。通过多次训练,循环迭代修正网络结构,使得网络达到最稳定状态。
  2.2  设计案例
  为了对比各种设计的优劣,根据JMP提供的实验环境,下面进行三组实验。
  实验一:使用1000个样本数据进行学习训练结果,其中验证集是使用了其中20%的样本作为交叉验证,为便于对比,设定随机数种子。下面实验主要是验证各种激活函数的性能、以及节点数量对拟合效果的影响。PCA的计算中最主要的工作量是计算样本协方差矩阵(散布矩阵)的特征值和特征向量。
  为了便于对比,使用JMP的图形生成器,对上述表格进行叠加可视化,效果如图4。
  图4中我们可以看出,使用线性的激活函数效果最差,即使是节点数量增加,也没有明显提升,对于TanH和径向高斯两张激活函数无明显差异,径向高斯激活函数相对比较稳定,当节点数量增加到一定程度后,无明显差异。
  实验二:从实验一中 可以看出线性激活函数的拟合能力很差,不适合本实验样本,因此下属实验只使用其余两种激活函数。JMP提供了2个隐层设计,下面的实验中,增加一个隐藏层。利用上面的结论,可以通过计算小矩阵的特征值和特征向量,间接得到矩阵的特征值和特征向量,由于矩阵的维数远远小于矩阵的维数,所以利用这种做法可以大大减小传统PCA算法中的计算量,提高运算速度。   实验三:交换两个隐层节点的数量,观察对拟合度的影响。
  从表2、3中我们可以看出,R平方的值是随节点的数量增加而增加,但节点增加到一定数量后,R平方的值变化不大,因此在设计节点数量时,当R平方的值稳定到一定范围后,就没有必要再继续增加节点数量,因为节点数量增加,会导致后期学习训练的运算量成急剧增加。隐藏层节点的数量交换后,对结果影响不大。
  从图5中可以看出,在本实验中当R平方到达0.99后,基本趋于稳定。所以,我们确定网络层的节点第一层位5个,第二层为3个,网络结构如下图6。
  网络结构确定后,就可以使用神经网络的模型进行预测和分析。在JMP里面,训练结束后,点击模型左边的红色小三角,点击“发布预测公式”,在出来的对话框中,点击神经左边的红色小三角,点击“运行脚本”,选择数据对话框,预测出来的结果,就保存在当前现在的数据表后面几列,列名加上了“Predicted”前缀。
  
  3  神经网络结论分析
  有了预测数据和真是数据,可以使用JMP中提供的“叠加图”来进行可视化分析,右图中“+”符号表示预测结果,“O”表示实际结果,从图中可以看出,大部分点都比较吻合,说明预测效果良好。
  为了更加直观看到神经网络的预测效果,还可以用JMP提供的曲面图工具,对真实值和预测值进行可视化,观察二者的效果,如图9,作图为实际多项式的可视化效果,右图为通过神经网络学习后预测出来的效果。
  4  总结
  JMP中提供了丰富数据分析工具,其中的神经网络工具比较使用,用户可以不必了解神经网络内部复杂的计算和推导过程,只需要了解其工作原理,设计原则和评价标准即可。本文使用一个复杂二维多项式例子,神经网络的设计和使用进行详细的阐述,有助于大家理解和使用神经网络,为大家提供一种分析高维数据模型拟合的方法。
  
  参考文献
  [1] 赵宏, 郭萬鹏. 深度神经网络代价函数选择与性能评测研究[J]. 软件, 2018, 39(1): 14-20.
  [2] 许益通, 张冰雪, 赵逢禹. 基于学习风格的自适应学习内容推荐研究[J]. 软件, 2018, 39(4): 01-08.
  [3] 刘建伟, 刘媛, 罗雄麟. 深度学习研究进展[J]. 计算机应用研究, 2014, 31(7): 1921-1929.
  [4] jmp_jsl_guide pdf, JMP10. 0官方教程.
  [5] 百度百科[OL]. [2013. 10. 25]. http://baike.baidu.com/view/ 2239902.htm.
  [6] 鲁道夫J. 佛洛依德, 威廉姆J. 威尔逊, 平沙. 回归分析因变量统计模型[M]. 重庆: 重庆大学出版社, 2006, 62-64.
  [7] 雷祥, 江凌, 张少华等. JMP二次开发方法研究[J]. 软件, 2014(2): 48-49.
  [8] 上海财经大学统计与管理学院译, 探索性数据分析——基于JMP软件(引进版)[M]. 上海: 上海财经大学出版社, 2013-09-01, 49.
  [9] 张敏, 徐启华. 基于改进BP的神经网络模型参考自适应控制[J]. 软件, 2015, 36(7): 118-123.
  [10] 王宏涛, 孙剑伟. 基于BP神经网络和SVM 的分类方法研究[J]. 软件, 2015, 36(11): 96-99.
其他文献
摘 要: 随着计算机技术的高速发展,医学图像在现代医学中占有越來越重要的地位,医学图像处理技术是医学院校授课过程中必不可少的专业课。本文针对医学院校的《医学图像处理》实践教学进行了改革,学生设计了以SIMULINK为基础的医学图像仿真教学模型,改变了传统的讲授式的教学方法,增加了学生的学习兴趣及动手实践能力,更生动直观的辅助学生进行图像处理相关课程的学习,为广大一线教师提供一个新的教学思路。  关
期刊
摘 要: 现代无线通信技术推进了高频元件的相关发展,微纳技术的迅速发展和新型功能材料的出现以及压电薄膜制备技术的日益成熟使高性能频率控制器件的微型化成为可能。本文主要通过对FBAR的结构以及原理做介绍,设计出一款上下0.3 um厚的钼材料电极,1 um ALN压电薄膜和2.5 um的二氧化硅衬底的空气隙型薄膜体声波谐振器,采用MBVD模型对其进行理论推导,并在ADS软件下搭建电路仿真,得到S参数曲
期刊
摘 要: 在校大学生闲置物品冗杂,校内公益社团对闲置物品回收方式單一,仅停留在活动宣传及地毯式的走寝回收,对校内资源的浪费比较严重。同时在校园内缺少相对完善的公益信息平台,学生们难以获知更多公益资讯,导致校园公益社团时常有缺少志愿者,而志愿者又无法及时参与公益活动,所以“萤火闲置”平台应运而生。该平台主要包括:“我要捐”(求助)、“萤火互换”、“萤火公益”、“校园公益”等功能板块。  关键词: 网
期刊
摘 要: 基于规则信息的无人机图像建筑物提取,首先要对待处理图像进行图像分割,经过大量的实验确定分割阈值为0.3,通过定义规则信息,解决了建筑物纹理特征与光谱特征与道路、裸地相似的问题,同时,将原始图像的提取结果和与进行主成分分析(PCA)处理后的图像的提取结果进行对比,证明了PCA后的图像提取精度高达85%。  关键词: 无人机图像;阈值分割;规则信息;建筑物提取  中图分类号: TP753
期刊
摘 要: 随着电力资源的紧缺,以及光污染和雾霾天气的影响,更智能化的路灯设计对人们的日常生活意义重大。本文的智能路灯控制系统是基于单片机的控制器,通过介绍该系统相应的硬件设计和软件设计,实现定时开关和依具体情况是否需要来开关路灯和进行亮度调节,并且具有自检功能,该系统可以提高我国的路灯照明质量和提高利用率。  关键词: 单片机;智能路灯;环保节能  【Abstract】: With the sho
期刊
摘 要: 为了研究高墩大跨连续刚构桥的地震响应,该文以马过河特大桥为依托,以边中跨比为变量,以E1弹性时程作用下墩顶纵横向位移值、墩底纵横向剪力值以及弯矩值和E2弹塑性时程作用下墩底及墩顶纵横向最大塑性转角为目标,采用有限元分析软件Midas/Civil,运用动力时程分析方法,对结构进行多方位分析。结果表明:弹性阶段中,边中跨比的增加使墩顶纵桥向最大位移增大,其他目标函数值降低;弹塑性阶段中,边中
期刊
摘 要: 随着网络技术的发展,人们越来越重视个人隐私。I2P(Invisible Internet Project)是一种低时延的匿名通信系统,旨在保护用户通信免受法网监视和第三方(如ISP)的监视。它内部集成了诸多应用可供用户使用,比如email通信,IRC匿名聊天,网页浏览以及文件共享P2P下载等等。本文设计和完成了一个I2P节点数据分析系统IRAS(I2P RouterInfo Analyz
期刊
摘 要: 基于虚拟现实技术创设下的虚拟情景能够促进学习者的深度学习。在满足促进学习者在真实情景下临场沉浸探究、交互协作下形成个性化具身经验、深度转化下持续意义评价的原则下。构建出虚拟现实技术下深度学习环境的应用模式,以期促进新兴技术下深度学习环境的双向融合创新。  关键词: 虚拟现实技术;深度学习;交互沉浸;深度移情  中图分类号: G434 文献标识码: A DOI:10.3969/j.is
期刊
摘 要: 环境控制一直都是农业里面最重要的一部分,对于农业生产而言,温度和湿度对其有着决定性的作用,尤其是在农业生产方面。温湿度的监测在提高产品数量,节约资源和安全生产方面有着重要的作用。为了提升产品的数量和对原料利用的最大化,能够确保农产品有更加适宜的生存环境,准确的测量温湿度受到了各行业的重视。针对这一问题,本文设计了一个基于52单片机的农田温湿度监测系统。该系统以 AT89C52 单片机及其
期刊
导读:4月27日,清华大学建校108周年之际,由清华大学电子工程系主办的“清华大学108周年校庆AI高峰论坛暨AI使能平台发布”会议在清华大学罗姆楼隆重召开。  4月27日,清华大学建校108周年之际,由清华大学电子工程系主办的“清华大学108周年校庆AI高峰论坛暨AI使能平台发布”会议在清华大学罗姆楼隆重召开。本次论坛以“智能+,让AI更使能”为主题,向社会展示清华AI核心技术,发布清华大学AI
期刊