多元光滑样条自适应回归模型及其应用

来源 :华北理工大学 | 被引量 : 17次 | 上传用户:b110701007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多元自适应回归样条(Multivariate Adaptive Regression Splines,MARS)是由美国的统计学家Jerome Friedman于1991年提出的一种数据分析方法。该方法以样条函数的张量积作为基函数,分为前向过程、后向剪枝过程与模型选取三个步骤。其优势在于能够处理数据量大、维度高的数据,而且计算快捷、模型精确。文章在一般回归分析理论和样条理论的基础上,系统地研究了MARS的建模过程,提出引入Bernstein基函数建模的思想,并针对冶金工业领域一类数据分析其成分优化问题,应用该方法进行建模和预测。在前向过程中,通过自适应的选取节点对数据进行分割,每选取一个节点就生成两个新的基函数,前向过程结束后生成一个过拟合的模型。后向剪枝过程中在保证模型准确度的前提下,删除过拟合模型中对模型贡献度小的基函数,最后选取一个最优的模型作为回归模型。研究过程中对采集的原始数据进行了消除负差、剔除异常数据、数据标准化等预处理工作,选取精华样本,分别建立了线性模型、非线性模型、神经网络模型等,并与MARS方法做比较。得到如下结论:由于模型的限制,线性回归模型精度较低,与实际经验不符;神经网络对部分元素的描述优于线性回归模型,但不能得出相应的显式表达式,同时线性回归与神经网络都未能考虑变量间的交互作用;MARS模型对问题的描述比较符合实际经验,同时能够反映元素间的交互作用,能够对两个变量做可视化处理,并能够给出显式表达式。论文以数据科学为背景,属于问题驱动的应用数学研究,不仅对多元自适应回归方法进行了理论探索,也为工业领域的数据分析与优化提供了理论依据。
其他文献
今年8月,湖南有色新田岭钨业有限公司(二矿段)被国土资源部评为“全国第一批矿产资源开发整合先进矿山”,成为湖南省唯一获此殊荣的矿山。
目的:探讨精准定位管理在日间病房输液管理中的应用效果。方法:选择100例日间长期输液患者,随机分为观察组和对照组,观察组应用定位管理进行流程优化,对照组执行原先输液流程
针对不同用水领域、不同用水主体的特点和节水潜力,建立一套明确、清晰、能精准评价节水效果的考核评价标准,是节水型社会建设从理念走向实际可操作的基础。文章在分析国内外
【正】 柳州市树脂砂轮厂是广西自治区唯一获机电部树脂砂轮生产许可证的专业厂家,所生产的树脂砂轮销售全国各地并远销越南。1992年4月由广西区机械厅组织有关专家对我厂生
本文通过阐述成都市危险废弃物处置中心拟选区的地质环境条件,利用模糊综合评判法对三个候选场址进行比较评判,甄选出最优的废弃物处置中心场址。
<正>宫颈癌女性群体常见的一种恶性肿瘤,该病在临床具有较高的发病率,同时发病年龄也越来越趋于年轻化[1]。而宫颈癌则是目前可以明确病因并防治的一种癌症,从宫颈癌前病变到
西方学者对马克思晚年笔记的“人类学笔记”称谓和人类学解读模式,是一种在国内外学界中影响巨大、逐渐占据主流地位的笔记称谓和解读模式。我们认为,这一称谓和模式是对马克
法国当代女作家德尔菲娜&#183;德&#183;维冈的小说《地下时光》自发表以来,深受读者的喜爱并获得多个奖项。作品展现了现代都市中两位普通职工的日常琐事,看似杂乱无序,逻辑
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
水准测量的外业数据要经过内业数据处理提高数据精度,好的水准平差函数模型将会更好地提高数据精度,提出结点水准网中结点的最或然值的快速平差计算方法。