函数型数据建模的方法及其应用

来源 :山西大学 | 被引量 : 10次 | 上传用户:king943
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的迅猛发展催生了大量的函数型数据,该类数据广泛存在于经济、金融、生物信息、医学、气象学、人体运动学、语音识别等众多领域,函数型数据分析已经成为数据挖掘领域中的一个研究热点.传统的数据挖掘方法将函数型数据视为离散、有限的观测序列,忽视了函数型数据的连续性和高维性,限制了函数型数据的知识发现.针对传统数据挖掘方法处理函数型数据的局限性,基于函数型数据的基表示,探索了函数型数据在分类、聚类及回归问题中建模的理论与方法,并通过具体案例验证了建模方法的有效性.主要工作和创新点概括如下:(1)在函数型数据的表示问题中,探究了函数主成分表示的建模原理.运用变分理论建立了由数据驱动的函数主成分基满足的模型,为求解函数主成分基提供了方法;证明了函数主成分表示是基于均方误差准则的最优标准正交表示,为函数型数据的主成分表示提供了理论依据.(2)在函数型数据的分类问题中,探究了不同基表示的分类性能差异.证明了在标准正交表示下函数型数据的L2距离等价于基系数向量的欧氏距离,为函数型数据两阶段分类方法奠定了理论基础;基于两阶段分类方法,从分类性能视角分别给出了适合傅里叶基、小波基以及函数主成分基表示的函数型数据类型;同时,通过实验比较了函数型数据在非正交表示和正交表示两种表示下的分类性能差异.(3)在函数型数据的聚类问题中,探究了函数k-means聚类算法的类中心表示.证明了一个度量多维函数样例间相似性的测度是距离,该距离的构造考虑了函数样例的导数信息,也为构建函数k-means聚类算法奠定了基础;基于指定距离给出了函数k-means聚类算法的类中心表示,证明了该中心能保证类内距离平方和最小;真实数据上的实验验证了该函数k-means聚类算法的有效性.(4)在函数型数据的回归问题中,探究了用于处理混合数据的部分函数线性模型的建模方法.为提高模型的预测精度,借用了函数系数在Sololev-Hilbert空间的基表示,将半参模型转化为参数模型;同时为增加模型的稳健性,在惩罚最小二乘法中引入了更为宽松的惩罚策略,运用该惩罚最小二乘法对模型进行学习.人造数据和真实数据均验证了该方法的有效性.本文针对传统数据挖掘方法处理函数型数据的局限性,基于函数型数据的基表示策略,提供了函数型数据建模的理论与方法,研究结果在函数型数据挖掘领域具有一定的理论价值和实践意义.
其他文献
如何深化共青团社会实践育人活动,是对经济、社会发展对高校育人的客观要求,同时也是高校深化教育教学改革,培养高素质、全方位创新人才的必然需要。怎样使共青团社会实践活动更
程序设计类课程一直是高职学生在专业知识学习中难以跨越的障碍,传统教学方式得到的教学效果让教学双方都不满意。"翻转课堂"是强调以学生自主学习为主的教学模式,通过将翻转课
时政资源是思想政治学科课程资源的重要组成部分,其有效利用可以激发学生学习兴趣,提高教师综合素质,弥补教材不足,提高教学有效性。本文就时政资源的有效利用,从研究意义、
近年来我国房地产市场发展迅速,房价也一直居高不下,政府也一直在尝试各种措施来对房地产市场进行调控,但这些措施都没有在根本上解决问题,人民“住有所居”的民生目标一直得
依据可持续发展内涵,笔者设计了一个由三个子体系构成的可持续发展综合评价指标体系,并利用实际资料对江苏省近几年可持续发展状况进行了分析评价,为了克服GDP指标反映可持续思
本文将企业的创新能力分解为六个方面,即创新资源投入能力、创新管理能力、创新倾向、研究开发能力、制造能力和营销能力,并从公共采购、中小企业促进、风险资本三方面论述了
信息爆炸、互联互通的时代,深入研究大数据背景下民办高校招生工作的新变化与新思路,思考并探索如何有效利用大数据让民办高校招生工作用数据说话,用数据创新。本文提出了大
在当今的数据时代,网络安全治理体系建设是新时代最为凸显的理论和实践议题,对于实现数据集成、促进数据共享、保证数据质量、加强数据治理具有深远意义,本文通过深入分析新
荆永鸣是平庄作家的突出代表,他善于捕捉人物性格对人物形象的影响,在《较量》中通过谈生和钟志林不同形象的塑造,去勾画他们不同的内心世界,并以此为出发点进行研究。本文主
摘要随着新媒体的发展,大学生网络思想政治教育已越来越受到重视。针对目前网络思想政治教育的现状,分析了新媒体环境下大学生思想政治教育受到的挑战和面临的问题,提出了做好新