函数型数据分析若干方法及应用

来源 :浙江工商大学 | 被引量 : 49次 | 上传用户:ttjjgogogo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多领域所收集到的样本观测数据在数据空间中会呈现出一种明显的函数型特征,更多表现形式为光滑的曲线或连续的函数。在对函数型数据进行分析时,将观测到的数据(函数)看作一个整体,而不是一串数字,这是函数型数据分析方法与传统统计分析方法的本质区别。函数型数据分析的目标和传统统计学分析的目标基本一致,即:选用对进一步分析有利的方法来描述数据;为突出不同特征而对数据进行展示;研究数据类型的重要来源和数据之间的变化;利用输入(自变量的信息)来解释输出(因变量)的变化情况;对两组或者更多的某种类型的变量数据进行比较分析等等。本文围绕上述目标,构建了一个比较完善、系统的函数型数据分析方法的理论框架。并在函数型数据分析方法的应用方面有所突破和拓展。主要从以下几个方面进行深入地研究。1、基函数的选择。基函数展开是将观测得到的离散数据点平滑法预处理的重要手段。我们比较了最常用的傅里叶基函数、Bernstein基函数、B-样条基函数的各自优缺点以及它们的适用范围。更重要的是,本文构造出另外一些基函数:非均匀有理B-样条基函数、三角基函数和混合Bezier类基函数。并且指出,非均匀有理B-样条基函数克服了常用基函数无法准确描述曲线剧烈波动程度的缺点。三角基函数,提供了一个更加广阔的思路。利用该基函数构造的函数型数据曲线在满足一、二阶连续性方面减弱了多项式曲线要求的条件。混合Bezier类基函数不但保留了多项式基函数、有理B-样条基函数的优点,而且使计算更加简单。由此生成的函数型数据曲线具有更大的灵活性,得到更优的结果。2、函数型数据曲线的光顺处理。惩罚函数法是传统的函数型数据曲线的光顺方法。除此之外,本文给出了能量光顺法的理论和方法。并在应用B-样条基函数的前提下,深入研究了局部能量最优光顺法、基于曲率均化的B-样条曲线能量光顺法、非均匀样条曲线光顺法以及分层能量光顺法。基于均匀节点的B-样条曲线所提出的局部最优光顺法对于局部修改具有重要的实践意义,而且结果表明,该方法计算快速有效。基于曲率均化的B-样条曲线能量光顺法,除了考虑数据曲线的应变能满足最小化的要求之外,加入对数据曲线的曲率要求。即对数据曲线施行曲率重新均化,这种均化的方法可以是基于累加弦长的,也可以是基于累加弧长的。考虑到在实际数据观测中,所获得的数据未必是均匀的或者等距的。因此,由非均匀节点生成的样条曲线看成是非均匀样条曲线。非均匀样条曲线光顺法就是针对这种情况提出的能量光顺法。分层能量法的基本思想是:首先,在一定误差范围内对原始曲线进行小波分解,目的是对曲线进行数据压缩和粗光顺,然后计算边界约束控制点,利用带约束条件的能量法对光顺后的曲线进行边界约束处理和细光顺。3、对数据曲线分析方法的研究。在完善了函数型数据的方差分析、典型相关分析之后,主要对函数型数据的主成分分析方法做出了比较全面的研究和实证分析。本文另外一个创新点在于首次推导出基于欧式距离聚类分析的一些结论,指出在使用Fourier基函数和正交基函数展开后,函数型数据曲线的聚类分析可以转化,即是对展开项的生成空间中的点做普通的聚类分析。这大大简化了计算,提高了计算速度。并将Pearson相似系数引入聚类分析之中。特别提出了加权分段聚类分析的概念,不但把握数据曲线簇简单局部形态特征而且提高了聚类质量。4、本文从三个角度研究了函数型数据分析方法的应用,这也是对应用领域的一个拓展和突破。首先,分析了汇改前后人民币汇率变动对国内物价的传递效应,将函数型数据分析方法应用到经济领域,并进行了实证分析,得出结论。其次,在基于函数型数据分析方法的笔迹甄别研究中,通过提取数据特征曲线,建立具有良好拟合性质的动态模型,得到了关于笔迹识别一些有用的结论。最后将函数型数据分析方法应用到猪肉价格指数的季节变动中,分析了猪肉价格指数较大波动区间和平稳区间。研究发现,猪肉价格指数的季节变动呈现循环变化的特征。并依据分析结果给出政策建议。本文的主要创新包括:1、首次将NURBS, Berstein引入到函数想数据分析方法中;2、首次构造了三角基函数、混合Bezier类函数并将其应用到函数型数据分析方法中;3、首次将能量光顺的思想引入到函数型数据分析方法中,并研究了几种能量光顺的具体实现方法;4、指出函数型数据聚类分析方法在正交基下可以通过降维得到实现,并首次提出加权分段聚类的思想;5、将函数型数据分析方法应用到经济领域,并进行了实证分析,得出结论。是对应用领域的一个拓展和突破。
其他文献
<正>2000年6月~2003年1月,我院采用内镜治疗老年胆石病患者500例,取得满意疗效。现报告如下。临床资料:本组500例患者中,男247例、女253例,年龄60~89岁、平均68岁。经B超、CT
在自动化立体仓库系统中,为了解决有线通讯成本高,布线复杂,组网不够灵活,堆垛机移动过程中拖动线缆容易断裂而造成信号无法进行通讯等问题。本文重点介绍利用赛远公司的SY-S
目的:构建表达人PD-1Δex3(ΔPD-1)基因的真核表达载体,检测其表达和生物学活性。方法:通过RT-PCR的方法获得人PD-1全长(PD-1)基因,设计特异性引物,PCR方法获得PD-1Δex3基因
<正> 《辛德勒名单》的电影招贴画上是两只紧紧地拉在一起的手,上面一只手强壮有力,下面的一只相对瘦弱,充满着渴望和感激。大致了解故事内容的人看到这幅冷色调的画,大约都
期刊
采用顶空固相微萃取法(HS-SPME)提取传统清香型同山高粱酒及其经发酵工艺改良后的酒样Ⅰ、酒样Ⅱ中的香气成分,结合气相色谱-质谱联用仪对香气成分进行分析。结果显示,除乙醇
董源的山水画无论是章法的安排还是对意境的营造,无论是笔墨的运用还是技法的施展,都有非常独到的见解和巧妙的安排,达到了一种深邃高渺之化有形为无形的精神境界。而在画面
目的:探讨直肠癌中雌激素受体α(ERα)、雌激素受体β(ERβ)、雄激素受体(AR)、孕激素受体(PR)的表达及其与临床病理特征的关系。方法:采用免疫组织化学Envi-sion二步法检测E
本文首先对自动化生产的含义进行了简单介绍;然后介绍了自动化生产的三个发展阶段;最后,分析了自动化生产对企业生产过程的有利影响,其中主要包括提高生产过程安全性、提高生
我院是国内最早成立日间手术中心的医院之一,通过逐步规范化的科学建设,我科始终维持患者平均住院日在24小时以内。这种模式也得到病人及医护人员的认同。但自从开展日间手术以
报纸
与共和国同龄的中国人民财产保险股份有限公司(简称人保财险),是由原中国人民保险公司(已变更为中国人保控股公司)发起设立的目前中国内地最大的非寿险公司。作为国内第一家