基于多层核心集的函数型数据聚类及其在金融数据中的应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xiaopingchina99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,国家经济发展的脚步加快,互联网技术的进步已经推动人类进入了信息化时代。各行各业所产生的数据规模逐渐增大,数据结构也愈发复杂。面对海量具有不确定性的数据,从中挖掘有实际价值的信息,是当今研究的重点方向。人工智能、模式识别的出现提高了数据处理的效率。但是这些方法不具有普适性,依然难以处理复杂连续的数据,特别是金融领域的数据。改进传统的聚类分析方法并将其引入连续的数据处理,可能是突破这种问题的有效手段。区别于无序的数据,一种重要的数据类型是在一段连续的时间上,时间间隔不相同,包含多个过程的时间序列数据。传统数据处理方法不能发挥较好的作用,其实,加拿大学者James Ramsay(1982)率先提出函数型数据分析(Functional Data Analysis,简称为FDA)的相关理论。函数型数据分析是一种特殊的数据处理方式,它从动态随机的角度来考察数据,摆脱了传统分析方法的参数限制,能够高效把握数据的内在规律。本文首先对函数型数据处理方法即函数型数据分析进行介绍,其中包括函数型数据的概念,函数型数据分析目前的应用研究现状。然后介绍函数型数据分析所涉及的基本理论、统计学领域对函数型数据分析提供的理论支撑,为进一步的研究做准备,其中分析过程包括基函数展开、函数型主成分分析、典型相关分析。再次在分析对比众多传统聚类方法的基础上,改变函数型数据分析一贯采用K-means算法的思路,将多层核心集凝聚算法引入函数型数据分析,有效解决K-means算法聚类中心单一的缺陷,丰富了函数型数据聚类分析方法。最后采用金融领域的股市数据作为数据集进行实例证明。本文的主要工作一是寻找符合函数型数据连续性特征的基函数,通过基函数展开将数据进行曲线拟合,可以初步观察不同时间序列函数型数据的相似性;二是拓展多元统计理论,利用其将基函数展开产生的高维系数向量转换到低维空间上,避免了处理高维数据产生的一系列问题,也为后续的聚类分析提供方便;三是探索多层核心集凝聚算法的有效性,该算法创新的通过多层核心集动态表述聚类中心,与函数型数据分析动态随机的角度相契合;四是通过具体的金融数据例子来说明本文拓展的函数型数据聚类方法的实用性。
其他文献
随机优化算法是一种求解大规模数值优化问题的有效方法。随着大数据时代的到来,许多包含一阶信息或二阶信息的随机优化方法被相继提出。本文着重研究随机共轭梯度法及其改进形式,提出了三种不同格式的随机共轭梯度算法。首先,本文研究了Parvaneh提出的一种谱共轭梯度法,针对其中的修正割线方程仅利用到梯度信息,本文给出了一种同时包含梯度和函数值的新修正割线方程,更加充分的利用当前迭代点的信息。将改进的谱共轭梯
学位
离散能量方法是非线性微分方程数值分析的主要方法之一.但对向后差分方法(Backward difference formula,BDF),运用离散能量方法来建立稳定性和收敛性结果,是一项有挑战性的工作,相关文献比较少.同时,对于相场模型,离散能量耗散律的保持是长时间粗化过程模拟的实际需要.我们利用BDF公式的二次化分解来给出BDF2和BDF3离散下的离散能量耗散律.受线性问题离散正交卷积核(Disc
学位
本文主要研究在两个中心稀疏波的相互作用中,压差方程满足合理边界条件下的精确解.首先,我们利用速度图变换法将压差方程转化为时间变量t与空间变量x的线性二阶偏微分方程,即t方程与x方程.其次,根据在Riemann不变量坐标空间中两个中心稀疏波的性质,给出合理的边界曲线.再次,利用t-方程、x-方程特殊解的加权积分求出方程的精确解,并借助超几何函数、Appell函数证明所求t-解、x-解满足方程及边界曲
学位
由于在电子消费、数据存储和通信系统等领域中广泛应用,循环码已经成为编码理论中一个重要的研究课题.特别地,计算循环码的重量分布和最小汉明距离具有理论和应用价值.本文设p是一个素数而且p≥7,s为正整数,和q=ps,我们确定了长度为6的循环码在Fq上的重量分布和所有长度为6ps的重根循环码在Fq上的最小Hamming距离;而且我们找到了长度为6ps的所有极大距离可分码和所有几乎极大距离可分码.具体内容
学位
报纸
本文主要研究了三类非线性动力系统的分岔与混沌动力学行为.第二章研究了一类新三维混沌系统的稳定性和Hopf分岔等局部动力学行为.首先研究了该系统在平衡点处的稳定性,然后利用Hopf分岔定理和第一Lyapunov系数定理,得到了该系统出现Hopf分岔的参数条件和类型,最后用数值模拟验证了理论分析的结果.第三章研究了一类含有周期激励的干摩擦振子的混沌动力学行为.本章通过研究未扰动系统,计算得到系统的平衡
学位
登革热(Dengue fever,DF)是由登革热病毒(Dengue virus,DENV)引起的急性传染病,主要通过埃及伊蚊和白纹伊蚊传播.根据DENV抗原性不同将其分为4种不同血清型,人群感染不同血清型的DENV后临床表现差别较大.轻症登革热的主要临床表现为高热、肌肉痛、头痛和关节痛等,重症登革热的临床表现为登革休克综合征(DSS)或登革出血热(DHF).登革热主要流行区域是热带和亚热带地区.
学位
分数阶量子力学由分数阶薛定谔方程所描述,是量子力学的推广,可刻画更为广泛的量子现象.空间、时空分数阶薛定谔方程包含分数阶Riesz导数,而分数阶Riesz导数具有非局域性,因此给局部势场下分数阶薛定谔方程的求解带来了困难.本文考虑自由粒子在几类分数阶量子势场中的运动——无限壁势场、δ函数摄动下的无限壁势场以及δ势场,从Lévy路径积分出发给出相应的分数阶薛定谔方程的解.本文的主要工作包括:1.考虑
学位
双曲型偏微分方程在交通流中的应用一直受到数学家和交通工程师的广泛关注。AwRascle交通模型是双曲型偏微分方程在交通流中应用的经典模型之一。本文主要介绍两类耦合的Aw-Rascle交通流模型,一类是失去意识的耦合AR交通流模型,描述在连通道路上,司机在开车行驶过程中出现的暂时性走神现象。另一类是恢复意识的耦合AR交通流模型,描述司机进入暂时性走神状态后恢复意识的现象。针对这两类模型分别对其Rie
学位
本文利用含有两个自变量的拟线性双曲型偏微分方程在角状区域中具有特征边界的自由边值问题的相关结论,讨论了对于广义Chaplygin气体,等熵无旋的二维定常Euler方程组和非等熵的二维定常Euler方程组激波反射问题局部解的存在性.本文采用速度图方法与流函数方法来研究二维定常Euler方程组激波反射问题.我们首先推导了二维定常Euler方程组在(u,v)平面及(θ,p)平面上所满足的激波关系式.对于
学位