高维稀疏数据的降维方法与应用研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:j443191910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,人们开始接触越来越多的数据。特别是随着信息技术的发展,海量数据成为了科学研究中不可缺少的依据。这些海量数据在统计中通常被称为高维数据。一方面,维数的膨胀为数据的分析带来了很大的困难,这通常被人们称之为“维数灾难”。但另一方面,维数的增长又为数据的分析提供了更多的信息,也就是“维数福音”。   在实际应用中,我们遇到数据常常是高维数据,因此高维数据分析是人们一直关心的问题。当前,在高维数据的降维处理方面的研究已经取得了许多显著性的成果,也有许多研究在针对这些理论的实际应用方面进行了探讨。但是,在某种特定类型数据(如经济领域数据)中这些理论方法适用性和应用方法的研究还十分的不足。   图模型作为一种通过描述变量之间相互关系来进行分析的统计工具,在近年来受到了广泛的关注和研究。图模型已经被广泛应用于数据挖掘、模式识别、因果推断、人工智能等研究领域。基于图模型的降维主要有两种方法:一种是通过判断变量之间的边缘独立和条件独立关系来建立图的结构,另一种是通过潜在的图结构中蕴含的似然或者后验概率来进行结构的判断,进而通过图的结构来描述高维变量之间的相关关系,从而将高维数据集分解为若干独立或条件独立的子集。   本论文利用统计模拟的方法,探讨高维稀疏数据集中应用图模型进行降维的算法实现及其适用性和应用效果。这主要包括基于相互信息量与条件相互信息量的高维随机变量降维方法,以及图模型在高维时间序列上应用的拓展。同时,还将研究将图模型降维方法实际应用于GDP及R&D分类数据的分析。
其他文献
“学困生”是教育对象中的一个特殊群体.顾名思义,学习困难的学生,也称“学习失能”(learning disabilities)或“学习不良”.这一概念由美国学者柯克(S?Kirk)在20世纪60年代
期刊
单机排序问题是在一定的条件下,利用一个处理机,最优地完成一批给定的任务或作业.由于它在实际中最常见,并且是多机排序问题的基础,所以它一直是人们研究的热点.本文从以下三个
本刊讯清流县立足实际,经过论证、引种试种和高起点规划,最近开始动工建设猕猴桃产业园区,着力打造猕猴桃产业,有的放矢地调整果树品种结构。据悉,清流县猕猴桃产业园区规划
多贝西小波密度泛函方法在材料、物理、化学以及纳米科学等诸多领域有着广泛的应用背景。以多贝西小波作为基函数,通过自洽迭代求解Kohn-Sham密度泛函方程的方法是电子结构计算的先进方法。该方法利用了小波的局域性,使得各种边界条件下的网格划分呈现出高精度。基于多贝西小波形式的电子结构计算程序Big DFT能够同时满足许多应用对精度和局域性的要求,并且还可以利用MPI、Open MP、CUDA和Open
学位
物理学和工程学的许多问题都归结为求解Laplace方程.本文主要研究三维Laplace方程的Cauchy问题,该问题是不适定的,即定解条件的微小扰动会引起解的很大误差.而在实际应用中,
学位
高中阶段是学生体能发展和思维发展的重要阶段,在这一阶段形成的思想和习惯会逐渐定型并伴随学生一生,因此在高中紧张的文化课教学中,学校和教师也要同步关注学生的心理健康
本文讨论k-层软容量设施选址博弈,它是k-层软容量设施选址问题的变形.众所周知,设施选址问题是NP-难问题,做为设施选址问题的推广,k-层软容量设施选址问题也是NP-难问题.除非
学位
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊