稳健的二维概率PCA与CCA算法

来源 :福建农林大学 | 被引量 : 0次 | 上传用户:ydaf4rx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,数字技术得到了迅速的发展,数据的规模也呈现出指数式增长。海量的数据催生了大数据时代,同时也带来了“维数灾难”。直接处理高维数据是费时费力,因此需要在高维数据中提取出有效的低维表示。主成分分析(PCA)是高维数据分析中最著名降维方法之一。但是,传统的PCA是一种面向一维数据的非概率特征提取方法,因此它难以处理二维数据,缺失数据,以及具有离群点的数据。双线性概率主成分分析(BPPCA)是一种通过矩阵变量的正态分布来构造双线性概率模型的方法。它可用于直接处理二维的数据,从而避免“维数灾难”。然而,实际应用中的数据往往是包含有离群点,并不总是服从正态分布的。为了减轻离群点对双线性概率模型的影响,本文基于误差项是满足矩阵变量t分布的假设,提出了一种稳健的二维概率PCA模型(RBPPCA),并结合交替期望条件最大化算法估计模型中的参数,从而实现二维数据的直接降维。基于人工生成数据,手写体数据库MNIST,以及Yale,YaleB等人脸数据库的数值例子说明了 RBPPCA算法在计算精度,重构性能,识别精度和离群点检测上的优势。PCA主要是面向一组变量数据的处理与分析方法,对于两组具有共同信息的观测变量,典型相关分析(CCA)是一种非常流行的降维方法,其目的是识别和量化两组变量之间的关联。CCA和PCA一样,发展了许多概率模型和二维模型等衍生模型。本文在RBPPCA基础上,提出了稳健的二维概率CCA(RBPCCA)算法。该算法通过假设两组观测变量由一组共同的潜在变量生成来使得变量投影后的相关性最大,并利用矩阵t分布来使算法在保留矩阵结构的基础上提高算法的稳健性。同样地,本文通过一些数值例子说明RBPCCA算法有效性。
其他文献
构建优质高效的服务业新体系,不是要撇开现行服务业体系另起炉灶,而是要推动其顺应高质量发展新要求;要注意面向建设现代化产业体系的需求,坚持习近平新时代中国特色社会主义思想的世界观和方法论。构建优质高效的服务业新体系需要突出重点,为此要创新提升服务业对推动高质量发展、实现高品质生活的引领支撑带动功能,引导服务业在推进高水平对外开放中有更大作为,推动现代服务业同先进制造业、现代农业深度融合,推动数字经济
期刊
随着温室气体排放量骤增,各国纷纷响应国际号召,加入节能减排队伍。泉州市作为福建GDP第一城,是经福建省人民政府批准确认的海峡西岸经济地区中心城市之一、国家现代化的工贸港口城市,在经济增速持续高走的情况下,使得泉州作为对象研究碳减排问题具有一定的代表性。本文针对泉州市低碳经济发展水平测度与评价展开研究,并结合国内外相关研究成果和最新进展情况进行分析。首先,运用通用的碳排放核算方法对福建九地市的碳排放
学位
<正>关键提示国有企业的转型升级对制造业与服务业的深度融合起到核心引领作用。国有企业在推进现代服务业同先进制造业深度融合、建设现代化产业体系进程中,应当发挥“稳定器”和“压舱石”的重要作用。从“优质高效”的要求出发,服务业新体系应包括智能服务管理系统、信息传导反馈系统、供需对接服务系统、统筹协同服务系统等四个子系统。对于国有企业来说,要发挥好引领作用更需在这四大系统下功夫。
期刊
随着互联网的快速发展,人们观影的途径变得更加多元化,其中在视频网站上进行观影已成为一种主流观影途径。这主要是因为视频网站可以为用户提供丰富的影片种类,让用户有更多的观影选择,从而满足了用户多元化的观影需求。但随着影片数量的不断增多,用户如何从海量的影片库中快捷、高效地挑选出喜爱的电影就成为了一大难题。现如今,这种无法依靠自身力量在海量的信息库中提取所需信息的现象被称为“信息过载”,为使“信息过载”
学位
国家在“十四五”规划和2035年远景目标纲要中阐述到“着力完善现代旅游业体系,加快旅游强国建设。”2022年,中国正在逐渐成为旅游强国,“旅游+”的时代即将到来。福建作为全国地区生产总值和工业利润排名前十的省级行政区,经济实力雄厚,现有旅游产业丰富的发展方向,如文旅产业等,无疑是为未来的旅游产业打下了坚实的基础。在新冠肺炎疫情的爆发后,全国旅游业面临着巨大挑战。在“后疫情时代”,对福建省旅游产业进
学位
党中央、国务院就加快推进生态文明建设提出设立统一规范的国家生态文明试验区,福建省是我国重要的生态文明建设试验区,深入了解其生态安全局部特征及长时间变化趋势,为凝聚改革合力、增添绿色发展动能、探索生态文明建设有效模式积累经验。本文以福建省为研究区域,以10km×10km网格为评价单元,2001—2019年地理空间数据为基础,构建基于土地景观结构、生态环境质量、生态系统动力、水热环境敏感性、人类活动压
学位
黄河流域是中国国家统筹发展和社会主义现代化建设中的重要战略区域,其经济发展和生态保护之间存在突出的矛盾,生态环境问题严重,经济高质量发展水平低。2019年9月,黄河流域生态保护和高质量发展被规划为重大国家战略,指明了黄河流域整体协同发展的大方向,推动形成黄河流域协调发展新格局。在此背景下,通过研究黄河流域生态保护和经济高质量发展耦合协调水平及其时空变化规律,为黄河流域生态保护和经济高质量协调发展提
学位
目的 通过观察并对比黄连、生地及二药配对含药血清对胰岛素抵抗(IR)3T3-L1脂肪细胞IL-6、IL-1β与TNF-α分泌量的情况,揭示生地、黄连与两者配伍对于IR的改善机制,对两药配伍原理加以明确。方法 运用高浓度葡萄糖(Glu)与高浓度胰岛素(INS)法培养构建INS抵抗3T3-L1脂肪细胞模型,分别给予黄连、生地、黄连-生地、盐酸罗格列酮进行干预,以葡萄糖氧化酶(GOD)法测定培养液内Gl
期刊
构建优质高效的服务业新体系已成为推动国内经济质量发展的共识。文章通过梳理关于服务业发展的支撑性理论如产业结构、内生增长模型和“鲍莫尔病”学说等,总结了服务业演进的一般法则,并结合国内外服务业发展经验,为服务业在产业融合、创新研发、信息化和服务贸易等四个方面的改革路径优化提供路线指南和政策建议。
期刊
<正>2021年,长三角三省一市共同发布了服务业高质量发展的宣言,产生较大影响。2022年,长三角三省一市又共同发布了服务业高质量发展行动计划,一张蓝图绘到底,把服务业高质量发展推向了一个新高潮。党的二十大报告提出,构建优质高效的服务业新体系,推动现代服务业同先进制造业、现代农业深度融合,
期刊