基于双图正则化概念分解的图像聚类算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:ggqllm555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科技快速发展的时代,人类获取数据的方式和途径多种多样,与此同时造成的问题也越来越多。海量数据造成的的存储空间的不足和运行时间的消耗给科学研究带来了严峻的挑战。如何提出一个降维算法使得数据在降维后的空间中尽量保留原始高维空间的特性是降维算法研究的重点也是难点。近年来盛行的非负矩阵分解(NMF)是一个具有强解释性的降维技术,被广泛应用于图像聚类领域。本文基于NMF的思想,挖掘数据分布的内部几何结构,提出两个NMF模型如下:提出的三图正则化概念分解(GTCF)算法,以概念分解(CF)为主体,结合了特征流形的正则化项、数据流形正则化项、自相似学习正则化项。GTCF算法同时考虑基向量和稀疏向量的特性,更好的刻画了数据空间的内在几何结构。CF作为主体加强了算法的稀疏性。在三个数据集上通过对比六种算法说明GTCF在聚类性能方面有好的提升作用。通过理论和实验说明了GTCF的收敛性。提出的双图全局和局部概念分解(DGLCF)算法,描述了数据空间复杂的内部全局和局部流形结构,且有助于对复杂的流形空间进行刻画。DGLCF将数据流形的全局和局部结构以及特征流形的几何结构引入概念分解(CF)。全局流形结构使模型更具判别力,而两个局部正则化项同时保留了数据和特征的内在几何结构。最后,分析了DGLCF的收敛性和迭代更新规则,通过在四个真实数据集中与六种聚类算法进行比较说明聚类性能的优势。
其他文献
碳达峰和碳中和的目标一经提出,相关的绿色理念即成为讨论的焦点。房地产企业一向对能源消耗较大,大量的碳排放也给环境产生沉重负担。在此背景下,房地产企业需进行绿色转型。然而较大的融资约束、高昂的建设成本等都制约着企业开发绿色建筑的动力。作为绿色金融体系中的一部分,绿色债券是使资金流向绿色环保项目的重要金融工具,也是引导房地产企业发展绿色建筑的关键途经。本文从文献研究和理论分析出发,梳理了绿色建筑、绿色
学位
如今全球经济一体化趋势不断增强,国家彼此之间的竞争压力越来越大。为了全面推进科技强国的贯彻落实,我国必须建立符合自身实际需求的科创企业和产业链。由于技术创新型企业所处行业风险较高、前期开发投入较大,需要足够的资本作为后备力量保障其不断发展壮大。因此不管是从国家战略发展还是现实需要来看,针对科创服务层面的不足,资本市场应该予以有效弥补。正基于此,习近平总书记于二零一八年十一月宣布在上海上交所成立科创
学位
经过多年发展,房地产行业已成为我国国民经济支柱行业。然而,房地产行业存在着以高杠杆扩大企业规模,获取市场份额。“借新偿旧”、“借短还长”运营成为部分房企运营常态。2020年8月,住建部与央行共同发布“三道红线”融资新规。自此拉开了此轮房地产强监管的序幕。在此背景下,大体量上市房企华夏幸福2021年初突然出现债务违约,违约金额高、影响大,具有典型性和代表性。本文以华夏幸福作为案例,运用文献研究法、案
学位
计算机断层扫描(Computed Tomography,CT)技术可以对胰腺器官的位置、形态和组织等信息清晰成像,是病灶准确定位、医生定量分析及提供解剖学结构研究的重要前提。通过计算机高效的影像处理能力,精准高效的从CT影像中分割胰腺器官,不仅可以辅助临床疾病诊断、更对肿瘤消融手术的制定有着十分重要的意义。本文通过分析临床医生认知CT影像胰腺器官的特点,从2D分割算法和3D分割算法两方面进行研究,
学位
在大数据时代,发现高维数据存在的潜在信息,去除冗余特征,获得有效的低维表示,变得极其重要。非负矩阵分解(NMF)将原始数据分解为基于部分表示的基矩阵和有效低维表示,具有非负性和强解释性等优点,被广泛应用于高光谱解混、聚类、人脸识别与分析等领域。基于对现有NMF算法的研究,判别式非负矩阵分解(DNMF)解决了同一标签映射为单个点的问题,可以获得更有效的低维表示。因此,本文基于DNMF提出两种改进算法
学位
随着境外监管政策趋严以及境内资本市场逐步完善,越来越多的红筹企业纷纷谋求境内上市,2018年以前,红筹企业想要在境内上市,大多选择先私有化退市(已在境外上市的红筹企业),后拆除红筹架构,把控制权转回国内并通过直接发行股票、分拆上市或借壳上市等方式在境内上市;直至2018年3月,国务院办公厅转发《证监会关于开展创新创业企业境内发行股票或存托凭证试点的若干意见》,该政策支持创新创业企业选择直接发行股票
学位
近年来,为了健全国有企业的中长期激励机制,国家出台了一系列支持和指导国有企业实施股权激励的政策文件,意在提升国有企业董事、高管和核心骨干成员的工作积极性,焕发国有企业的活力和创造力。在国家政策的指导下,近五年实施股权激励的国有上市公司数量形成持续增长的势头,公司数量快速实现了从2016年18家到2021年92家的突破。然而,尽管如此,相比于我国一千家以上的国有上市公司总数,实施股权激励的国有上市公
学位
从统计视角,神经网络技术可看作是一种统计模型估计手段,其已被成功用于解决非参数回归模型的估计问题.然而,部分线性模型的神经网络估计方法还未得到系统性的研究.且现有的基于传统神经网络的非参数回归模型估计方法存在可解释性差且同时概括复杂数据的全局趋势和局部变化的能力有限的问题,将其直接用于估计部分线性模型的整个回归函数并不是一个完美的方案.此外,虽然神经网络技术已得到广泛实际应用,但在理论层面其仍需进
学位
随着通信技术的不断升级,数字化转型的不断深入,经济社会产生的数据总量不断攀升,数据类型也日益丰富,高阶张量越来越频繁地出现在人们的视野中.在这样的时代背景下,数据压缩在统计研究领域受到广泛关注.在对国内外使用较多的数据压缩方法进行总结后,发现目前使用较多的数据压缩方法或是受限于模型的线性假设,或是不可显式表达,亦或是模型可解释性较弱.为了克服这些问题,本文在线性主成分分析方法的基础上,提出一种可显
学位
近年来对赌协议在国内逐渐推广运用,在蒙牛、雨润食品等业绩对赌成功案例的激励下,我国更多私募股权投资与企业渴望尝试这种期权合约,对赌协议的应用场景也逐渐展开。然而以发行上市为对赌标的的对赌合约却推进困难,受到监管机构的严格限制。究其原因,对赌协议中多数特殊权利条款都是为保障私募股权投资利益而设定,可能导致潜在风险,引起法律争议甚至侵害中小投资者利益。然而2020年7月一家名为四会富仕的企业却携带对赌
学位