针对未知映射关系的多视图聚类算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:corbet2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采集途径的多样化孕育出多模态化的数据。将同类模态的数据特征划分为同一组则可形成多视图数据。近年来,针对多视图数据的聚类算法被相继提出,这些算法究其本质基本上认为跨视图样本之间的映射关系是完全已知,并将已知的映射关系作为算法模型的先验知识。在现实情况中,映射关系未知更为普遍,即无法确定分别来自两个视图的两个样本是否来自同一对象。现有的多视图聚类方法将不起作用或得到没有意义的分析结果。因此,本文针对映射关系未知问题进行研究,并从映射关系对现有的多视图聚类算法这一角度进行梳理。以多视图非负矩阵分解框架为基础,本文提出一种解决跨视图样本之间映射关系未知的多视图聚类算法。该算法认为各视图样本源于相同对象集,尽管跨视图下映射关系未知,但各个视图数据所形成的图结构应当一致。因此,所提算法首先根据样本近邻关系建立对应的图结构;然后通过图结构对齐建立跨视图样本的映射关系;最后利用捕获的映射关系指导各视图表示学习并得到最终聚类结果。为进一步提升模型性能,更好地挖掘真实映射关系,本文基于三因子非负矩阵分解提出了一种新颖的多视图聚类算法。该算法认为特征维度上的聚类结果与数据维度上的聚类结果存有紧密关联,利用特征聚类促进数据聚类。因此,所提算法将原始数据同时分解为特征系数矩阵和数据系数矩阵并重新定义了一种方案改进未知映射下各视图的表示学习。本文通过一系列的对比实验验证了两个算法的有效性,并分析了各个算法的性能与优劣。结果表明两个算法可以在映射关系未知情况下捕获真实映射关系并得到较好的聚类结果。对于非稀疏数据集,所提出的MVC-UM算法和Tri-MVC-UM算法的MACC@1分别高达84%和97%,此外相比0%比率下的部分映射多视图聚类算法,MVC-UM算法和Tri-MVC-UM算法的NMI指标分别提升了28.6%和30.4%,ACC指标分别提升了22%和27.4%。而对于高稀疏数据集,高稀疏性导致图结构不明显,因此所提出算法不能在各项指标上为最优,本文在实验部分进行详细的总结并在最后章节中给出了改进方向。
其他文献
随着C-V2X(Cellular-Vehicle-to-Everything)车联网技术的不断推进,基于C-V2X的网联车协作式场景的应用也在不断扩展中。针对未来车车协同环境下的辅助安全问题,论文研究设计了一种改进博弈论的网联车协同辅助驾驶模型,该模型主要用于提高协同车辆跟驰和换道驾驶行为的安全、效率等性能,将协同式驾驶过程划分为:决策预备阶段、协调阶段和执行实施阶段。论文的具体工作如下:1.首先
学位
近年来,深度学习技术迅速普及,并已在脑-机接口领域进行了大量尝试。尽管与一些传统算法相比,基于深度学习的运动想象脑-机接口系统的准确性已大大提高,但清楚地解释深度学习模型仍然是一个问题。此外,深度学习技术也并不总是能够应用于脑-机接口的每个方面,所以应该如何使用深度学习技术增强运动想象脑电信号的解码分类效果也是一个问题。为了解决这些问题,本文逐步深入地分析和验证了传统机器学习下的脑-机接口技术和深
学位
荷电状态作为动力锂电池重要的状态监测参数之一,具有衡量电池体续航时间、制定充放电策略、改进电池模组供能方案的重要作用。然而,在广温域、多工况的实际应用场景中,锂电池状态监测模型常常存在泛化性不佳与鲁棒性不强的问题。针对该问题,本文提出了一种基于连续可微映射的神经网络自动架构搜索算法,通过该算法获得的网络在多种应用场景下均具有良好的荷电状态估计表现,引入贝叶斯估计算法优化网络的超参数配置,进一步提升
学位
近年来,信息技术推动了仓储物流资源分配的发展与创新。传统的集中式物流资源管理模式已经无法适应电子商务带来的新商业模式,不能满足物流企业对交易安全的需求。区块链技术由于其分布式、不可篡改的特点,促进了供应链管理的信息高速流动、保障了数据安全,为构建智能化仓储物流资源分配方法提供了新的思路和解决方案。本文利用区块链和智能合约技术构建物流资源分配网络架构,根据博弈论理论在物流资源分配的研究应用方法,设计
学位
目的 探讨中老年T2DM患者中性粒细胞/淋巴细胞比值(NLR)与颈动脉粥样硬化(CAS)的相关性。方法 选取2018年12月至2020年12月于上海交通大学附属第六人民医院南院内分泌代谢科住院治疗的中老年T2DM患者478例。根据颈动脉内膜中层厚度(CIMT)分为CIMT<1.0 mm组(n=125)、1.0≤CIMT<1.5 mm组(n=117)及CIMT≥1.5 mm组(n=236)。比较各组
期刊
研制了一款工作在Ku波段的大功率GaN功率放大器,功率放大器采用4个栅宽为9.6 mm的GaN高电子迁移率晶体管(HEMT)进行功率合成,总栅宽为38.4 mm。以提取的小信号S参数和大信号负载牵引结果为依据,采用ADS仿真软件进行匹配电路仿真设计。该GaN功率放大器在14.5~15.0 GHz频率范围内的输出功率(Pout)大于200 W,功率增益(Gp)大于7 d B,最高功率附加效率(ηPA
期刊
深度神经网络技术发展迅速,在各个领域都取得了极好的使用效果,随之而来的也有一些安全问题,例如对抗样本就给深度学习系统带来了很大的安全隐患。对抗样本指通过对原始样本添加一些人不易察觉的小的扰动,却能导致深度神经网络模型分类错误的一类样本。经过多年的研究,对抗样本的应用场景越来越广泛,对抗样本存在的危害性越来越大。现有对抗样本评估研究,采用对抗攻击造成的准确率降低值来衡量攻击效果,侧重于模型方面。对抗
学位
随着互联网的不断革新,云计算技术和服务器的发展促进了网络功能虚拟化(Network Function Virtualization,NFV)的发展。虽然NFV技术解决了传统网络功能设备成本高、难以管理等缺点,但也带来了一定的挑战。在NFV的场景下,虚拟网络功能(Virtual Network Function,VNF)的资源需求随着流量的动态变化而变化,这就需要根据不同的情况为VNF分配相应的资源
学位
目的 分析分级诊疗制度下孕妇首诊选择的影响因素。方法 选取杭州市临安区2017—2021年就诊的14253例孕妇,采用问卷调查孕妇首诊选择情况及影响因素。结果 孕妇首诊选择时最看重医疗技术水平。单因素分析显示,孕妇首诊选择二级医疗机构中年龄≤35岁、大学本科及以上、新型农村合作医疗保险、未合并基础疾病、了解分级诊疗情况的占比大于三级医疗机构(p<0.05)。多因素分析显示,年龄、受教育程度、医保类
期刊
近年来,随着物联网(Internet of Things,Io T)技术的高速发展,人们对物联网服务的需求不断增长。物联网设备的部署越来越密集,保证高密集物联网中的可靠性传输成为当下研究热点。受限应用协议(Constrained Application Protocol,CoAP)是一种物联网中常用的应用层协议,运行于用户数据报协议(User Datagram Protocol,UDP)之上。由于
学位