基于自适应图的低秩张量多视角子空间聚类

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:matrix521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无监督学习是机器学习领域中热门的研究课题,而聚类是该领域的典型方法之一,其主要任务是在无标签的条件下将数据分为多种不同类别。在大数据的时代背景下,数据从原本的单一视角过渡到了多个视角进行特征表示,称之为多视角数据。前述研究表明,多视角聚类得益于数据表征的全面性,可以取得更加优异的数据挖掘性能。基于张量分解的多视角聚类方法将自表示数据重构成高阶张量,并基于先进的张量核范数挖掘出数据的高阶信息与相关信息。本文基于这个工作出发,考虑到其不足之处如缺乏对数据之间的空间关系探索,提出了自适应构图的低秩张量学习多视角模型,期望同时考虑数据的局部信息、高阶跨视角数据的相关性以及多视角数据特征,以获得更加鲁棒更加准确的自表示张量。此外,考虑到不同视角的特征在聚类工程中扮演的角色不同且重要程度不同,本文进而提出了一个自适应加权的模型,期望通过自加权的策略完成不同视角的置信度学习,从而获取更具有实际应用价值的模型。具体的方案如下:(1)为同时挖掘多视角数据的全局低秩性和局部相似性,本文提出自适应图正则化的低秩张量多视角子空间聚类模型。具体地,对重构张量先通过旋转操作再施加张量奇异值分解的张量核范数,该方式不仅具有可解释性,同时能够有效地挖掘高阶数据潜藏的交互信息;另外,针对子空间上的点能够很好的反映原始空间数据的特点,本文通过对子空间上的数据进行自适应构图,学习数据之间的局部信息。本文提出的方法可以有效地避免原始数据集上的噪声、污染等干扰因素,为子空间形成提供了有力的保障,挖掘了更全面、更有效的数据信息。(2)为甄别不同视角在聚类工作中的不同重要性,本文提出自适应加权的多视角子空间聚类模型。具体地,在前面工作中进一步引入自加权正则项,对每个视角的权重自动学习,充分考虑到不同视角不同的置信度;此外,对每个视角的自表示矩阵融合出共识的亲和矩阵,直接输入到谱聚类算法实现聚类。本文提出的自适应权重方法既考虑到数据高阶信息、局部信息,同时关注到了视角的差异性,为实际应用场景提供了良好的解决方案。(3)本文对所提算法设计了一系列的优化方法,并将提出的模型在六个广泛应用的真实数据集上进行实验,与典型的几种方法做了全面的对比。从实验结果证明本文所提方法于对比方法在各种聚类评估指标上都有更出色的表现。
其他文献
随着时代的发展,科技不断地进步,移动机器人已经成为当下社会生产、生活中重要的角色。移动机器人的同时定位与环境地图的创建(SLAM)是当下移动机器人技术研究的热点之一,也是实现移动机器人可以在环境中自主化、智能化移动并完成指定任务的关键技术。对于当下疫情防控使用移动机器人来帮助减轻医护人员的工作强度,降低感染风险的迫切需求,本论文针对医院隔离这种特殊场景改进SLAM算法并搭建了移动机器人实验平台,实
学位
太赫兹(Terahertz,THz)波由于具有带宽大、穿透性强、光子能量低的电磁特性,已成为当前物理学和生物学交叉领域的探究热点。超材料具有超常物理特性,可对太赫兹波的振幅和相位进行调谐,且对周围介电环境变化有灵敏反应。因此,结合太赫兹波谱和超材料传感技术可为物质进行定性、定量的检测提供崭新的途径。柠檬酸盐是由柠檬酸阴离子和金属阳离子结合形成的一类有机盐,由于其特殊的物理和化学性能,常用于食品添加
学位
氮化镓高电子迁移率晶体管(GaN High Electron Mobility Transistor,GaN HEMT)的关键结构是以GaN材料为基础和拥有更高禁带宽度的三元化合物Al GaN形成的异质结。该异质结构因极化效应从而能够在异质结面产生高密度和高迁移率的二维电子气,但是也正因为其高密度二维电子气的存在,导致其在工作时沟道处会积累大量的热,引起器件温度的急剧升高,影响器件的性能。传统的漂
学位
腿足结构给动物带来了极强的运动能力和对地形的适应能力,腿足结构的这些优势使得足式机器人在民用和军事领域具有巨大的应用前景。由于足式机器人是一种多输入多输出非线性的间歇欠驱动系统,所以足式机器人控制非常复杂,实现机器人的平衡与运动难度较大。针对足式机器人自主平衡和平稳运动十分困难的问题,本文在四足机器人步态策略、状态估计、支撑腿控制算法和摆动腿控制算法四个方面进行了设计与优化,实现了一种简洁高效的运
学位
随着工业需求和深度学习的飞速发展,自然场景管线文字识别检测的需求迅速增加.为实现工业上的管线上文本的整理与分类,需要从大量的管线文本上识别相关信息,并于实物进行匹配,减少人员在管理方面所花费的时间.本文开发了一套管线文本的检测与识别系统.以实现能够快速方便的匹配和分类信息处理.本文的主要工作如下:1.针对管线文本数据集缺乏问题,目前并没有特定的自然场景管线文本数据集用来提供训练和检测,因此本文收集
学位
薪酬体系管理是人力资源管理的重要课题,有效的薪酬体系管理,可以为企业挽留人才,并且激发好员工的巨大潜能,反之,则会增加人员流失率,进而降低企业发展所需的人力资源储备,最终阻碍企业的发展。在事业单位改制的背景下,如何使公司有限的工资总额发挥最大的作用,实现薪酬的降本增效,薪酬体系管理发挥着重要的作用。作为本文样本的S公司,是一家拥有700余人的研究所,主要从事电子类研究,随着市场竞争的激烈程度加深,
学位
金属材料目前已广泛应用于桥梁、铁路、风机叶片等大型基础设施中。由于大多数设施暴露于室外环境,不可避免地会产生金属疲劳,导致其承载能力和可靠性下降。结构健康监测则是对该类结构的破坏部位进行检测和监测的技术。为了满足传感器大规模安装、组网灵活以及良好的可拓展性等需求,无线检测得到了快速发展。本文结合科研项目课题,紧跟无损检测技术以及无线传感网络的发展需要,以超表面透射阵列波束调控特性为切入点,对提高无
学位
移动网络技术快速发展,5G因其能提供大带宽、低时延、广连接和高可靠的优质网络服务,而被广泛应用于众多垂直行业。其中,电力物联网(Power Internet of things,PIo T)是最为关键的典型应用之一,5G应用于PIo T场景可匹配典型业务并满足电力多样化需求。网络切片技术是5G在电力应用中的重要赋能技术,它可以把物理网络切分为几个逻辑独立、相互隔离和功能不同的虚拟子网,从而提供差异
学位
从2013年开始,中国的电子商务行业蓬勃发展,截止2020年底,国内网络购物市场的年销售额在社会总销售额的占比达到21.9%,高达10.8万亿元。在人们普遍认知中,综合类第三方电子商务平台是京东和阿里形成主导的寡头垄断局面,综合类电商平台一直未出现能够与两者匹敌的后来竞争者。创立于2015年9月的拼多多却在阿里京东统治的电商红海里异军突起,仅3年取得了令人瞩目的光辉成绩,并完成了在美国上市。尽管拼
学位
在互联网蓬勃发展的今天,线上广告、新闻、购物、娱乐等与人们的日常生活息息相关。但是,移动互联网产生海量信息,而人们浏览的信息量有限,如何在复杂多样的信息中挑选目标数据成为挑战。推荐系统通过引导人们购物、新闻浏览、娱乐成为了移动互联网的主流技术,提高推荐系统的精确性对解决人们的挑选困难成为重点关注的话题。为了提高系统点击率(CTR)预估的精确性,需要从庞大的用户历史行为记录中挖掘能指导模型预估点击率
学位