基于张量非负分解的高效聚类

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hunterring1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CPSS(Cyber-Physical-Social Systems)中包含了丰富的异构网络,对异构网络进行聚类分析有助于发现网络中浅层的数据特征,采用张量统一表征异构网络有助于融合多源异构数据,而目前针对异构网络的聚类分析面临如下问题:现有算法无法实现对异构网络的不同类型对象的聚类、且无法充分利用异构网络的稀疏特性。为了有效利用异构网络中丰富的语义信息,对多种类型的对象实现聚类,论文首先介绍了张量表示异构网络的方法,该方法可以将不同的异构网络表征为张量,为了能够应对大规模网络的表示及减少存储,又介绍了张量的稀疏存储方式。之后从优化的角度建立聚类模型,建立带约束的张量非负分解和聚类模型的等价关系,并基于不同的更新策略提出了两种基于张量非负分解的聚类算法,两种算法都可以对各类型的对象实现聚类,在模拟数据和真实数据上对比两种算法的性能,实验表明基于LS距离的聚类算法比基于KL距离的聚类算法具有更好的聚类性能。为了解决基于张量非负分解的聚类算法采用随机初始化导致的迭代次数较多的问题,结合元路径的相关理论,提出了基于张量的相似度度量方法,然后给出基于用户引导的初始化算法,实验表明该初始化算法可以提供高效的初始解,并减少聚类算法的迭代次数。针对聚类任务的稀疏特性,将过渡矩阵的思想拓展至基于LS距离的聚类模型中,提出了基于稀疏控制的聚类算法,真实数据集上的实验表明该算法能通过参数有效的控制因子矩阵的稀疏程度。
其他文献
目前大量的恶意软件和良性软件都通过加壳来保护自己。有数据显示,从网上下载的恶意软件中,有58%都是加壳程序,这58%的加壳程序中又有35%使用了自定义壳,因此研究一种更好的自动化脱壳方法变得越来越有必要。本文设计并实现了PyREUnpacker,一种基于动态分析的PE(Portable Executable,可移植的可执行文件)文件自动化脱壳系统。通过将样本置于虚拟机中运行,PyREUnpacke
学位
随着物联网时代的来临,准确的手势识别技术已经成为人机交互领域中众多新兴应用的基石。现有的手势识别系统主要基于相机和可穿戴设备,它们分别受限于光照条件与用户的积极配合。近些年,许多研究已经提出了一些基于无线信道状态信息(Channel State Information,CSI)的手势识别系统,在无需与用户接触的情况下实现非视距的手势识别。但是这些方法容易受到环境变动的影响,应用于新环境时都需要繁琐
学位
随着计算机和遥感技术的不断发展,人们采集、存储遥感影像数据的能力得到了很大的提升,同时基于深度学习的目标检测任务也逐渐应用于遥感影像中。使用深度学习的方法训练检测器需要大量有标签数据驱动才能获得很好的检测效果,而现实中存在海量无标签数据,所以使用这些无标签数据来辅助优化检测器具有很大的研究意义。首先,本课题分析传统基于自训练的半监督学习方法理论,依据相似性聚簇原理假设,将EM算法思想应用于半监督学
学位
近年来,随着物联网技术的迅速发展,时间序列数据量出现了迸发式的增幅。股市行情的预测,天气变化的预测,金融分析,人口预测等等,都离不开海量时间序列数据的支持。索引与可视化成为分析这些时间序列数据的先决条件,但是时间序列数据实时产生,数据量动辄达到百万、千万甚至亿万级别,如何完成这样数据量的时间序列数据的存储、索引以及可视化充满了挑战。为了有效利用数据存储空间,时间序列数据存储采用分布式压缩存储结构,
学位
随着人们对室内定位服务的需求日益增加,如何为用户提供简单、高效、精确的室内定位服务成为研究热点。大部分相关研究的关注点在于单独的室内定位方法的研究,室内位置服务在实际应用中还需为用户提供地图显示、路径规划、定位、导航、楼层切换等配套服务。针对以上问题,以某大学办公实验楼为研究对象,以室内定位导航系统的功能设计与实现方案的选择为研究重点,实现了室内定位导航系统。在设计了室内地图数据结构的基础上,对办
学位
随着人工智能技术和物联网技术的发展,无人驾驶和车路协同技术得到了长足的发展。同时,可持续发展在社会进步中受到越来越多的关注,公共交通、步行、骑车等绿色出行方式受到鼓励,非机动车在道路上的行驶安全需要保障。基于深度学习的非机动车检测系统能够在道路的机动车流中检测到非机动车,通过车路协同系统同机动车共享检测结果,提高道路的安全性。目前的道路监控系统主要针对机动车,非机动车的数据量小且非机动车目标也较小
学位
钢铁产业是我国的重要基础产业,而带钢正是其中重要的中间材料,带钢加工过程中的表面缺陷检测技术始终是研究的热点。传统的计算机视觉结合深度学习的带钢表面缺陷分类方法,在监督学习下往往关注边缘检测算法和分类网络的改进。带钢表面缺陷分类任务存在着数据集样本量较少、样本标签标注困难的特点,限制着传统监督学习下分类模型的性能提升。半监督学习(Semi-supervised Learning,SSL)可以同时利
学位
这伴随通信技术的发展,移动设备的数量处于爆发式增长,5G技术作为时代性的革命技术,能提供更高的频谱利用效率和能效,相对于现有其他通信技术具有巨大的优势,设备到设备通信作为5G技术的关键技术,能够有效地提高蜂窝系统的通信效率和容量,但其中仍然存在激励机制、干扰协调、能源消耗等一系列问题。在本文中,提出了一个可持续的多用户协同下的D2D通信协作系统,分为单中继模型和多中继模型。此系统通过雾设备的中继行
学位
在互联网技术高度发达的今天,爆炸式增加的信息量促使了自动文本摘要技术的诞生,文本摘要技术能够帮助人们快速分析和理解文本信息。现实中描述同一事物的文档通常不止一篇,这些文档一般由不同作者在不同时间撰写,表达不同的主题信息。现有的多文档自动摘要旨在尽可能地概括源文档中的所有信息,主题信息的缺乏使得摘要的生成不够精准,与实际需求仍有较大差距。另外,现有的多文档自动摘要对文档间关系的把握也不够准确,导致生
学位
由于大数据时代数据量的日益膨胀,本地的计算与存储资源已无法满足人们的需求,越来越多的企业和用户选择云存储作为解决方案,与此同时云存储的隐私安全问题成为限制其发展的最大因素。将数据加密后上传可有效解决这一问题,但这样也降低了数据的可用性,难以对密文执行诸如关键字检索之类的常用操作。对称可搜索加密允许用户安全地将数据库外包到半可信的云服务器,并保留了对加密数据库进行关键字检索的功能。考虑到实际应用中增
学位