基于张量和元学习的Transformer模型研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：fakeshushu

【摘要】

：

【作者】

：

王佳勉

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人机物三元空间智能融合成为时代发展的新浪潮,如何有效处理和利用由人机物之间频繁交互而产生的大量高阶高维数据,是促进人机物智能快速发展所面临的重大挑战。传统深度学习算法经过多年发展,在对象检测、目标跟踪等领域取得了巨大的成功,而随着其与人机物智能的深度结合,传统深度学习面临的问题愈加凸显:第一,其大都是在向量空间中对数据进行表征和处理,在对信息-物理-社会系统中产生的高阶高维数据建模时,会破坏数据的原有结构,造成信息损失;第二,其大都是仅依赖卷积神经网络处理数据,由于感受野大小的限制,难以获取长距离依赖信息;第三,其在小样本困境下容易出现过拟合且泛化不佳的问题。针对上述问题,主要完成了以下工作。首先,针对传统深度学习模型难以获取长距离依赖信息的问题,选择使用Transformer模型来处理数据,通过切片操作和位置编码来建立起具有长距离间隔的数据特征之间的依赖关系。同时,为了更好地保持原有数据的空间结构,进一步将Transformer模型从向量空间引入到张量空间,提出了基于张量运算的Transformer模型,实现从多维度对样本数据包含的信息进行学习。其次,针对传统深度学习模型在小样本困境下容易出现过拟合且泛化不佳的问题,在提出的张量Transformer模型的基础上,进一步将其与元学习模型相结合,提出了结合元学习的张量Transformer模型,以更好地处理小样本相关任务。最后,针对张量Transformer模型,在MNIST和CIFAR10数据集上完成相关实验,并和向量空间中的Transformer模型的表现进行对比分析,验证了张量Transformer模型的有效性。针对结合元学习的张量Transformer模型,在CIFAR-FS和mini Image Net数据集上完成相关实验,分别在5-way 1-shot和5-way 5-shot分类任务上与当下先进的方法进行对比和分析,验证了结合元学习的张量Transformer模型的有效性。

其他文献

面向多跳推理的自然语言与知识图谱融合方法研究

知识图谱（Knowledge Graph,KG）是以三元组为组织形式的多关系异构图,由于其有效的提供了对知识的管理、存储与挖掘的手段,被广泛的应用于推理研究中。多跳推理属于复杂推理的一种,其任务是通过给定实体与多跳关系路径推理出尾实体,在智能搜索与问答等领域有着重要的研究价值。然而现实应用中多以自然语言输入为主,难以直接建模自然语言问题中的关系语义以适应于多跳推理模型。此外,现实世界中知识图谱的规

学位

基于文本排序和双向自回归变换的文本自动摘要算法研究

技术旨在通过自动总结文本内容帮助人们快速了解文本的核心信息,在自然语言处理中有着广泛的应用。目前互联网中的文本信息已经远远超过人工总结摘要的极限,探索高效的自动摘要算法具有重要的学术价值和现实意义。文本排序（Text Rank）算法是抽取式摘要算法的代表。但该算法在计算句子重要性得分时未考虑文本特征对句子重要性影响,采取的句子间相似度计算方法可信度较低,且所生成的摘要存在冗余,因此提出基于语义的无

学位

基于计算优先级分配的响应时间分析方法效率改进研究

实时系统是指对任务完成时刻具有严格要求的操作系统。实时系统中任务所释放的每一个实例都需要以自身释放时刻为起始时刻,在相对截止期内完成执行。为了确保系统中的任务都能够满足实时性要求,在出现新任务时,系统会执行可调度性分析方法,检测新任务的可调度性,并以此确定是否为新任务提供服务。可调度性分析方法的执行效率对于实时系统的任务响应延迟和系统资源有效利用率具有直接影响。响应时间分析是一类经典的可调度性分析

学位

高场超导磁体无源匀场算法

为了使高场超导磁共振成像系统能高质量成像,主磁体的均匀度需要达到一定的指标。但在安装磁体的过程中即使严格遵照了设计方案,仍会受到环境、材料和结构等因素的影响,导致主磁体均匀度不满足成像要求。因此需要采用匀场方法来提高磁场均匀度。对无源匀场而言,提高磁场均匀度的方法是在磁体的内腔安装磁片,通过磁片产生的矫正磁场来抵消主磁体的不均匀磁场分量,这一过程需要借助无源匀场算法来设计贴片方案。无源匀场算法通常

学位

面向几何测量的公差计算系统设计与实现

全自动影像测量仪可以高效地解决工件测量问题,是高端制造业快速发展的基础条件。工业测量软件是全自动影像测量仪的软件部分,公差计算系统是工业测量软件的子系统,负责对软件中的元素进行各种公差计算,公差计算的结果用于判断生产的工件是否符合生产图纸标准。目前国内的测量软件主要针对平行平面上的元素进行公差计算,可以计算的公差类型少,计算误差大,通用性不强,并且这些软件没有使用脚本语言进行公差计算的功能,测量效

学位

小样本遥感影像目标检测算法研究

基于深度学习的遥感影像目标检测技术已在各类任务上得到了广泛应用,而由于环境、天气等因素的变化,实际工程任务中存在着域偏移现象;同时,由于现实世界固有的小样本问题,很难去收集到足够多的有标注数据,基于丰富标签的传统深度学习模型的精度大打折扣。针对小样本遥感影像的实际应用场景,从域自适应技术出发,提出了基于自训练的半监督域自适应学习算法。根据源域、目标域数据分布特点,针对性地设计了用于旋转目标的弱-强

学位

面向非独立同分布数据的联邦对比学习算法研究

联邦学习从客户端丰富且高度隐私敏感的训练数据中学习共享模型,数据模型在中心与客户端间传递并迭代训练,这导致常规的联邦学习必须面临客户端数据的非独立同分布（Not Independent and Identical Distributed,Non-IID）问题和安全性问题。联邦学习存在的另一个问题是对有标签数据的依赖性,但在实际应用过程中算法需要从无标签的用户数据中尽可能地挖掘信息。为了解决以上问题

学位

基于张量分解和张量神经网络的混合推荐算法

随着大数据时代的来临,应用服务中充斥着海量信息,使得用户难以从中有效的挖掘出所需的高质量信息。而推荐系统则可以有效的解决“信息超载”问题,依据用户的喜好,为其精准的推荐感兴趣的潜在商品信息。然而现有的推荐算法普遍存在以下两个问题:1)数据稀疏问题;2)没有利用辅助侧信息且未对多源异构和高阶多维的非线性信息进行统一建模。鉴于此,本文结合张量分解和张量神经网络,设计了高效精准的混合推荐算法。首先,提出

学位

基于先验信息的图像压缩感知重构算法

压缩感知（Compressed Sensing,CS）理论指出:信号只需满足可压缩或在一个特定域中有一定稀疏性,便可以通过和稀疏基不相关的观测矩阵进行线性观测,并通过算法重构得到初始信号。先验信息是指主体在观察该事物之前已经具有的关于该事物的信息,其在在信号重构中至关重要。目前CS重构算法大多只考虑图像的单个先验信息,如非局部低秩,先验正则等,对于不同图像重构的效果波动很大,抗噪能力也不强。且非局

学位

基于图分析的数字集成电路诊断分辨率提升研究

芯片诊断是一种基于诊断工具分析不合格芯片的测试数据、电路网表以及电路响应的过程,用于对其中的真实故障进行定位。芯片诊断分辨率反映了芯片诊断结果的精确程度,较高的诊断分辨率能极大地节省后续物理失效分析的成本,有助于发掘集成电路出现故障的问题根源,进而达到改善芯片生产工艺、提高芯片生产良率、降低生产成本的目的。芯片诊断的输出是一组疑似故障位点及其邻域上的状态,电路中的故障与其邻域有着密切的联系。现有的

学位

基于张量和元学习的Transformer模型研究

与本文相关的学术论文