基于低秩表征的短视频多标签分类研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:ADCADC111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动网络技术的进步和智能设备芯片的快速发展,信息交互方式逐渐从传统的用户被动接收信息的模式转变为用户主动生产信息的模式,短视频作为用户生产内容的代表在大数据时代应运而生。短视频作为多媒体数据具有天然的多模态特性和丰富的语义信息,但这些复杂的数据背后往往会存在着噪声和相关性信息,对于其正常应用会有一定的影响。因此,有必要对庞大的短视频数据进行有效的特征表征和语义理解。本文基于低秩表征学习理论,针对于短视频的多标签分类问题,进行了如下研究工作。针对短视频在特征表征过程中的潜在标签相关性匹配度不高的问题,本文提出了一种基于语义嵌入低秩表征的短视频多标签分类模型,更好地利用原始标签的语义信息提升特征表征过程中的相关性,进而得到语义嵌入后的特征表征形式。与以往的原始特征直接附加低秩约束不同,本算法将语义嵌入后的特征进行低秩约束。此外,模型灵活应用数据集中的相关性信息进一步贴合多标签分类的需要。在大样本数据集上的实验结果证明了语义嵌入低秩表征的有效性。针对多模态短视频可能出现的潜在语义分布不均衡的问题,本文提出了一种基于多模态对偶低秩分解的短视频多标签分类模型。为了学习更加完备的短视频表示,模型利用不同模态之间的互补性和一致性,学习到了低秩约束下的共享模态和具体模态表示,同时可以解决短视频每个模态描述能力有限的问题。为了捕捉潜在的标签表示,模型引入了稀疏正则化多方差正态估计项来同时编码标签和特征维度之间的潜在相关性结构,使得整个模型更加适用于多标签学习的需要。在大样本数据集上的实验结果证明了多模态对偶低秩分解的有效性,并优于现有大多数算法。
其他文献
近年来,短视频由于其易于传播、内容丰富、播放时长短等特点,迎合了人们快节奏的生活方式,成为最受欢迎的新兴媒体之一。针对海量短视频资源进行智能化分析技术,已成为进一步提升短视频服务质量和构建创新应用模式的关键。但短视频时长较短,需要挖掘短视频内部的潜在信息,才能更好的进行多标签分类。为此,本文引入深度矩阵分解技术,希望能获得短视频在复杂结构数据上高级语义表征,从而解决短视频多标签分类的问题。为了获取
学位
交通标志识别是自动驾驶领域中的重要研究方向,在协助驾驶员遵守交通规则和创建自动驾驶系统方面起着至关重要的作用。随着深度学习的不断发展,基于卷积神经网络的交通标志识别算法取得了比传统方法更加出色的效果,并逐渐成为交通标志识别领域的主流方法。本论文针对现有基于深度学习的交通标志识别算法所存在的问题进行研究,做出一系列改进后,提出了两种网络模型:基于密集连接的无锚框交通标志识别网络(DCAF)与基于注意
学位
高质效履职是检察机关全面贯彻习近平法治思想,促进公正司法的应有之义。刑事执行检察是检察机关法律监督体系中的重要一环,是检察机关的传统职能。在新时代新征程中,刑事执行检察部门不仅具有刑事执行监督职责,而且承担司法工作人员相关职务犯罪案件侦查职能,肩负保障法律在刑事执行领域统一正确实施、维护刑事执行和相关司法活动公平公正的重要使命。刑事执行检察工作应当坚持正确的监督思维和办案理念,在“派驻+巡回”有机
期刊
<正>为进一步保障实验动物的福利,不断提升动物实验研究的水平并获得国际学术界同行的认可,根据我国和北京市实验动物有关法规和标准,在实验动物麻醉方法中,鉴于水合氯醛原属于镇静、催眠及抗惊厥药,作为麻醉剂效果较差,刺激性强、毒副作用较大,存在干扰实验结果、对实验动物不人道和有悖实验动物福利伦理审查原则等问题,国外期刊普遍建议不再使用水合氯醛作为实验动物的麻醉剂。因此,本刊自2019年8月18日起,不再
期刊
医学成像技术是现代医学中的一个有力工具。然而,医学图像往往存在视觉质量降级,进而导致人工阅片和计算机辅助诊断的准确性降低。因此,研究低质量医学图像的增强方法是非常有必要的。变分Retinex作为Retinex增强方法的重要分支而在过去的十几年中得到了广泛的研究和应用。针对低质量彩色视网膜图像,光学相干层析(Optical Coherence Tomography,OCT)图像和低照度腰椎磁共振(M
学位
在全国检察机关学习贯彻全国两会精神电视电话会议上,最高人民检察院检察长应勇强调:“要加强法律监督,坚持高质效办好每一个案件,努力实现办案质量、效率与公平正义的有机统一,既要通过履职办案实现公平正义,也要让公平正义更好更快实现,还要让人民群众真正、切实‘感受到’公平正义,这应当成为新时代新征程检察工作的基本价值追求。”如何高质效办好每一个案件,涉及理念、工作机制、工作路径等问题。对此,本刊特邀请理论
期刊
脑肿瘤可分为不同的子区域:水肿、增强肿瘤、非增强肿瘤和坏死区域。识别这些区域对于脑肿瘤的治疗具有很高的价值。在脑肿瘤的诊断、治疗以及后续研究过程中,磁共振图像常被用于对肿瘤的位置、形状及大小进行观察。因为手动分割脑肿瘤的子区域非常消耗时间,容易出错且主观性强,所以需要设计准确、高效且可重复的自动分割脑肿瘤图像的方法。本论文针对脑肿瘤三维图像分割问题,提出一种级联的、包含帧内-帧间卷积的改进型U-N
学位
报纸
针对司法救助案件线索来源少、救助不及时问题,检察机关通过聚焦因案导致生活困难的原建档立卡贫困户、退役军人、未成年人、残疾人、涉法涉诉信访人等重点人群,建立国家司法救助线索大数据筛查智慧应用平台,通过数据比对碰撞,精准、高效筛查司法救助案件线索,变当事人申请为检察机关主动排查,跑出司法救助“加速度”,全力防范化解因案返贫、致贫风险,及时解决人民群众急难愁盼,为全面推进乡村振兴贡献检察力量。
期刊
视觉里程计(Visual Odometry VO)通过分析关联图像之间的多视几何关系确定传感器(运动载体)的位置与姿态,被广泛应用于自动驾驶、机器人、虚拟现实和增强现实等新兴技术领域。传统的VO基于几何运动约束求解位姿,涉及繁琐的计算过程,并且在面对复杂的场景时,往往会产生较大的估计误差或者算法失败。近年来,以卷积神经网络为代表的深度学习技术给视觉里程计任务带来了新的研究思路。本文围绕视觉里程计展
学位