【摘 要】
:
随着互联网和社交平台的快速发展,几乎所有的用户每天都在通过不同的媒体形式,在这些社交平台上传递着各种各样的信息。其中,短视频作为一种新的社交媒体形式出现在人们面前,由于其“短小精悍”,利用用户碎片化时间的特性,更好地适应了现代社会快节奏的需求,迅速受到了广大用户的青睐。区别于传统视频,短视频一般由个人用户创建,其长度往往十分有限。同时,随着互联网上短视频数量的增加,对短视频进行分类的需求变得越来越
论文部分内容阅读
随着互联网和社交平台的快速发展,几乎所有的用户每天都在通过不同的媒体形式,在这些社交平台上传递着各种各样的信息。其中,短视频作为一种新的社交媒体形式出现在人们面前,由于其“短小精悍”,利用用户碎片化时间的特性,更好地适应了现代社会快节奏的需求,迅速受到了广大用户的青睐。区别于传统视频,短视频一般由个人用户创建,其长度往往十分有限。同时,随着互联网上短视频数量的增加,对短视频进行分类的需求变得越来越迫切。同时短视频分类也是对用户进行个性化的推荐前提。
在本论文中,我们主要研究短视频的复杂事件检测。复杂事件检测是一项具有挑战性的任务。相比于在视频中识别物体和动作,它是一种更抽象、更复杂的事件语义描述,需要从大量的视频中搜索特定的事件、人物,涉及到很多底层语义信息之间的交互,比如场景,人物,目标等。另外,对于短视频而言,时长的不足,会导致提供的有价值的信息不够丰富,这加大了事件检测的难度,故需要对已有的信息进行更充分的挖掘及利用。已有的事件检测数据库都是针对传统视频的,短视频事件检测数据库的缺失也增加了实验的困难。
针对上述问题,我们首先提出了一种基于多视角的低秩表征学习的短视频事件检测模型,该模型不仅可以最大化多个视角间的互补性和关联性,还可以通过低秩嵌入学习更低维本征的子空间结构;在此基础上,我们引入了一个鲁棒的弹性正则化网络,学习潜在标签矩阵来防止过拟合问题。其次,为进一步解决数据高维及非线性问题,通过核函数构建新的特征矩阵,将所提模型扩展到多线性形式,以提高模型处理高维非线性问题的能力。此外,为更好验证所提模型的有效性,我们从Flickr中抓取大量的短视频并进行过滤清洗,构建了一个用于短视频的复杂事件检测的数据库。在该数据库上的实验结果证明了所提模型的有效性。
其他文献
时间触发以太网(Time-triggered Ethernet, TTE)是一种时间业务与事件业务混合的以太网网络通信新技术,相较于传统以太网,时间触发以太网提高了网络资源利用效率。 本文首先基于现有的混合流量分区调度策略,引入TT响应约束,设计适用于存在响应约束的TTE网络离线调度表生成方法。同时采用对网络流量信息先综合复合,再细化不同终端节点调度表的策略,简化调度表生成方法。并设计离线调度表
深度学习极大促进了计算机视觉领域的发展,如图像检索、目标检测等。但这些任务依赖于大量的标注数据进行训练。然而,现实世界中的某些类别只有少量的标注样本,甚至没有标注样本,这为传统分类算法带来了新的挑战。为了解决该问题,零样本图像分类技术得到关注,即:对训练阶段未出现的类别进行分类。本文针对零样本图像分类技术分别提出基于特定类别的合成字典模型(Class-Specific Synthesized Di
最近几年来,由于互联网技术的快速发展,伴随着信息传播速度的提升,大量三维模型数据开始呈现井喷式增长,三维模型的数据也成为一种新型的数据类型。随着深度学习的出现,国内外研究学者对三维模型的研究成了现阶段一个热点,在各行各业的应用也十分广泛,诸如:医学3D打印技术、计算机辅助设计(CAD)、3D动画设计、工业产品设计、机械零件制造等。鉴于三维模型的应用前景广泛,如何在有效管理大量的三维模型数据同时,并
随着移动互联网技术和相机设备的快速发展,多媒体数据呈现爆发式增长,人们通过图片来直接表达意见、传递信息的方式也越来越常见。一方面,尽管高动态范围图像可以细致反映真实场景,为了方便输出,其通常会被图像处理算法将其动态范围压缩至输出显示设备的动态范围以下。这是高动态范围图像研究的热点和重点之一。另一方面,图像质量的主观评价在过去几年引起了很多的关注。传统的图像主观质量评价主要侧重于预测图像的平均意见得
入侵检测系统是信息与网络安全保障的重要环节,随着网络环境的日益复杂以及黑客技术的不断提升,传统的入侵检测技术已经无法满足安全系统的需求。近年来,越来越多的相关研究都将机器学习与入侵检测技术相结合,以提升检测器对入侵的检测率,并且减少系统的误报率与预测时间。 本文提出了两种基于机器学习的入侵检测模型。(1)针对网络数据的特征维数高、非线性可分等问题,提出了一种基于独立成分分析ICA(Indepen
听力损失是导致儿童聋哑的首要原因,也是困扰老年人正常生活的重要问题之一,因此听力损失的早期诊断具有重要的研究和现实意义。听觉脑干诱发电位(Auditory brainstem response,ABR)检测作为一种客观、无创的听力损失诊断技术,其波形的准确提取对临床诊断结果具有重要影响。 现有ABR检测方法主要基于叠加平均技术,存在信号失真严重、检测时间过长、对患者和测试环境要求过高等问题。卡尔
第五代移动通信对无线通信系统提出了更高的挑战,如提供更高的传输速率、实现更低的时延和提供灵活的波形选择等。时下流行的正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)波形已经不能满足这些需求。因此,需要为其寻找合适的替代方案。广义频分复用(generalized frequency division multiplexing, GFDM
低频振动检测在工业测量领域的应用越来越广泛,而三维地貌信息的恢复是对振动物体进行测量的先决条件。考虑到被测物体与测量者相隔距离远,或者物体质软,易于形变等不易测量的情况,传统的接触式测量方法只能对静态物体进行测量。为了能进行快速的全场式测量,需要使用非接触的光学测量方法。条纹投影技术是非接触测量中的重要组成部分,该方法通过对比物体放置前后由相机拍摄的两张条纹图像的相位差,从而获取物体的三维深度信息
多旋翼微型无人机因其灵活、便携、可垂直起降和高速巡航等特点,被广泛应用在航拍测绘、农业植保等多个领域。随着行业无人机技术的发展,无人机应用领域不断扩大,许多新兴的应用,如智慧物流、搜索救援、电力巡检等,对无人机的自主性提出了更高的要求,需要无人机在执行任务的过程中能够自主地处理各种复杂情况,例如无人机在GPS失效的情况下仍能精确定位、在飞行过程中自主躲避障碍物、动态规划航线、自主探测到合适的位置降
一切的海洋活动都离不开海洋测绘保证,为了提高海洋测量的精度,减少人工站点的投资,近年来国内外学者一直致力于船载走航测量模式的研究,而海洋测量船驶向测量线的航线规划正是船载走航测量的重要内容。运用现代计算机信息、网络技术综合处理海洋地理环境信息实现高可靠性、高精度的路径规划对于海洋测绘工作的顺利展开具有重要意义。 国内外海洋航行正逐步进入智能化、自动化导航的阶段,但国内针对海洋测量船驶向为实现海洋