【摘 要】
:
近年来,视频成为了各大媒体的主流数据,基于视频数据的研究成为了当下的热点。动作识别针对的是人体运动相关的视频,是目前人工智能领域中比较前沿的研究方向。动作识别已广泛应用于诸多领域,如步态分析、增强现实、人机交互、娱乐和游戏、体育科学等,因此具有巨大的研究意义和研究潜力。本文面向动作识别领域中的多粒度分类问题进行研究,当前相关算法已经取得了重大突破,然而仍存在一些待解决的问题。首先,现有方法中的自注
论文部分内容阅读
近年来,视频成为了各大媒体的主流数据,基于视频数据的研究成为了当下的热点。动作识别针对的是人体运动相关的视频,是目前人工智能领域中比较前沿的研究方向。动作识别已广泛应用于诸多领域,如步态分析、增强现实、人机交互、娱乐和游戏、体育科学等,因此具有巨大的研究意义和研究潜力。本文面向动作识别领域中的多粒度分类问题进行研究,当前相关算法已经取得了重大突破,然而仍存在一些待解决的问题。首先,现有方法中的自注意力机制大多只关注同一帧节点的空间连接信息,时间上的信息只通过时域卷积进行传播,这样做会丢失时空层面上的高等级特征。其次,现有的方法大多只针对粗粒度数据,针对细粒度分类问题的解决办法较少。最后,现有方案大多完全通过深度模型提取样本的特征,缺乏对先验知识的引入和借鉴。针对这些问题,本文对已有方案进行了分析和改进,面向多粒度分类任务提出了三个方法。本文所提出的方法在三个数据集上均获得了更好的性能。本文的主要贡献如下:(1)本文面向粗粒度分类任务提出了一种时空联合注意力机制,该注意力机制既能捕获时空整体信息对当前节点的影响,又能兼顾空间中不同节点间的邻接关系。本文基于时空联合注意力提出了多注意力联合图卷积神经网络,该模型在花样滑冰数据集(FSD-10)和情感运动数据集(video-emotion)上的性能超越了当前的主流方法,在人体行为识别数据集(NTU RGB+D 60)上的性能与最新方法持平。(2)本文面向细粒度分类任务提出了一种基于位置关系的损失函数,并将其命名为角弦损失函数(AL Loss)。AL Loss通过改善特征在向量空间中的分布,使得不同类别间的分类边界更加清晰。本文将AL Loss应用于时空图卷积神经网络和本文提出的多注意力联合图卷积神经网络上,在三个数据集上均提高了原有模型的性能。(3)本文针对细粒度分类任务提出了一种手工运动特征。该特征是对压缩了时域上下文信息的图像提取的区域一致性特征。区域一致性特征有助于局部范围内运动信息的提取,将其作为一种先验知识与深度特征结合,能够增强深度特征的性能,在其原有精度的基础上得到进一步的提升。
其他文献
随着社交媒体平台的发展,互联网极大地拓展了人与人之间交流沟通的渠道。海量的对话文本在网络上不断地被发布、传播和共享,其中蕴藏了大量用户的主观感受与情感倾向,需借助人工智能等技术进行分析与挖掘。对话情感分析任务为在对话场景下分析语段的情感极性或情绪类别,因对话具有多样的表达方式、复杂的逻辑结构和耦合的情绪因素,使得该任务成为文本情感分析领域的研究热点。本文按短对话到长对话、单标签至多标签的逻辑逐步深
生物医学是一门前沿交叉学科,与人类的健康和生命息息相关。近年来,生物医学领域的电子期刊和文献数量飞速增长,用生物医学文本挖掘技术自动发现隐藏在这些非结构化数据中的领域知识是本领域进一步发展的关键。文档级生物医学关系抽取作为生物医学文本挖掘的一个重要分支,旨在从非结构化的生物医学文档中自动地抽取出存在的关系事实。目前,基于深度学习的方法是处理文档级生物医学关系抽取的常用方法。一方面,在文档级生物医学
在生物医学领域,数量庞大的医学文献逐渐构成了一个丰富的知识宝库,医学文献作为一种重要的知识来源为相关研究者们提供了重要的医学信息,有助于临床诊断、医疗问答系统等相关研究的发展。但是由于数据的增长是十分迅猛的,因此如何准确地从生物医学文献中自动提取信息,如何有效地将非结构化文本数据转换成结构化数据,成为生物医学自然语言处理领域研究的重要方向。本文旨在利用文本分类技术和关系抽取技术对生物医学领域的文本
三维重建是计算机视觉领域重要的研究方向之一,在文物保护、虚拟现实、机器人与自动驾驶等领域都有着广泛的应用。近年来,三维重建领域得到了快速发展,但三维重建模型仍有缺陷。受遮挡和距离传感器等内在因素影响,三维重建模型存在不同程度的缺失情况,因此引入三维补全进行修复。三维补全是三维重建领域中的一个重要研究方向。传统补全方法通过挖掘几何线索或匹配数据库模型实现补全,依赖于先验知识或数据库容量。深度学习方法
多任务优化是当前智能优化领域的热点之一,多任务优化算法在优化多个彼此相关的任务时,通过迁移任务之间的有效知识来提升各个任务的表现效果。但传统的多任务优化算法通常用于优化规模较小的任务组,在面对任务量较大的优化场景时,会出现迁移效果变差、计算成本升高、任务收敛变慢等问题。为解决这些问题,研究者们提出了多任务质量多样性算法,它能够生成大量多样化且表现效果好的解决方案,在一些特定场景下可以同时解决大量任
得益于深度学习的迅猛发展,信息检索领域中基于深度学习的检索模型也层出不穷。自预训练语言模型提出后,信息检索领域相关研究更是进行得如火如荼。作为信息检索领域的子领域,生物医学文本检索领域的研究却因为数据集不全、处理难度高等原因进展缓慢。但生物医学文本检索的发展对于人类健康有着重要的意义。尤其自新冠疫情以来,人们对健康问题的关注度更高、对生物医学文本的需求也更加迫切。因此,本文尝试将信息检索领域的研究
随着医疗信息化建设和生物科技的迅猛发展,生物医学文献和电子病历的数量呈现出指数级增长的态势,蕴含在这些生物医学文本中的信息成为生物医学研究的宝贵资源。但由于生物医学文本大都是以自然语言描述的非结构化形式存在,计算机无法直接对其进行有效的分析和利用。因此,通过生物医学文本挖掘技术对生物医学文本进行有价值信息的提取和利用,将对生物医疗技术的进步和医疗健康领域信息化建设的发展产生深远和积极的影响。生物医
浩如烟海的生物医学文献中储藏着大量非结构化的信息,是生物医学信息挖掘的重要来源,对于隐含知识发现研究而言更是宝贵的待开发资源。一方面,使用自然语言处理技术和深度学习方法自动化进行药物重定位,能够极大地降低药物研发的经济成本和时间成本;另一方面,药物重定位系统作为药物研究人员研发的参考依据,其推断结果需要具备充分的准确性和可解释性。如何高效而准确地将生物医学文本中的信息结构化是生物医学文本挖掘的一个
随着互联网技术的发展,越来越多的社交媒体网络平台逐渐产生,为人们带来了新的获取信息的途径,成为了人们日常生活中获取公开信息的主要来源方式。相比与传统的新闻媒体,微博、今日头条等社交媒体网络具有更好的互动性和时效性,有着更丰富的新闻表现形式,能够在新闻发生后第一时间帮助人们获取相关资讯。但是社交媒体网络中的新闻并非全部都是关键信息,包含大量冗余内容。人们可能需要花费更多的时间从新闻中获取需要的信息。
神经网络中文分词系统可以在手工标注资源丰富的领域内场景下能提供最先进的分词性能。但是,当遇到医疗领域等专业文本时,由于领域内标注资源的稀缺导致中文分词系统的性能骤降。现有神经网络中文分词系统在低频术语的分词上表现不佳。针对中文分词任务在跨领域场景下的数据分布不匹配和未登录词识别困难问题,提出了一种词典增强图卷积神经网络领域自适应中文分词方法。首先,利用外部词典对输入句子进行候选词匹配,构建基于词典