【摘 要】
:
近年来,随着视频监控、短视频社交等领域的蓬勃发展,产生了海量的视频数据。视频目标分割算法的发展促进了视频内容理解技术的广泛应用,对于智能安防、视频存储和自动驾驶等任务具有重要意义。视频目标分割旨在将某些特定的、显著的目标从视频背景中分离出来,本质上是一种像素级分类任务。然而,由于视频内容的多样性和复杂性,使得视频中存在大量前景背景混淆、目标形态变化、目标尺度变化等诸多问题,给视频目标分割算法带来了
论文部分内容阅读
近年来,随着视频监控、短视频社交等领域的蓬勃发展,产生了海量的视频数据。视频目标分割算法的发展促进了视频内容理解技术的广泛应用,对于智能安防、视频存储和自动驾驶等任务具有重要意义。视频目标分割旨在将某些特定的、显著的目标从视频背景中分离出来,本质上是一种像素级分类任务。然而,由于视频内容的多样性和复杂性,使得视频中存在大量前景背景混淆、目标形态变化、目标尺度变化等诸多问题,给视频目标分割算法带来了巨大的挑战。本文沿着从无监督设定下的视频单目标分割,到半监督设定下的视频多目标分割的技术路线,做了以下的研究工作:(1)在无监督设定下构建了基于外观与运动度量视频单目标分割算法。针对视频中目标会发生较大形变或者目标运动过快导致的分割不准确问题,构建了外观与运动度量模块:使用时空期望最大化自注意单元(Spacetime EMAU)对目标的外观建模,使用ConvLSTM对目标的运动建模。外观与运动度量模块的引入,使得视频目标分割算法可以较好的适应不同目标在视频中的运动变化,面对不同幅度的变化时有着较高的鲁棒性。由于无监督设定下不提供任何待分割目标的先验信息,视频目标分割算法难以处理复杂背景的场景。为此,我们设计了区域约束损失函数,即通过在模型的训练过程中添加Centerness损失函数,对待分割的前景目标区域加以约束。最后,本文通过在DAVIS 2016数据集上进行实验,验证了该算法的有效性,分割精度达到了68.7%,达到了较高的水准。(2)在半监督设定下构建了基于相似性度量和自注意力的视频多目标分割算法。半监督是指仅在视频第一帧中提供了待分割目标的掩模的基础上,在视频的后续帧中对目标进行精确分割。本文参考了基于转导(transduction)的视频目标分割(TVOS)的算法框架,并做了自注意力机制单元的嵌入,构建了基于相似性度量和自注意力的视频多目标分割算法模型。在保证了视频目标分割算法的高效性和实时性的同时,使分割精度得到了进一步的提升。最后,本文通过在DAVIS2017数据集上的实验,验证了自注意力机制的嵌入,丰富了待分割目标的细节信息,优化了目标的轮廓信息,分割精度也达到了72.7%,速度达到了17FPS,充分说明了该算法的有效性。
其他文献
随着临床医学领域的快速发展,越来越多的研究成果以临床试验文献的形式不断发表,大量的临床证据以非结构化的文本形式蕴含在文献中。临床证据是临床实践指南制定与更新的重要依据,因此从这些非结构化的临床试验文献文本中自动化地抽取出基础的证据信息如药物名称、疾病名称以及疗效指标,对临床实践指南的制定与更新起着至关重要的作用。然而,目前缺乏用于临床试验文献中药物名称、疾病名称以及疗效指标抽取的标准数据集,从而在
随着社会经济需求的不断发展,区块链作为一项新技术发展起来,并在学术研究和实际工业应用中都引起了广泛的关注。以太坊是当下最流行的区块链平台之一,智能合约在关键的分布式应用程序中充当自治代理,并持有大量加密货币以执行可信交易和协议。以太坊目前已部署数万个智能合约,控制了价值数十亿美元的以太坊的加密货币,由攻击者引起的以太坊智能合约安全事件也层出不穷,资金损失尤为严重。智能合约是使用高级语言并由开发人员
随着人类对生活水平要求的不断提高,社会对定位与识别的需求也与日俱增,在室内环境中如商场、办公室、火车站、实验室等经常要确定人员在室内的位置以及该位置上的人员身份信息。正确获取人员的身份信息,并将身份信息正确赋予到获得的位置信息上,是室内人员定位的关键技术之一。本文针对室内人员定位需求开展研究,重点研究人员身份获取技术。在人员身份信息获取中,常用的有指纹识别、声纹识别和人脸识别。本文结合室内人员的定
近年来我国各城市轨道交通通车里程逐年提升,为确保列车运行安全,地铁检修作业工作量随之增加,用于检修的工具种类多、数量大。在管理检修工具时,大多地铁企业依旧采用“三清点”的人工管理模式,存在工具借用、归还过程耗时,管理员工作强度大等问题,容易导致工具遗落现场引发安全事故,而且缺乏智能化管理手段。为提高地铁企业工具管理效率,实现数字化、智能化的工具管理模式,本文利用无线射频识别(Radio Frequ
脑卒中又称“中风”或“脑血管意外”。为一种急性脑血管疾病。据研究表明,脑卒中目前居于我国国民死亡原因的首位,同时,脑卒中也是导致我国成年人残基的第一病证。中医可以根据不同人的体质,采用辩证论治的方法,针对不同的体质特点,遣方用药,辨证施治。在此背景下,为了进一步探究治疗脑卒中的辨证治疗方法,对脑卒中用药规律进行研究,论文构建脑卒中用药规律分析模型,包括CC双聚类模型、随机森林以及适用度规则,逐步探
密码技术在维护信息的完整性、不可否认性、机密性及认证方面发挥着至关重要的作用,是保障信息安全的核心技术之一。我国强调密码技术的自主可控,商用密码技术必须加强自主创新。2017年,由我国国家密码管理局发布的《SM9标识密码算法》被国际标准化组织(ISO)采纳。随着国密SM9算法在国内外的认可不断提升,其在将来一定会在各个领域进行大规模应用。但从目前来看,国内外对于SM9标识密码算法的研究还处于起步阶
随着计算机计算能力和存储能力的不断进步,大数据已经成为人们耳熟能详的概念,人类社会也进入了大数据时代。然而,大数据时代也广泛存在着信息过载的问题。对于广大用户,面对数以亿计的数据,想从中寻找到自己真正需要的、有价值的信息往往举步维艰;对于广大创作者,让创作的优质信息精确高效地展现在目标受众面前,也是十分困难的。推荐系统就是这一现象的有效解决方案。推荐系统通过对用户和候选信息进行特征挖掘,给用户推荐
数据图表在展现数据特征方面存在独特的优势,数据可视化分析在人们对于海量数据的挖掘和运用过程中已成为必不可少的一环。但是,在数据爆发式增长的今天,数据集量级与复杂程度不断增加,传统可视化工具需要手动配置生成可视化视图,该方法难以满足用户在海量数据中挖掘有效信息的需求。为解决大数据时代数据可视化分析任务面临的高效性与准确性等难题,自动分析数据集可视化特征并进行价值评估的可视化推荐技术受到研究人员的高度
我国城市轨道交通的飞速发展,为人们的出行带来了很大的便利,但同时也给列车的运行安全带来挑战。随着列车速度不断提高,载重量不断增加,列车的检修也变得越来越重要。列车在长时间运行过程中,由于碰撞、老化等问题,列车底部中心鞘螺栓部位会出现表面裂纹、磨耗、松动、缺失等故障,容易引发重大交通事故,造成人员伤亡和财产损失,因此研究螺栓故障检测方法与技术,通过在线检测及时发现螺栓的故障,避免列车事故的发生,其研
随着数字技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点,数据日益成为重要战略资源和新生产要素。党的十九届四中全会首次提出将数据作为生产要素参与分配。数据资源作为数据经济时代的重要生产要素,构建安全可信的数据要素市场,能够在充分释放数据红利,实现数据价值流转的同时,保障数据资源安全与数据主体的隐私保护需求,从而促进数字经济高效健康发展。联盟链作为区块链技术与实体经济的粘合剂,可以有