基于多源域迁移学习的视频内容标注方法研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:chenchao198339
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视频内容的标注能够有效地对视频进行分类和检索,因此它一直是广大研究者关注的问题。在该问题上,传统的机器学习方法需要人工标注大量的样本,这会耗费很多的人力物力,而使用迁移学习方法可以很好的利用相关领域的知识来训练模型,从而完成对视频内容的标注。由于单源域迁移学习源领域比较单一,可能会由于源域和目标域之间关联程度不大导致迁移的效果不理想,因此本文使用多源域知识训练目标模型,首先将互联网视频知识和图像知识进行分组,然后通过计算各源域组和目标域之间的权重来学习目标分类器,最后完成了对目标视频的标注任务。本文主要的研究工作如下:(1)针对目标视频缺少带标注数据而导致的负迁移问题,本文提出了一种多源域适应方法(Multi-Source Adaptation,MSA)。该方法在目标域中加入少量带标注的视频数据,根据源域互联网视频组与目标域用户视频之间的相关程度,计算不同的源域视频组的权重,然后根据权重计算每组源域视频分类器对目标域视频的决策值,最后根据基于流形正则项的权重学习模型来训练目标分类器。实验结果表明,MSA方法在Kodak数据库上的平均标注准确率达到了42.62%,比CP-MDA、DAM、DSM和MDA-HS方法分别提高了7.54%、4.59%、1.79%、9.99%;而在CCV数据库上达到了43.76%,分别相对提高了21.76%、17.38%、3.33%、8.64%。(2)针对源域知识提取不足的问题,本文提出了一种异构复合多源域适应方法(Heterogeneous Compound Multi-Source Adaptation,HC-MSA)。该方法加入与源域视频组异构的图像组数据组成异构复合的数据源,为了减少源域图像组和目标域数据分布的不匹配,使用最大均值差异方法减小源域图像组和目标域视频的距离。针对每个源域组学习适应的分类器,并计算其权重,然后根据权重计算每组源域分类器对目标域视频的决策值,最后引入多核学习和拉普拉斯流形正则项来约束目标分类器。实验结果表明,HC-MSA方法在Kodak数据库上的平均标注准确率达到了47.32%,比CP-MDA、DAM、DSM和MDA-HS方法分别提高了14.69%、11.66%、6.41%、2.56%、3.16%;而在CCV数据库上达到了46.88%,分别相对提高了18.62%、14.17%、8.34%、3.47%、2.87%。
其他文献
传统的成本性态分析理论认为,企业业务量与成本费用之间是线性关系。该成本性态理论成立的前提条件是企业处于一种理想状态下,但是现实中很多外在因素会对公司成本费用的管理
我国经济发展迈入速度放缓、结构优化和动力转换的新常态阶段,稳增长、调结构、重质量是当前发展的重点。同时,新一轮的科技革新和产业升级蓄势待发,学科多点突破、产业交叉融合的现象日益明显。知识、服务、信息、技术要素的强关联效应和外溢效应推进了产业融合、催生了一批融合型的新产业、新业态、新商业模式,从根本上变革了生产、生活方式。融合深化模糊了三次产业的边界,赋予了产业结构升级新的特征。本文探索产业融合深化
在信息总量爆炸式增长的背景下,互联网用户需要更快捷的方式从海量的信息中获取有价值的一部分,而问答系统就是可以完成这种任务的工具之一。目前,问答系统在诸多场景下都得到了应用,开放领域的问答系统可以作为一个强化版的搜索引擎,对用户输入的问题作出准确回答。同时,在各个领域的客服系统中,问答系统也有着广泛应用。相比于雇佣人工客服的方式,部署在线问答系统可以有效降低人工成本,同时能够保持长期在线。与此同时,
随机森林作为一种组合分类技术,因其抗噪声能力强、易于并行化等诸多优势被广泛应用于人工智能、机器学习、模式识别等领域。但随机森林在模型建立过程中优劣程度不同的子树
研究已经表明在推荐系统中的评分不是随机丢失的。然而,很少有研究去揭示评级是如何缺失的。在本文中,我们提出了一个可能的解释去揭示缺失非随机现象,即沉默螺旋理论。我们使用一系列不同的现实数据集去验证了推荐系统中的沉默的少数群体存在一个螺旋式过程。其中包括:(1)相比于持有多数意见的用户群体,意见落入少数意见的用户群体更不可能给出评分;(2)由于多数意见逐渐变得更具主导地位,多数意见的持有者的评分可能性
近年来,随着中国对外开放不断深化,国际传播能力不仅是扩大中国国际影响力的重要支撑,也成为中国开展国际合作的重要抓手。国内传媒机构积极探索中国国际传播能力的发展,利用国际传播一方面能扩大中国对世界的影响力,另一方面也能加强中国与其他国家在更多领域中合作,特别是在涉华议题的国际传播,为其他国家更好了解中国、展开国际合作提供窗口。通过对国际传播现状进行分析,本文认为在当前国际信息流动中呈现出一些与“二级
现今人们在社交网络如微博上进行频繁的社交活动,根据用户喜好的相关性可将用户分为多个群组。推荐系统通过对收集用户和物品的相关信息进行分析和挖掘,能够有效地帮助用户过
随着移动互联网的发展,大量电商平台崛起,线上购物成为了越来越多人喜爱的购物方式,线上购物不仅带来了便捷,更有价格上的优势,电商平台经常会进行降价促销,除去基本的秒杀,限时抢购等活动,更有双十一类型的大流量促销,因此在价格上更需要谨慎,人工审核已不能满足频繁的价格变动,需要系统去应对复杂多变的促销规则。本文以减少线上事故,限制频繁价格变更,提升企业形象为目的,详细描述了营销交易平台价格管控系统的设计
光子晶体,借助特殊的空间对称性实现对电磁波的调控,被形象地称为“光的半导体”。目前研究的光子晶体大多采用具有各向同性本构参数的单元排成阵列,电磁参数单一;以异向介质
网络信息爆炸式的增长方式促使了计算机文本自动处理技术的发展,如何高效、准确地获取文本语义信息是目前迫切需要解决的问题。考虑到人类理解句子的过程可以描述为对先验信