基于视觉信息分析的图像和视频理解及检索

来源 :复旦大学 | 被引量 : 0次 | 上传用户:zhengxkun12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛发展,当前世界不断涌现出各种新兴的社交媒体,例如:Facebook,Flickr,Twitter,Instagram等等。而伴随着这些新的网络媒体的出现,各种图像和视频媒体每天以数以亿记的数量产生,不断地被传播,分享和编辑。如何基于这些图像和视频更有效和快速地理解及检索就成了一个值得研究和有趣的课题。在本文中我们分别对图像和视频的理解和检索进行了讨论,使之能更有效地服务于信息检索引擎的检索和理解。在图像的重排序部分,我们提出了一种重排序图像检索结果的新方法,它可以被适用到对象类和场景类中。我们首先介绍了两种方法:范本模型和显著图模型。范本模式是自上而下的方法,该方法考虑同一个类中图像的感兴趣区域(ROI),它包含很多类似的显著特征。这些显著特征可以被用来训练模型,并重新排名查询的测试图片。另一方面,显著图模型是一个自底向上的方法,该方法采用赢者通吃和返回抑制机制来找出梯度下降显著的区块,其显著图像可以用来进行重排序。在实验中,我们观察到的范本模型在对象类中表现良好,而显著图模型在场景类更好,两个方法专注于不同的方面。最后,我们提出了一个方法ExSM模型,结合了范本模型和显著图模型的优势。ExSM在场景类和对象类中都表现得很好。在视频理解部分,我们提出了一种方法,它结合了权重模板和时空模板来识别人类的动作。首先,考虑到身体的不同部位在不同的行为动作中发挥着截然不同的重要角色。所以在人类动作的识别中,我们建议采用于基于光流局部描述符的权重不同的动作识别模板。然后,我们提出了时空模板,由运动能量图像(MEI)和运动历史图像(MHI)组成,包含了全局描述符和时间信息的描述符。考虑到局部描述符,全局描述符与时间信息,我们融合了权重模板和时空模板来进行识别动作。实验结果表明,融合的模板可以有效地从不同的方面识别人的动作。
其他文献
顺式二羟基生物分子在生命科学领域中分布广泛,并发挥着非常重要的作用。其包括糖类化合物、儿茶酚胺类化合物、核苷类、糖蛋白等生物分子,许多该类的生物分子已经成为疾病诊
行政程序法,是指规范行政主体实施行政行为所应遵循的步骤、方式、时限和顺序的法律规范的总称。它对于约束行政主体行使行政权、加强政府依法行政、打造服务型政府、推动国家
在石油工业和油气田勘探开发领域中,研制新型光纤传感器,建立完整的光纤传感网络系统,实时监测温度、压力、振动等诸多地质物理量,对于油气藏精细描述,提高油气资源勘探开发
目的:胶质母细胞瘤是最常见和病死率最高的成人颅内肿瘤,其治疗方法主要采用手术和放化疗等多种治疗方式相结合的综合治疗。即使是接受综合治疗的患者,其预后也未达到令人满意
如何充分利用多目标评价选优的评标方法,做到科学、公平、公正地评标是招投标有关单位和部门努力追求的目标。分析了较多的国内评标方法,发现这些方法中存在着主观性较强,忽
审计市场上供需双方经过不断的博弈,衍生出了审计需求的一种直接表现形式即审计师选择。假设审计市场中需求方更多的是偏向于追求高质量的外部审计,那么这样的市场可以说是良
员工帮助计划(EAP)上世纪70年代起源于美国,是由企业设置的帮助员工预防和解决心理问题的福利项目。自1994年引入我国以来,EAP作为人力资源管理的新兴领域备受心理学者的关注
元月15日,西安市召开档案工作会议,市委常委、秘书长丁健、省档案局副局长刘卫、市委副秘书长薛惠锋、市政府副秘书长张建国、市人大教科文卫委员会主任刑华、市档案局(馆)局(
目的探讨中药颗粒剂致肝脏损害的原因。方法对我院收治的应用中药颗粒剂致肝脏损害1例的临床资料进行回顾性分析,并复习相关文献。结果本例因人工流产术后出现发热、恶心、呕