基于哈希学习的图片标签补全和预测

来源 :南京大学 | 被引量 : 0次 | 上传用户:jill_bai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机的普及,人们每天上传到社交媒体上的图片数量与日俱增。为了使用户能够便利地检索图片,一些描述图片的语义标签带来了极大的便利。面对海量的图片,手动标注是不可能完成的。因此如何能以低存储开销同时高效率检索的方式标注图片受到了广泛的关注。本文基于哈希学习的方法来解决图片标注领域的图片标签补全和图片标签预测两个问题。在图片标签补全任务中,每张图片只标注了少量的正例标签。对于标注数据中正例标签和非标注标签数量失衡的问题,我们提出了基于软约束的离散协同哈希模型。在真实数据上的实验结果表明,我们提出的方法取得了比已有方法更好的效果。在图片标签预测任务中,首先利用基于软约束的离散协同哈希模型学得图片和标签的哈希编码,之后在学习图片从高维原始空间到二值离散空间的投影时,鉴于单向投影会损失较多信息,我们采用基于自编码器的双向投影方式。将哈希编码重构回原始特征的损失项加入到目标中,可以减少投影过程中的信息损失。我们在真实数据集上验证了采用基于自编码器的投影方式性能提升显著。在图片标签预测任务中,考虑到不仅图片和标签的哈希编码要保持与标注矩阵的一致性,而且相似图片的哈希编码在海明空间内的距离应该相近。因此,我们引入深度网络来辅助图片与标签间一致性以及图片间相似性的学习,并在真实数据集上验证了模型加入图片相似性信息后性能有明显的提升。
其他文献
本文以笔者翻译的《英国社会史:1200~1500年》(节选)的原文和译文为研究对象,以奈达的逆转换理论为指导,旨在讨论译文中长难句的翻译技巧。英语长难句是指结构比较复杂的长句
本文选取Slippery Slope:Europe’s Troubled Future(《滑坡:欧洲的未来问题重重》)一书中第一章和第六章的部分内容作为翻译材料,探讨其中语篇衔接手段的处理。《滑坡:欧洲
软件定义网络(Software Defined Network,SDN)架构将传统网络的数据转发平面与控制平面分离,使其不再集成于同一网络设备中,从而简化了网络的设计管理。SDN架构中的控制层面由控制器组成,主要负责处理来自交换机的请求。已有研究表明,虽然单个控制器能够满足小型网络的需求,但考虑到可扩展性、可靠性等需求,单个控制器不足以满足大型网络的需求。所以现在多采用逻辑集中式、多个控制器物理分
在基于图计算的数据分析应用中,如何衡量图中顶点之间的相似度是一个非常重要的课题,在很多领域有广泛的应用。SimRank是近年来比较流行的相似性度量,相比于其它相似度指标,
山水画往往会包含许多的哲理性,正是这种哲理性的加入,山水画多了一层自然与人文统一的色彩,山水画成为笔者的一种精神寄托。自山水画独立成科以来,山水画家们便将生活中的客
伴随着我国医疗技术水平有了长足进步的同时,我们也不得不面对逐渐增多的医疗纠纷问题。患者因医学知识的缺乏使其在医疗纠纷中多处于弱势地位,这种信息的不对称导致患者往往
随着我国城镇化的推进和一带一路战略的实施,对工程机械的需求量日益剧增,而我国工程机械每年因为42CrMo核心部件表面磨损、腐蚀而损坏的数量十分庞大,为了延长工程机械工作寿命,提高使用性能,实现绿色循环经济,本文开展了在42CrMo基板表面激光熔覆stellite6钴基合金粉末的再制造修复探究。(1)采用正交试验研究了42CrMo表面单道轨迹熔覆stellite6涂层,分析了激光功率、扫描速度、送粉
函数依赖(Functional Dependency,FD)是关系型数据库中最常见的约束条件,它表示了数据库中属性之间的依赖关系。FD在数据库的分析与设计、数据库查询优化、关系模式规范化、
带钢表面缺陷会对相关产品的外观造成影响,并且降低产品的抗腐蚀性、抗疲劳强度等各方面性能。基于计算机视觉的带钢表面质量检测技术对于提升产品质量、提高钢铁行业的智能
信用思想是马克思理论中十分重要的组成部分,是马克思政治经济学的有机组成部分,对个人和社会发展有着独特的意义。在实践上能促进个人更有效率的参与经济进程,有助于建设社