【摘 要】
:
图像自动标注在解决网络上图像信息过载问题中起到了很大作用,用户可以通过图像的标签来检索分类图像。图像领域中,图像自动标注问题的研究主要通过挖掘图像内容或标签信息等辅助信息提升模型效果,但多倾向于挖掘图像内容,对于标签等辅助信息的研究不够深入。本文主要以推荐的思路,从标签信息等辅助信息入手,解决给图像推荐标签的图像自动标注问题。分别从推荐系统的经典算法和新兴方法两部分着手,经典算法采用矩阵分解,近几
论文部分内容阅读
图像自动标注在解决网络上图像信息过载问题中起到了很大作用,用户可以通过图像的标签来检索分类图像。图像领域中,图像自动标注问题的研究主要通过挖掘图像内容或标签信息等辅助信息提升模型效果,但多倾向于挖掘图像内容,对于标签等辅助信息的研究不够深入。本文主要以推荐的思路,从标签信息等辅助信息入手,解决给图像推荐标签的图像自动标注问题。分别从推荐系统的经典算法和新兴方法两部分着手,经典算法采用矩阵分解,近几年兴起的方法主要采用深度学习和图论。通过用推荐的方法给图像补全标签,辅助完成图像分类和图像检索。推荐系统研究的经典问题是通过用户和商品的信息,给用户推荐合适的商品。本文将图像类比成推荐系统中的用户,将标签类比成推荐系统中的商品,利用图像和标签之间被标记的关系,以及图像的内容信息,标签之间的关系,进行分析研究,给图像推荐标签。首先,对推荐系统中的矩阵分解这一经典算法进行描述分析,介绍了矩阵分解方法的原理、优势和缺点。针对其存在的训练时间长,可解释性差的问题,将贝叶斯(BPR)优化法则与矩阵分解结合,给出BPR优化的矩阵补全图像自动标注模型。充分利用图像与标签之间的偏序关系,以提高算法训练速度,增强结果可解释性。其次,采用推荐系统与深度学习、图论结合这一思路,把利用深度卷积神经网络(CNN)获取图像视觉内容信息的子模型和利用标签关系图谱获取更深层次语义信息的子模型融合,给出基于CNN-图扩散的图像自动标注模型。通过在预训练过的Res Net101上训练模型,获取图像的视觉内容信息;再根据标签之间的共现关系,构建标签关系图谱,利用标记过图像的历史标签集作为种子节点,进行图扩散,获取深层次的语义信息;将学习到的语义信息与图像视觉信息结合在一起,综合衡量与图像更为匹配的标签列表,完成给图像推荐多个标签的任务。最后,对于本文提出的BPR优化的矩阵补全图像自动标注模型和基于CNN-图扩散的图像自动标注模型在真实的数据集Image Net、NUS-WIDE和MSCOCO上分别进行了算法有效性验证。
其他文献
悬挂系统对应急救援车辆的行驶平顺性具有重要影响,但目前主动悬挂系统的研究主要在寻求更有效的控制策略上,忽略了作动器摩擦力对悬挂系统的影响,导致悬挂控制理论与实际应用存在偏差。本文结合国家重点研发计划“高机动应急救援车辆(含消防车辆)专用底盘及悬挂关键技术研究”(编号:2016YFC0802902),以提高三轴应急救援车辆行驶平顺性为目的,针对主动悬挂作动器摩擦力补偿控制技术进行深入研究,以实现对作
Android系统的开源特性使其快速发展的同时,也给Android应用带来了巨大的安全隐患。研究Android应用安全加固方法的目的,在于从破解时间、破解难度两个方面增加应用破解所要付出的代价。本文围绕如何在不明显影响Android应用性能的前提下,实现加固后的Android应用同时具有抵御静态攻击、动态攻击以及重打包攻击的能力这一问题,展开了如下研究工作。首先,在分析主流攻击方式的基本原理及其相
随着信息技术的飞速发展,网络上的信息出现爆炸式增长,如何有效地利用数据中的信息完成对用户的推荐成为网络生态中的研究重点。而在商家评论网站中的评价数据中,隐含着商家属性和用户情感,现有的商家个性化推荐主要依据近邻用户的评分信息产生推荐,无法细粒度的探究用户偏好,忽略了商家及用户在属性层的情感评分。对此,本文提出一种基于多属性矩阵构建的商家推荐方法。首先,针对现有研究商家及用户在属性层面的属性细粒度情
推荐系统的研究一直是数据挖掘中的热点,在解决信息过载方面起到了重要作用。其中协同过滤是相对成熟的推荐技术,但目前协同过滤算法仍存在数据稀疏性、冷启动以及隐式信息挖掘不充分等问题。本文通过对项目隐式信息的挖掘以及融合多因素来改善协同过滤过程进而影响推荐准确度,缓解数据稀疏性。首先,本文对常用的推荐算法进行描述,详细介绍了协同过滤中矩阵分解方法的原理及优缺点,分析了针对项目隐式反馈和协同过滤算法过程的
随着地理定位技术和基于位置服务的发展,产生了大量的轨迹数据,带有活动信息的轨迹更是引起了广泛的关注。基于范围的活动轨迹搜索,给定一个查询区域和一组关键字,从轨迹数据集中检索出通过该区域并且满足关键字的轨迹。由于返回的轨迹旅行代价过高,或者是该轨迹不够流行,这使得找到的轨迹不能使用户满意。因此,为了满足用户的需求,本文考虑了关键字的流行度以及轨迹可拼接,提出一种新的查询,在满足给定区域以及关键字文本
篮球项目中,运动员弹跳能力是专项身体素质中的重要一环,是比赛中争抢篮板、防守中封盖对手以及跳投的专项素质保障。但目前大多数基层教练员,将篮球项目中的弹跳训练等同于田径训练,没有与项目特征结合。虽然在此训练下,会使球员弹跳能力得以提高,但训练针对性不强,导致训练效率受到一定影响。因此,本文通过对中学篮球运动员的专项弹跳能力训练实验教学进行研究,探索青少年篮球基础训练阶段专项弹跳能力的发展路径。
业务流程的执行产生了大量事件日志,为业务流程挖掘提供了重要依据。流程预测是业务流程挖掘中的一个热点问题,目标是对当前正在执行的流程实例进行分析,推断出其未来可能的执行状态。业务流程预测包括活动预测,时间预测以及违规预测等,预测方法主要分为基于模型的预测和基于深度学习的预测两大类。基于深度学习的预测近年来大多是在LSTM神经网络模型的基础上进行改进,对于数据的编码方式以及活动序列的训练还存在不足,没
从广西各地患禽巴氏杆菌病急性死亡的鸡、鸭肝脏分离出56株禽巴氏杆菌强毒株,经培养特性和生化特性试验鉴定,从中选出15株典型禽巴氏杆菌菌株。Carter荚膜抗原分型鉴定,15株菌均为荚膜A型,间接血凝滴度为1∶160~1∶640。通过毒力和免疫原性测定,从中选择毒力较强、免疫原性较好的B25、B26、B273菌株进行人工致弱,其中B26菌株在0.1%裂解全血马丁汤中,通过物理诱变方法致弱,即在传代过
随着互联网技术的迅猛发展,大量电商平台、社会媒体迅速进入到人们的生活和工作中,大量繁杂多样、内容丰富的观点信息涌现在用户眼前,对这些观点信息进行深度地挖掘、有效地分析,帮助用户进行决策,已经成为产业界的迫切需求。商品评论挖掘是观点挖掘应用的延伸,对消费者快速做出正确的购买决策,商家及时更改宣传方案和销售决策等都具有重要的研究意义。但是,当前中文商品评论挖掘还未达到英文商品评论挖掘的成熟度,本文针对
行人重识别(Person Re-identification)技术是计算机视觉的一个重要领域,也是智能监控系统中的一个重要环节;行人重识别通过建立不同摄像头下行人图像间的对应关系,从而实现非重叠视域不同摄像头下相同行人的自动匹配,具有很高的应用价值。随着深度学习的蓬勃发展,行人重识别技术取得了很大进展,但依然面临着严峻挑战。为了提高实际场景下的行人重识别准确率,本文用深度学习方法对该问题进行研究,