图像兴趣评价方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:a200638012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用机器模拟人对图像内容感兴趣的程度作出评价称为图像兴趣评价。传统的图像兴趣评价通常是基于人工设定的确定性规则,对图像做出感兴趣程度的评价。然而由于图像蕴含信息量大、表达内容相对多样等特点,难以人工地去设定相对客观的评价规则,而带有数据监督的学习方法能更好地让机器学习到图像内容与感兴趣程度之间的联系。本文通过研究带有监督学习的图像兴趣评价方法来取代图像兴趣评价规则的人工设定方法。为实现图像兴趣评价方法,本文的主要工作如下:
  论文介绍了图像兴趣评价的相关背景、意义与国内外研究现状,通过分析传统方法的缺点,阐述了研究图像兴趣评价方法的必要性。
  图像兴趣特征的提取方法。本文通过优化浅层网络并对稠密层进行双通道特征整合提取图像兴趣特征。在网络浅层使用StemBlock结构,优化了低层次特征提取效果。对于稠密层,采用双通道denselayer结构,相较于传统的单通道结构,双通道的特征提取结构具有更好的感受野。收集并标注了可以用于研究图像兴趣评价的数据集。基于该数据集,提取CNN浅层次的多通道特征图,结合VLAD算法实现了对全图的特征表达。
  在提取图像兴趣评价特征后,论文使用softmax实现了初步的图像兴趣评价映射关系。然而,Softmax输出的兴趣评分与标签评分差的大小会导致不同的损失值,传统的交叉熵函数却无法表达这一差异。论文在交叉熵的基础上提出了基于类间距离度量的交叉熵损失函数,更加准确地表达图像兴趣评价模型错误输出带来的损失,从而使模型向更优的方向优化,显著地提高模型的评分准确率,使得平均绝对误差、均方误差均有下降。对于兴趣评价标签因人工标注带来的主观性、模糊性,本文将标签模糊化替代传统的one-hot编码处理,有效地抑制了模型的过拟合现象。总体而言,通过改进交叉熵损失函数和将标签模糊化均有利于提高模型的整体性能。
  论文引用了课程学习的方法有效地解决了训练样本标签不可靠带来的模型训练偏离最优化方向问题。论文提出基于特征相似度和兴趣评分的课程设计方法。对训练样本特征作Kmeans聚类,若同一类别中有大量相似分数的样本,则认为这些相似分数的样本是可靠的。在模型训练过程中,让模型从可靠的数据集开始学习,再逐渐增加相对不可靠的数据集,使得模型的性能逐步提高。最后加入无标签数据训练,图像兴趣评价模型的泛化能力得到了进一步优化。
其他文献
学位
在第二次嗜水气单胞菌刺激后第0.5天到第7天,中华绒螯蟹血淋巴细胞对2微米凝胶微球的吞噬率均显著提高(p<0.05),其中,在第二次刺激第12小时后,血淋巴细胞的吞噬率达到最高,为对照组(一次免疫注射生理盐水,第二次免疫注射嗜水气单胞菌,下同)的1.67倍(p<0.05)。另外,在第二次免疫刺激12小时后,中华绒螯蟹血淋巴细胞对1微米凝胶微球的吞噬率显著升高,为对照组的4.08倍(p<0.01);
学位
学位
CRISPR/Cas系统的发现及改造变体为基因编辑带来了革命性的变化,使得大动物基因编辑操作如基因敲除和外源基因的插入等变得高效且精准。目前包括CRISPR/Cas9、CRISPR/Cas12a(Cpf1)以及 CRISPR/Cas13 等在内的基因编辑技术已被广泛应用于动植物中。CRISPR/Cas9和CRISPR/Cas12a可在DNA水平对基因组进行高效操作,持续影响靶基因的表达。而CRIS
学位
学位
学位
网络虚拟化是未来网络重要的研究领域,而虚拟网络映射(virtualnetworkembedding,VNE)是网络虚拟化的一种重要解决方式,其目的是为了解决现有网络架构僵化的问题。虚拟网络映射本质为物理网络和虚拟网络之间的资源分配的问题,即如何高效合理地将虚拟网络映射到物理网络。  大部分虚拟网络映射算法以底层网络的长期收益为目标,未考虑负载均衡以及拓扑属性对虚拟网络映射性能的影响。本文首先对经典
学位
传统的蜂窝网主要通过增加基站数量来平衡有限的频谱资源与无限的用户接入需求之间的矛盾,然而,随着无线数据需求的爆发式增长,大规模的部署基站会造成巨大的资源浪费。对此,中科院计算所提出了一种基于资源池化的集中式蜂窝网络架构——超级基站,通过基站池资源统计复用、模块化软硬件等方式,有效提升系统资源利用率,可以更好的满足5G系统需求。然而,为满足超级基站通信软件平台化和业务处理的性能需求,需要对整个协议软
学位
随着社会经济的快速发展,城市人口和机动车保有量急剧增加,导致城市交通拥堵现象日益严重。交通信息化建设和现代化交通管理模式是缓解交通拥堵的有效方式,但其前提是掌握目标区域内的车辆密度信息,并对该区域进行高效监测。针对目标区域内的车辆密度估计问题,传统的信息采集手段难以确保目标区域内交通信息采样数据的全面性与实时性。因此,本论文研究面向车辆密度估计的多自主无人机最优覆盖控制方法,旨在利用无人机组与地面