基于多标记学习的图像标注关键技术研究

来源 :山东师范大学 | 被引量 : 2次 | 上传用户:clond
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术和移动拍照技术快速发展,网络空间中的图像信息爆炸式增长。为满足人们对图像的检索,研究人员提出了大量的图像检索算法。图像检索方法可以分为三类,分别是基于文本的图像检索、基于内容的图像检索和基于语义的图像检索。其中,基于语义的图像检索系统中的核心技术是图像的语义标注。本文的重点研究了图像标注的技术问题。研究人员已经提出了大量的图像标注算法,但语义鸿沟问题、维数灾难问题、数据不平衡问题等重要的问题仍然没有从根本上得到解决。针对上述问题,本文基于多标记学习框架,改进了四种经典的机器学习方法用于图像标注,取得了很好的实验效果:1.基于懒惰学习的多标记图像标注算法ML-KNN在计算贝叶斯最大化后验概率时,只使用了主样例与近邻样例在数量上的相关性,没有考虑主样例与近邻样例在距离上的相关性。本文把上述两种相关性同时考虑,提出了一种改进的基于懒惰学习的多标记图像标注算法ML-WKNN。在Image和Yeast两个经典多标记数据集上的实验结果表明,ML-WKNN算法比其它四个经典的多标记算法的总体标注效果更好。2.在基于朴素贝叶斯理论的多标记朴素贝叶斯算法MLNB中,使用主成分分析方法预处理样本的属性特征。处理之后的样例属性之间是不相关的,但是仍然不能满足朴素贝叶斯算法需要属性特征相互独立的要求。本文中我们使用独立成分分析方法来预处理样例的属性特征,处理之后的样例属性特征之间是相互独立的,符合朴素贝叶斯算法对于样例属性特征的要求。在Image和Yeast两个经典多标记数据集上的实验结果表明,IMLNB算法的在多个评价指标上的综合标注效果比其它四个经典多标记算法更好。3.基于改进构建类属属性的思想,本文提出了一种改进的多标记图像标注算法LTFML。LTFML只使用每个类标记的正样例为每个类标记构建类属属性,并使用一种新的评价函数对不同类属属性聚类簇的进行加权。在Image和Yeast两个经典多标记数据集上的实验结果表明,LTFML算法的标注效果在五个评价指标上整体最优。4.针对多标记图像标注中常见的数据不平衡问题,本文对Bagging算法进行改进,提出多标记图像标注集成学习方法BM3。该算法使用Bagging方法对每个类标记的正负样例分别抽取相等数量的样例,然后组成规模相对较小且正负样例完全平衡的训练子集。对基分类器的预测结果集成时,本文使用了一种新的融合策略—最小最大模块化方法。在Image和Yeast两个经典多标记数据集上的实验结果表明,3BM算法整体标注结果比BR等经典的多标记算法的结果更好。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本文通过对海砂中氯离子侵入对钢筋产生的电化学锈蚀过程以及海砂净化过程的探究,对海砂净化程度对混凝土中钢筋锈蚀的影响进行了综合性地描述总结。
生态学是高等院校普遍开设的一门重要的基础课程。为了提高教学质量,尝试将'问题吸引法'教学模式引入课堂教学过程当中,即每次课堂授课前,先围绕教学内容,创设若干问
25寸及以上彩色电视2005年9月全国重点大商场主要家电品牌市场占有状况$中华全国商业信息中心 25 inch and above color TV Sep 2005 Market share of major home appliance
<正>市委党校、上海行政学院2017年春季班今天开学了。首先,我代表市委,代表市委党校、上海行政学院,向各位学员表示热烈的欢迎,向全体教职员工表示亲切的问候!去年,党的十八
<正>自20世纪初开始实施心脏瓣膜手术以来,随着体外循环技术的发明及成熟、各类人工瓣膜的研发及应用,通过近百年发展,心脏瓣膜外科已从最初二尖瓣狭窄闭式分离术等发展为各
目的采用离子色谱法测定脑膜炎球菌多糖蛋白结合疫苗中的1,4-丁二胺含量,并对方法进行验证。方法采用Ion Pac CS17(4 mm×250 mm)分析柱,上样量25μl,以10 mmol/L甲基磺酸淋
视频序列中的目标跟踪问题是计算机视觉领域的研究热点,它融合了机器学习与模式识别等领域的研究成果,在视频监控、智能交通以及现代军事中得到了广泛的应用。针对目标跟踪问
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield