融合主动学习的半监督技术在图像分类中的应用研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:chenzulong198867
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的迅速发展和因特网的快速普及,数字图像呈爆炸式增长,如何有效地检索、分类、挖掘、利用这些数据成为当今研究的重点,特别是云的出现对从大量图片快速检索带来了非常大的挑战。但是单靠人力进行的数据分析往往要花费非常多的时间,满足不了数据产生速度的要求。因此在这样的背景下,机器学习(Machine Learning)应运产生,机器学习是一种自动化的数据分析方法,不再需要人工过多进行干预。机器学习顾名思义就是利用机器进行学习,主要是利用计算机来模拟人类的学习过程,机器学习是让计算机在现有知识的基础上学习一定的模型,进而进行新知识的延伸。按照学习形式,机器学习可以分为监督学习(Supervised Learning)和无监督学习(Unsupervised Learning),半监督学习是介于监督学习与无监督学习的一种学习形式。机器学习中的无监督学习的分类精度不高,监督学习则需要足够的训练样本,然而标记样本的过程是非常费时费力。半监督学习与主动学习都是利用有标记数据和无标记数据进行学习的学习方法,将主动学习与半监督学习相结合应用到图像分类上,在只给定少量有标记数据的情形下能够最大程度提高分类器的性能。本文主要是在半监督学习的基础上融合主动学习的学习理念,把两种学习方法的优势融合起来。在整个学习过程中既选出置信度最高的样例加入到训练集中,又选出学习器争议最大的样例交给专家系统进行标注,然后加入到训练集中,主要工作如下:1)经典的半监督算法co-training算法要求样本集具有充分冗余视图,即样本集要具备两个不同的视图,这两个视图能够分别训练出一个强分类器。但是这一要求在实际情况中很难得到满足,本文采用集成学习中的Bagging算法和RSM算法将初始已标记数据集分成两个视图,即完成了数据集从单一视图转化成多视图,不再要求已标记数据集具有充分冗余视图。2) 整个学习过程中采用两个分类器,一个分类器的训练集由已标记样例组成,另一个分类器的训练集由已标记样例和部分置信度高的未标记样例及其预测标签组成。在本文中,两个分类器的训练集不同,一个是采用已标记样例组成样本集,另一个采用已标记样例和部分置信度高的未标记样例及其预测标签组成样本集,这样可以从多方面对未标记数据进行描述。3) 本文将半监督学习和主动学习的优点相结合,既自行利用大量未标记样例中存在的相关性,又将两个分类器分歧最大的样例交予专家系统进行标注,这样既可以增大训练集,又可以减少将标记错误的样例加入到训练集中的可能。文中通过实验表明了该模型分类的优越性,也证明了该方法的合理性,具有较强的应用价值。
其他文献
随着信息产业和集成电路技术的进步,嵌入式应用领域得到了蓬勃和快速的发展。嵌入式应用开发的重要特点是满足应用门类的多样化需求,嵌入式应用的多样化主要体现在目标机硬件
自从1895年伦琴发现X射线以来,临床医学的进展很快。超声因为无创、无痛、无放射线损伤、快速、准确、便捷、经济等特点,被广泛的应用于临床检查。超声图像分割是临床医学的一
随着无线局域网得到越来越广泛的应用,研究无线宽带接入互联网的基础理论与关键技术具有重大的科学和经济意义,提供高性能的无线互联网传输层协议是实现无线宽带接入互联网要
随着计算机技术、网络技术、图像处理技术与计算机视觉的飞速发展,智能化视频监控系统使计算机能够代替人对视频监控的信息进行采集,处理和决策。本文主要研究的是如何对高速公
从20世纪90年代中期开始,有关神经网络集成的理论研究受到了极大的关注和重视,大量研究者涌入该领域,理论和应用成果层出不穷,使得神经网络集成成为目前国际机器学习和神经计算界
随着信息技术的发展和网络应用的日益普及,各级机关单位纷纷开展电子政务信息系统建设以提高办公效率和信息资源共享利用率。目前,电子政务信息系统大多是以Web方式在互联网
计算机视觉是目前兴起的一门具有发展潜力的研究学科,它是视觉测量技术的理论基础,具有模拟生物视觉系统的功能,同时,它的功能超越生物视觉,可以获取物体空间信息。双目视觉
无线通信技术和因特网技术的飞速发展与渐趋融合,使移动商务得到蓬勃发展。利用移动商务,人们能突破时空限制,随时随地获取关键信息。在面向个人应用的同时,移动商务也逐渐向
在研究中间件、中间件的通信机制、消息中间件技术、XML和JMS规范的基础上,主要研究符合JMS规范的消息中间件的设计和实现方法,并使用XML作为消息的传输格式。给出了消息中间
海水的绘制一直是计算机图形学中的热点研究问题之一。在3D游戏、电影、虚拟现实、飞行模拟、地理信息系统等许多领域,都需要绘制有不同程度的真实感的水面场景,并且大多数的