半监督协同训练算法的研究

来源 :四川师范大学 | 被引量 : 14次 | 上传用户:Iknowyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的监督学习往往需要大量的带类别标签(Label)的样本对分类器进行训练。然而,在实际应用中,有标记样本(Labeled data)的获取较困难,无标记样本(Unlabeled data)的获取却很容易。因此,如何将大量无标记数据利用起来,提高分类器性能的半监督学习成为研究热点。在半监督学习领域研究的众多分支中,协同训练算法拥有易理解、稳定、收敛快等特点,引起了众多学者的广泛关注,取得了很多研究成果。随着其理论模型的不断完善,基于协同训练算法的应用也逐渐渗透到很多领域,如自然语言处理,图像检索以及模式识别等领域。本文首先对半监督协同训练算法的国内外研究现状进行了介绍,然后,对协同训练算法的发展过程及算法存在的主要问题进行了分析,最后详细介绍了本文在半监督协同训练算法领域开展的工作。归纳起来,本文的研究工作主要表现在以下几个方面:1.针对协同训练算法中分类器差异性小的问题,提出了Tri-training框架下的多视图半监督神经网络算法,算法通过神经网络激励函数的多样性来扩展参与协同训练的神经网络之间的独立性,在一定程度上解决了协同训练算法中分类器差异性小,算法在性能提升上受到限制的问题,同时提高了神经网络的分类精度,也改善了协同训练算法的性能。2.由于无标记数据引入容易产生噪音,从而降低算法性能,本文提出了基于遗传算法的无标记数据选择半监督协同训练算法,算法利用遗传算法的寻优功能间接的协助协同训练算法挑选有价值的无标记数据,以正确有效更新参与协同训练的分类器,防止有噪声的无标记数据引入,从而导致算法性能降低。3.为进一步有效选择无标记数据,减少分类误差,提出了基于图的显式置信度估计半监督协同训练算法,算法结合了基于图的半监督学习算法和半监督协同训练算法的优点。利用有标记样本和无标记样本自身的结构信息,显式计算无标记样本属于各类别的概率,结合三个分类器协同训练隐式地对无标记样本的置信度进行比较。通过显式和隐式双重置信度估计方法,提高对无标记数据选择的标准,防止噪声数据的引入。在UCI数据集的实验验证了以上的方法的有效性。
其他文献
身份识别自古以来就对社会中的每个人至关重要,现代社会中的身份识别要求更加严格,但是由于社会科技的发展,传统的身份识别技术已经不能适应越来越高的安全性的要求了。生物
造波机是与船模试验水池配套的、能够在水池中模拟波浪的大型实验设备,波浪模拟对于船舶、水利、港口工程以及海洋工程等许多领域的研究都有重要的意义。本文从改进水池造波系统性能,提高造波品质,使造波机具有较强的抗击性的目的出发,设计了电液伺服控制的模拟不规则波摇板式造波机控制系统。首先,分析了电液伺服摇板式造波机控制系统,在此基础上建立了伺服放大器、电液伺服阀、阀控液压缸以及拉压力传感器的模型,并进行了合
近年来,随着无线设备和移动计算技术的不断发展,信息空间和物理空间已经相互交融重叠,形成了一个新的研究领域:普适计算。在普适计算空间中,用户可以随时、随地获得数字化的服务。
随着智能设备在近几年的快速发展,GPS、GSM网络和Wi Fi等定位技术得到了广泛应用,很容易对移动对象进行追踪,由此产生了大量的时空数据。如何从这些海量时空数据中有效地发现
无线传感器网络能够感知周边环境信息并收集相应的数据,在许多领域都有重要的应用前景。传统的数据收集一般通过单跳或多跳无线通信将传感器节点采集的数据汇聚到固定的网络
高科技产品开始不断走进日常生活之中,家庭信息化将成为必然趋势。家庭信息化就是通过一种设备将家庭中所有家用电器及电子设备连接至一起,形成一个智能化的家庭网络,这样就
电能表自动化检测线是对智能电表各项性能指标测控的综合检定平台。该平台由各种机械装置、电子元器件、检测线管理软件及控制系统组成,检测线在使用时容易发生故障。因此,搭建针对电能表自动化检测线智能化运维平台,对检测线的日常运维、电能表检定计划以及检定指标数据的分析非常重要。本文首先说明了检测线智能运维平台的研究背景、目的意义及国内外运维平台研究现状。然后对电能表自动化检测线智能运维平台搭建涉及的技术进行
互联网应用规模的迅速扩张,使服务器端所承受的负载压力越来越大,已经远远超过单台服务器所能承受的极限,从而致使集群技术来承担这种信息需求。目前,大型互联网公司普遍采用
计算机及网络技术、半导体材料及电子制造技术的快速发展促进了微机电系统、片上系统、无线通信和低功耗嵌入式技术的快速发展。本文通过对ZigBee无线传输技术、CC2530芯片和ADXL345三维加速度传感器的研究,设计了一种速度无线测量方法,实现了工业环境中对大型低速间歇式运动机械的速度测量。论文中,首先对近年来比较成熟的几种无线通信技术进行了探讨,特别针对应用最为广泛的ZigBee技术做了进一步的分
随着互联网和电子商务的快速发展,信息过载已经成为目前互联网用户所面临的一个严峻的问题。如何让用户在海量的商品中能快速找到自己喜欢的商品,是每个电子商务网站急需解决的