基于聚类分析的标签传播半监督学习研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shiyiyiyiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习是机器学习的一个重要分支,在近些年互联网爆炸式发展过程中,出现了大量的数据分类需求,半监督学习可以利用有限的已标记数据和大量的未标记数据来解决数据分类的问题,有效缓解了目前获得大量未标记数据容易而获得大量已标记数据困难的窘困,因此受到了国际机器学习领域的高度关注。作为半监督学习一种主流方法,基于图的半监督学习成为新的研究热点。本文着重研究基于图的半监督中的标签传播算法,分析并优化了标签传播算法。为了使聚集成簇的数据间标签传播较快,并避免把处于决策边界附近的同类已标记样本分割到不同的类中,我们提出了基于聚类分析的图构造预处理方法,通过增加属于同一聚类数据点之间边的权重,提高分布密集数据之间的关联,减小它们在标签传播中被划分为不同类的概率。同时,针对标签传播扩散速度较慢和距离已标记数据较远处数据点分类模糊性较大的问题,提出基于自训练框架的学习方式,在标签传播过程中把未标记数据中置信度较高的那部分数据加入到已标记数据集中,增加标签传播的数据源,提高分类准确率。本文在UCI数据集上进行了实验研究,实验验证了所提算法的有效性和优越性。实验结果表明,基于聚类分析的标签传播在一般情况下优于经典标签传播方法,当已标记数据接近分类边界时优越性尤为明显。自训练标签传播方法与经典标签传播方法比较,速度和准确率都有提高。
其他文献
随着知识化和信息化时代的来临,基于网络的教务管理系统在各大高校中得到广泛的应用,不仅促进了高等教育管理体制的创新,而且也提高了教学管理部门的管理水平。由于高校的教
云计算技术自诞生以来,就不断得到越来越多的关注,因而得到了不断的推动和发展。在云计算技术浪潮的推动之下,虚拟化技术得以驱动和不断发展。虚拟化技术使企业与用户在部署和管
从上世纪70年代以来,计算机视觉一直处于飞速发展之中,特别是在进入21世纪以后,随着计算机性能的不断提升和数字图像获取的廉价化,这一领域的发展尤为迅速。在计算机视觉领域
近年来,随着城市轨道交通的快速发展,地铁、轻轨等列车的行车安全变得日益重要。障碍物检测系统通过辅助驾驶员排查列车前方轨道情况,提高了列车的行车安全性。对于障碍物检
随着移动应用和定位技术的不断发展,基于位置服务(Location-based Services)得到了广泛应用。LBS中(κ)近邻查询为人们提供便利的同时也带来了隐私泄露问题。为确保隐私安全,研
随着云计算技术的发展,软件即服务(Softwareasaservice,SaaS)作为一种新型的软件交付模式被提出。SaaS模式丰富了应用软件的使用方式。人们无需再自己架设服务器、购买软件授
随着社会经济的飞速发展,交通拥挤情况日益恶化,严重影响人们的日常生活。交通警察指挥手势对于缓解因天气原因等引起的交通路口拥挤状况以及无人驾驶等领域具有特别的意义。
近些年,随着网络规模的急剧扩大以及云计算、大数据等新型业务的出现,传统网管系统逐渐地暴露出其在网络管理方面的缺陷。一方面,在传统网络中,为了应对来自网络数据流量爆炸
皮影戏是我国重要的传统艺术形式之一,但近年来受到较少关注,且发展缓慢。论文所依托的项目旨在弘扬传统艺术,保护并发扬中华文化遗产,提出一种在混合现实环境下交互式表演、生成
虹膜识别系统的准确率与图像质量密切相关,劣质的图像会严重影响整个系统的识别率,虹膜图像质量评估的目的,就是筛选出这类图像,保证进入识别系统的图像是符合识别要求的高质