基于标签传播的半监督偏标记算法研究

来源 :厦门理工学院 | 被引量 : 0次 | 上传用户:ytw2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督偏标记学习结合了两种困难的学习范式,一种是半监督学习,另一种是偏标记学习。由于互联网技术的发展,数据量急剧增加,很难获得准确的数据集。通常情况下,一个示例只与一组标签大致匹配,而大多数数据没有标签。由于传统的学习算法在不准确标记的数据集上的泛化性能较低,所以近年来提出了一种新的学习框架,即半监督偏标记学习框架。但是,半监督偏标记学习的解决方案中依旧存在一些问题,比如:半监督偏标记算法(SSPL)忽略了偏标记样本的候选标签集中的噪声会污染未标记样本;基于置信度边际最大化的半监督偏标记学习算法(PARM)在处理高维特征数据时,存在计算成本高的问题。本文的贡献主要包括以下两部分:(1)研究了基于注意力机制的半监督偏标记学习算法在网络图像分类的应用。本文提出了基于注意力机制的半监督偏标记标签学习算法(ASSPL)。该方法尝试将注意力机制引入半监督偏标记算法中,利用注意力更全面地考虑了样本的分布,以更好地进行标签的传播和分类,从而获得更准确的分类结果。所提出算法的贡献包括:将注意力机制引入半监督偏标记学习中,为半监督偏标记学习提供了一种新的思路;ASSPL是一种基于注意力机制的标签传播方法;实验验证了该方法在网络图像识别中的有效性。(2)研究了基于可靠标签传播的半监督偏标记学习算法。本文提出了基于可靠标签传播的半监督偏标记学习算法(See PLL)。现存的算法没有考虑到消歧义的效果很大程度上受到候选标签集的假阳性标签的影响。候选标签集中的假阳性标签除了真实标签外,其本质是噪声。在迭代过程中,被识别的真实标签可能成为假阳性标签,而真实标签的建模输出将被假阳性标签所淹没。基于这种情况,提出了一种基于可靠标签传播的半监督偏标记学习算法,可以更好地利用未标签数据,减少偏标记中标签集噪声的影响,提高算法的预测精度。所提出算法的贡献包括:See PLL将消歧的可靠标签传播到未标记数据集,使未标记数据得到更准确的标注;See PLL减少模型参数以在嘈杂的数据集上呈现稳健的性能;See PLL提供了一个优化的解决方案,适应符合现实世界的应用场景。在真实数据集上的实验结果验证了该算法的有效性。
其他文献
视觉目标跟踪在计算机视觉领域一直是一个基础并活跃的研究课题,其在视频监控、无人驾驶、人机交互以及无人机等方面有着广泛的应用。得益于深度学习和大数据的发展,以及卷积神经网络在目标跟踪领域的应用,目标跟踪在过去的几年里取得了显著进展。特别地,基于孪生网络的跟踪算法通常能够在准确性和速度之间取得较好的平衡,因此得到了更广泛的关注。孪生跟踪模型根据测试过程是否更新模型,可以分为在线跟踪器和离线跟踪器。前者
学位
现有地坪磨抛机存在依赖人工、效率低的问题,且作业中存在机械性严重、噪声污染、粉尘污染等问题严重危害工人身心健康,因此研究自主导航地坪磨抛机提高工作效率降低人力成本,对促进建筑行业发展具有重要意义。本文依托泉州市科技计划项目“基于激光雷达的自主导航地坪磨抛机研发”开展基于激光雷达的自主导航地坪磨抛机算法研究工作,主要包括粉尘环境下SLAM建图、全覆盖路径规划、机器人运动控制算法的研究。本文的主要工作
学位
自2021年6月入驻B站以来,人民日报将国内外新闻资讯、时事热点与B站特有的二次元文化生态相结合,形成了深度融合的传播策略:依托B站独特的弹幕体系、评论区文化,实现主流话语符号的意义共享与再生产;通过征用传统文化符号资源、叙述民族国家历史,唤醒泛二次元用户群体的集体记忆,实现其身份确认;将严肃议题与亚文化元素结合,获得圈层内用户的认可和支持;联结B站兴趣圈层意见领袖,与知名UP主联合创作。这些举措
期刊
电压暂降是配电网中最不可避免的电能质量障碍之一,极有可能给工业用户带来经济损失。准确辨识电压暂降的原因及定位故障源,有助于及时制定干扰处理计划,明确责任,有效地减少经济损失。常见电压暂降类型有:单相接地故障、相间短路故障、大容量电动机故障、雷电冲击引起的故障,在上述背景下,如何利用电压波形监测来提升电压故障类型识别以及故障源定位成为迫切解决的课题,针对配电网监测系统采集的故障波形图不够丰富,生成的
学位
流域经济是以河流为纽带的一个区域经济范围或者一个系统,是资源和经济的耦合。在流域经济视角下,四川白酒产业还存在较大的成长空间。本文分析了在四川众多河流组成的长江上游流域经济系统中,四川白酒产业的发展规律、方向和重点,并以此重构了四川白酒产业的空间结构。同时,本文认为从流域产业开发的视角来看,四川白酒产业在新的空间结构下,需注重推动产业由金字塔型向橄榄型转变,推进跨区域、跨产业的企业交流合作以及加强
期刊
电力行业、矿业和建筑业等行业在生产过程中频有事故发生,导致人员伤亡和经济损失。将目标检测和行为检测技术应用到安全作业视频监控系统,能够可靠地、有效地解决上述问题。因此,本文开展作业人员违章行为检测技术研究。本文主要围绕违章目标检测技术和违章行为检测技术展开研究。从现实违章行为监控的场景特点和实际技术需求出发,特别针对刚性目标的复杂背景、柔性目标的锚框定位困难以及违章行为检测中正、负样本不均衡等问题
学位
目的:观察金锁固精丸加味方对糖尿病肾病大鼠的保护作用。方法:将糖尿病肾病大鼠随机分组,分为中药常规剂量组、中药加倍剂量组、雷帕霉素组及模型对照组,并设置正常对照组。在造模给药后第12周,观察各组大鼠的一般情况,检测空腹血糖(FBG)、血尿素氮(BUN)、血肌酐(SCr)、总胆固醇(TC)、24 h尿白蛋白定量(24 hUAlb)和血清白蛋白(Alb)水平,并用过碘酸-雪夫反应(PAS)染色光镜下及
期刊
随着科技的飞速发展,图像、语音等多媒体数据的体量也在随之急速增长。面对着日益增大的数据存储需求,价格便宜且方便快捷的云存储服务迅速占领了市场。为了避免云端的存储数据被泄露,最直接的解决方案是将数据先加密再上传云端。在密文检索技术还没出现的时候,用户需要某个指定文件就只能把云端所有数据都下载到本地再一一解密后查找,这造成资源极大的浪费。因此实现对云端加密文件的检索是一个有意义的研究课题。当下,基于文
学位
随着深度学习的不断发展,利用像素级标签对任何感兴趣区域分割的自动图像分割的方法层出不穷,且精度也是越来越高,甚至达到了人类识别的平均水平。但像素级标签的要求是每个像素都有对应的标签或者背景,这需要大量标注人员的劳动及财力成本。特别地,医学图像领域的像素级标签需要标注病灶区域、手术工具区域等,这需要额外的领域专家知识成本。因此,像素级标签难获取的问题显得十分突出。本文对自动图像分割技术需要精确且昂贵
学位
电力行业是我国国民经济重要的基础行业,而中高压断路器是配电网中尤为重要的开断设备,它的运行状态对电网能否可靠安全地工作有着直接影响。真空断路器因其优点众多,所以被广泛应用于工业中,而真空断路器的故障可以分成机械故障和电气故障,机械故障占大多数,其中机械故障又可细分成灭弧室故障、绝缘材料故障、操动机构故障等,且作为驱动装置的操动机构产生故障概率要远大于灭弧室和绝缘材料故障,从而影响断路器开关的综合性
学位