【摘 要】
:
机器学习已在很多现实任务中取得了成功。成功背后往往依赖于充分的标注数据。然而,在现实任务中,标记数据的获取困难,数据产生的速度远大于数据标注的速度。不依赖充分标记
论文部分内容阅读
机器学习已在很多现实任务中取得了成功。成功背后往往依赖于充分的标注数据。然而,在现实任务中,标记数据的获取困难,数据产生的速度远大于数据标注的速度。不依赖充分标记数据的机器学习框架——半监督学习更为贴近现实任务,但其建模也更加困难。标记传播是半监督学习的主流范式,基于流型假设(同属一个流型的数据具有相同的标记),利用数据内在图结构信息,使数据标记在未标记数据中进行有效传播。虽然标记传播已经得到很多的研究,然而,还存在两个主要的瓶颈问题。其一是标记传播的计算效率问题。标记传播涉及到图结构的矩阵操作,计算和存储开销居高不下,难以适应大型图结构数据;其二是标记传播的性能保障问题。标记传播对图结构的选取敏感,选取不当造成性能不稳乃至严重下降,难以适于可靠性要求高的应用场景。本论文围绕着两个问题,主要取得了如下新进展:1.针对标记传播的计算效率问题,提出高效可扩展的随机标记传播算法SLP。该算法将标记传播目标函数分解为数据节点的损失函数之和,从而可以桥接现有高效随机优化算法的优势加以求解。理论上保证SLP的收敛性和逼近能力。实验上SLP在百万个点,千万条边的图结构上比现有方法加速了5倍以上。值得一提的是,本文方法可以灵活地吸收随机优化算法的新进展不断优化改进。2.针对标记传播的性能保障问题,提出安全图构建算法Sagraph。该算法仅利用数据分布中的稠密区域来构建图结构,可以有效地避免有风险的未标记数据及其图结构。算法采用集成学习的思路,对多个基图进行权值优化。实验结果表明,Sagraph有效提升图构建的安全性,并可解释基图对安全图的影响。除此之外,还在此基础上完成了安全半监督学习的综述。
其他文献
在机械传动领域中,齿轮传动是其非常重要的一种传动形式,齿轮的传动系统一般有以下几个特征:一是长时间高强度的承受着大扭转力,齿轮系统可能会出现一些点蚀、磨损或者出现裂纹等故障;二是系统的复杂性,由于机器的不同,牵引电机、齿轮箱等都有差异,因此齿轮系统的结构也是复杂多样;三是由于非线性因素的影响,使得模型的建立和分析有难度,这样使得齿轮传动系统的模型更加复杂。因此,对齿轮系统进行深入的动力学研究有着重
随着气候变暖等一系列环境问题日益突出,加快新能源替代传统化石能源已成为普遍共识和一致行动。近年来,我国大力推动新能源的发展,目前新能源装机容量已位居世界第一。光伏发电作为最具开发前景的新能源发电之一,具有广阔的发展空间。然而,由于分布式光伏发电受季节、天气、时刻、温度等因素影响,其出力具有波动性和随机性,且随着较高渗透率的分布式光伏接入配电网,带来电压越限等问题,严重制约了分布式光伏的大规模消纳。
局部放电是造成高压电气设备最终发生绝缘击穿的重要原因。对局部放电进行在线监测,并及时排除可能发生的故障,对保障人民生活生产用电具有重要的意义。本文针对光纤传感技术
本研究采用具有低毒性、较大体表面积、良好生物相容性、粒径易于合成从30nm到1OOnm并且易于生物大分子结合特点的中空金纳米粒(Hollow gold nanospheres,HAuNs)作为主要材料;硫辛酸(Lipoic acid,TA)与具有质子海绵效应的聚乙烯亚胺(Polyethylenimine,PEI 2kDa)反应获得聚乙烯亚胺-硫辛酸(PEI-TA)再连接到HAuNs表面,从而构建了
近几年来,过渡金属硫族化合物(TMDs)由于其优异的机械、电学、光学和热学等物理性质而越来越引人关注。MoTe2是TMDs材料的一种,有着各向异性的晶体结构和高载流子迁移率,其吸收光谱范围能覆盖可见光和近红外区域,因此在电子学和光电子学领域有着巨大的应用潜力。到目前为止,大面积合成高质量的MoTe2晶体的技术尚未成熟,这使得了 MoTe2始终难以应用到实际中去。针对这些问题,本论文系统研究了 CV
随着工厂转型升级,工厂自动化、智能化水平不断提升,打造智能化工厂成为许多生产企业发展的新战略。在工厂物流的智能化升级中,物流机器人是其重要一环。物流系统中,通常都是
随着光伏的大规模接入电网和需求响应的深入开展,光伏功率预测和需求侧资源的整合越来越重要。需求侧资源(用户、光伏)是需求响应实施的主要对象,这些资源的调度潜力大,但大
家用空调室外机是空调噪声的主要噪声源,空调室外机的噪声与其振动有着直接的关系。在空调出厂前,空调生产商根据空调室外机的振动对其进行故障检测。在生产线上,主要是依靠
伴随社会的全面发展,居民不但物质生活水平得以提高,消费观念和居住认知也在潜移默化中发生了微妙的调整,居民更加注重健康生活,对体育运动的消费需求相应增加,体育地产的建
降水是地球水循环的重要过程,与水文、气象等过程密切相关,降水研究对于气候变化、水文循环、干旱监测等科学研究都具有重要意义。高精度、高时空分辨率的降水产品对水文过程