增广信息学习

来源 :南京大学 | 被引量 : 0次 | 上传用户:lrg1169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统监督学习通常假设训练数据类别标记恒定、特征信息充分、样本充足。但很多现实的机器学习任务不满足这些假设条件,导致学习效果不尽人意。为此,本文考虑通过引入增广信息(Augmented Information)进行学习。增广信息包括传统静态学习中未考虑的额外信息以及动态学习过程中出现的新信息。本文主要工作如下:1.提出了一种训练集标记增广学习方法GLOCAL。该方法利用标记关系对多标记训练数据中部分缺失的标记进行恢复补全,但无需额外的先验知识来指定标记关系矩阵,而是在优化过程中同时习得全局和局部标记关系。实验验证了本文方法的有效性。2.提出了分别用于静态、动态测试集标记增广学习的方法DMNL和MuENL。DMNL通过最小化多示例包级损失和聚类正则化项,预测静态测试集中的多个新标记;MuENL通过特征和预测值训练新标记检测器并建立鲁棒模型,以检测动态新增的标记并对其建模。实验验证了本文方法的有效性。3.提出了一种多示例特征增广学习方法AMIV-lss。针对数据特征信息不足的学习问题,将额外获取的带噪信息形式化为增广多示例视图(AMIV)作为样本的特征增广。AMIV-lss通过在两个异构视图之间建立公共隐藏语义子空间,减少噪声影响,提升学习性能。实验验证了本文方法的有效性。4.提出了一种多视图样本增广学习方法OPMV。OPMV通过对每个样本优化视图一致性约束下的组合目标函数,即可随着新增多视图数据高效更新模型,并能够利用视图之间结构提升学习性能,而无需存储整个数据集,避免从头进行训练。理论和实验验证了本文方法的有效性和高效性。5.提出了同时进行标记/特征/样本增广学习的方法EM3NL。EM3NL基于多视图多示例多标记深度卷积神经网络,利用额外文本描述作为图片的补充(特征增广),能够检测新标记(标记增广),并可根据动态增加的样本即时更新模型(样本增广)。实验验证了本文方法的有效性。
其他文献
企业在JIT应用上经常存在一些认识上的误区,影响到JIT的实施过程和作用效果。这些误区主要有:JIT管理的目标就是绝对"零库存";JIT只是生产方面的管理,由生产部门负责;在JIT下
500 kV输电线路作为江西省主网架,每年都要发生多次事故跳闸,对省网的安全稳定运行造成威胁。文章从统计的角度,对江西省500 kV输电网络在2008年至2012年度输电线路事故跳闸
为获得具有优良观赏性状和农艺性状的细叶百合四倍体植株,并为百合的新品种选育提供性状优良的杂交亲本,以细叶百合种子(2n=2x=24)为试验材料,通过秋水仙素浸泡种子的方法,研
南昌市公安局筷子巷派出所在社区警务建设的经验有:第一,推行"四个创新",即创新勤务工作模式,推进警务实战化;创新路面巡防机制,坚持警力跟着警情走;创新考核奖惩机制,实现警
名著与花鼓戏———《原野情仇》导演构思《原野》是曹禺先生的一部重要著作,近年来,话剧、歌剧、京剧、电影竞相改编上演,形成一种耐人寻味的艺术现象。作为曹老家乡的艺术团体
<正>前情提要:跟着韩迎走上江湖,又拜武林高人乔空山为师。师徒两人五载走遍天下,宋域沉学得一身好本领。在赶回宣州见母亲的途中,宋域沉遭遇船难,流落至仙游观。化解了仙游
目的建立刺激声间隔觉察测试(Random Gap Detection Test,RGDT)方法并对健听青年人、感音性聋患者及听神经病患者的听觉间隔觉察阈(Gaps-in-Noise,GIN)进行比较和分析。方法
为了解由于农业补贴政策的实施可能会导致化肥投入增加及农业面源污染加重的问题,在对农业补贴政策、要素投入和农业面源污染之间的关系进行阐述的基础上,采用2004—2009年分
管理主义和宪政主义是贯穿于公共行政发展中的两条线索。根据学者许立一的看法,管理主义从传统行政学发端就开始影响了公共行政的理论和实践。直到新近发展的“新公共管理运