弱标签学习方法的研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:cuileidan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多机器学习应用中,由于数据标注过程的高成本,获得完全真实的标签这样强的监督信息是很困难的。因此,能充分利用弱的监督信息并产生好的泛化性能的弱标签学习技术是非常值得关注的。现在,弱标签学习已经被认为是机器学习中最具挑战性的任务之一。根据不同种类的弱监督信息,弱标签学习可以分为不同的类型,比如半监督学习,多示例学习,标签比例学习等等。这些不同的实例类型都有着丰富的应用场景,吸引了很多研究者的目光。如何使弱标签学习方法具有更好的效果和效率,是该研究领域一直在努力的方向。朝着这个方向,本文进行了弱标签学习模型和算法问题的研究,主要的工作和研究成果包括:  (1)针对弱标签学习这个整体进行研究。基于轮换优化的框架,设计了充分利用迭代结构的快速最小二乘支持向量机算法(FLSSVM)。该算法巧妙重排求解最小二乘支持向量机(LSSVM)的线性系统的系数矩阵,使其在迭代过程中保持一致,然后求逆存储在内存中共享。进一步,为了把FLSSVM扩展到大规模问题上,提出了基于不完全Cholesky分解(ICF)和SMW公式的快速算法FLSSVMICF+SMW。在理论上,给出了解的相关近似误差界,并进行了复杂度分析。应用提出的算法到比较典型的两类弱标签学习问题:多示例学习和标签比例学习,在这两个问题上进行了大量的数值实验。在小规模和大规模数据集上的结果很好的说明了方法的有效性和求解效率。  (2)针对弱标签学习中的一类——标签比例学习进行研究。据所知,反向极限学习机(IELM)是第一个将极限学习机(ELM)扩展到标签比例学习的工作。由于基于ELM,它相比现有的标签比例学习方法获得了更快的速度并实现了有竞争力的分类精度。核极限学习机(KELM)将基本的ELM推广到基于核的框架。它不仅解决了基本的ELM中隐层节点数依赖于人工设置的问题,而且比基本的ELM具有更好的稳定性和泛化能力。但是,对于标签比例学习,还没有基于KELM的研究。在本文中,应用KELM提出了标签比例学习的新方法LLP-KELM。与IELM相比,分类精度大大提高。大量的数值实验说明了方法的有效性。
其他文献
甘肃省电力营销计算机管理信息系统经过多年的建设已经取得了很大的成绩,然而,这些系统存在这样或那样的缺陷和不足,该文所研发的甘肃省电力营销决策支持系统是根据当前电力
Garment是一种基于"面向模型的变换型软件开发方法"的语言抽象和封装机制,用抽象程度高的Garment元语言描述领域语言的语法结构及其转换方式,生成该领域语言的编译器,完成了
该文的研究是国家自然科学基金项目"密炼机橡胶混炼流变理论的深入研究及应用"、广东省重点攻关项目"混炼胶质量自动在线监测系统的研制"的一个组成部分.在"MLJ-300密炼机微
该文介绍了主动数据库系统和ECA主动规则.该文分析了SQL语言中表示主动规则的触发器的表达能力的缺点,SQL中的触发器是完全基于事件触发的.但实际上数据库是对于客观世界的某
期权作为一种新型金融衍生产品,由于其非线形损益、权利与义务不对等等特性使其在风险管理、套期保值等方面得到了广泛的应用。2017年,期权全球交易量达到了250亿手。2015年2月
WWW是一个巨大、分布广泛、全球性的信息服务中心,它涉及社会生活的各个方面.每一个网站都在Web服务器上收集了大量的Web日志,这些日志记录了Web用户对Web页面的每一次访问过
我们首先对一般的有限非交换单群的4度Cayley图的自同构群进行了研究.对绝大多数有限单群的一大类4度Cayley图证明了它是正规的.以此为基础,我们构造了交错群A、Lie型群Ree和
该文首先介绍了认证码和带仲裁的认证码的概念,讨论了认证码研究的主要问题和目前取得的主要成果;然后介绍了有限域上辛几何的基本概念及辛几何中的一些计数定理,并利用辛几
该文首先综述了同伦单(HM)、同伦满(HE)的研究方向和研究成果,然后引入了覆叠同伦单(CHM)、覆叠同伦满(CHE)的概念.由于覆叠同伦单(满)是同伦单(满)的真推广,研究人员就致力
该论文致力于把建立在实数域、复数域的统计分析理论推广到四元数体上.论文第一章,简要介绍一下论文的研究的背景.第二章给出了该论文后续章节中常用的有关四元数矩阵代数的