未标记数据相关论文
深度学习的成功依赖于大规模具有精确标记的数据。获取数据真实标记需要大量人力物力,代价昂贵。实际应用中标记通常由众包等廉价......
在互联网技术飞速发展的背景下,信息过载问题成为了用户新的苦恼,也阻碍了互联网业务继续发展。随着数据挖掘技术的进步,个性化推......
传统单标记学习(single-label learning)假设现实世界中的对象仅有单一的语义信息(semantic)。然而现实世界中的对象往往同时具有......
传统的分类问题需要通过大量的标记样本进行学习,以预测未来样本的标记。然而在实际的分类应用中,比如图像分析、网页分类、蛋白质结......
针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高......
提出了一个基于数据挖掘的分布式入侵检测系统,介绍了系统结构框架和主要组件。该系统综合利用了几种数据挖掘算法,可以对未标记数......
由于入侵检测使用的数据集十分庞大,现有的串行聚类算法很难在合理的时间内得到结果.文章提出了一种应用于入侵检测的并行K-均值算......
在传统机器学习算法中,一个样本仅对应单个类别标记。而现实世界中,一个对象往往同时具备多个语义信息。为了对这些多义性对象进行......
数据流分类是数据挖掘领域的重要研究任务之一,已有的数据流分类算法大多是在有标记数据集上进行训练,而实际应用领域数据流中有标......
近年来,面向开放和动态环境的学习范式逐渐受到来自各个领域的关注,类别增量学习(Class Incremental Learning,C-IL)是其中一类重......
传统机器学习技术通过对有标记数据(labeled data)的学习来构建模型,为了获得强泛化能力,通常需要有大量的有标记数据。在很多现实......
在传统机器学习研究中,学习对象仅由一个类别标记来描述其语义概念。而在许多实际应用中,学习对象往往同时与多个语义概念相关联。......
半监督学习是近年来提出的一种新的学习方法,根据学习目的的不同大致可以分为半监督分类和半监督聚类。其主要思想是在已标记训练......
传统监督学习通常需使用大量有标记的数据样本作为训练例,而在很多现实问题中,人们虽能容易地获得大批数据样本,但为数据提供标记......
期刊