一种基于正则化的半监督多标记学习方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:SHAWSHAW11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记学习通常假设训练数据集合有大量有标记的训练样本.然而在许多实际问题中,大量训练样本中通常只有少量有标记的训练样本.为了更好地利用丰富的未标记训练样本以提高分类性能,提出了一种基于正则化的归纳式半监督多标记学习方法——MASS.具体而言,MASS首先在最小化经验风险的基础上,引入两种正则项分别用于约束分类器的复杂度及要求相似样本拥有相似结构化多标记输出,然后通过交替优化技术给出快速解法.在网页分类和基因功能分析问题上的实验结果验证了MASS方
其他文献
在移动计算环境下,无线数据广播是一种可拓展性强、节能、适合用户数量大的信息发布技术.提出了一个在无线数据广播环境下支持空间关键字检索的框架,并提出了一种基于网格索引与倒排表结合的空中索引:IRGI(information retrieval grid index).IRGI的优点是:1)相对文档的大小,索引本身很小,因此可以在一个周期内分布多次索引,以降低访问延迟,增强用户体验效果;2)通过网格索
应用需求的发展衍生各种查询类型,Top—k查询是交互环境下一种重要查询类型.由于数据的不确定性,传统数据上的Top—k查询技术和方法不能直接应用于不确定数据查询.在已有不确定数
Internet资源的动态性使得资源分配问题已成为阻碍Internet资源获得充分利用的一大难题.为方便用户进行Internet应用开发,提出了一个资源动态分配的分布计算模型以及相关的分布
汽车轮毂生产线是典型的制造生产线,大到生产线的总体布局,小到每个硬件设计以及软件设计,需要设计与技术人员不断的探索,提高国内自动生产线的技术水平,满足零件的加工与制
目前,内部控制问题得到了来自政府、企业、市场的高度关注,在这样的背景下,行政事业单位的内部控制体系建设还相对落后,有很大一部分行政事业单位还未能建立一套适合自身发展并且
随着XML数据流的广泛应用,从挖掘XML数据流中发现知识具有重要的理论与应用价值.相比其他频繁模式挖掘,大型XML文档与数据流的频繁子树挖掘面I临困难:XML数据流不可能整体在内存
提出并研究了针对海量多版本文档的加权持久性top-k检索问题.加权持久性top-k检索能够返回在一个限定时间区间内与查询关键词组持续相关的k个结果,并且考虑不同时间区间有不
n-of-N Skyline查询关注于大小为N的滑动窗口上最近任意n(n≤N)个数据对象的Skyline查询结果,为用户的Skyline查询提供了高度的灵活性.在当前大数据的新环境下,数据流呈现出以下2个特征:1)数据流实时大规模高速到达;2)数据流工作负载的急剧变化性.这对n-of-N Skyline查询的实时性以及自适应扩展提出了更高的要求.而目前针对n-of-N Skyline查询相关的研究
为进一步激发小学生了解科普知识、走进科学的兴趣和热情,促进他们掌握科学知识,养成从小讲科学、爱科学、学科学、用科学的良好习惯.5月21日,呼和浩特市科技局、呼和浩特市市委
玄武岩纤维相对于钢纤维具有密度小、韧性好、耐腐蚀、耐高温及较好耐久性等优点。纤维复合材料对增强混凝土力学性能具有较大的应用价值,是近年来土木结构工程领域的研究热