半监督多标记特征选择算法研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:binguo404
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域中,传统监督学习假设一个学习对象只对应一个概念标记。而在现实生活中,一个学习对象可能同时隶属于多个概念标记。比如,一部电影可以同时被标记为科幻、动作和美国等;一张图片也可能被同时标记为木屋、树木、草坪、小路等。多标记学习是研究此类问题的一种学习框架,受到许多研究者的青睐。然而,现有多标记学习算法存在两个问题:一方面,标记个数多且语义信息复杂,标注多标记数据需耗费大量人力和时间,难以获得大量已标记数据;另一方面,多标记数据集的特征呈现维数高的问题,无关、冗余特征将会损坏分类模型的泛化能力,因此,需要对高维多标记数据进行降维。本文针对上述两个问题提出了一种半监督多标记特征选择算法(semi-supervised multi-label feature selection,SSMLFS),其基本思想是在半监督学习框架下根据原始特征描述和与之相关的标记之间的依赖性和局部结构保持能力来评价特征,主要内容如下:首先,基于HSIC(Hilbert-Schmidt Independent Criterion),计算RKHS(Reproducing Kernel Hilbert Space)上Hilbert-Schmidt交叉协方差(互协方差)算子范数,从而得到独立性判断准则,即HSIC经验估计值,并以最大化该估计值为优化目标。其次,同时考虑已标记数据和未标记数据。先构建一个基于样本的邻接图,然后使得样本的局部结构保持能力达到最大。最后,计算每个特征的重要程度。在6个数据集上基于6种不同的评价准则的实验结果验证了SSMLFS算法的有效性。
其他文献
有机发光二极管(organic light-emitting diode,OLED)是一种视角广、发光亮度高、响应迅速、效率高、可弯曲的新型平面显示设备。近几年,为了进一步提高器件的性能和实用性,研究人员对早期的OLED器件做了许多改进,其中使用掺杂发光层和新型光电材料都是常见的手段。在发光过程中,OLED发光层内会产生各种自旋对态(极化子、激子等),并产生自旋对态间的相互转化,这些过程都会对发光
随着大数据时代的到来,实时处理大规模数据流成为亟待解决的重要问题。为了满足实时性的要求并确保处理数据流的稳定性,很多企业用户采用了各种分布式流处理系统架构或平台,它们提供的基本功能是将流处理应用程序作业任务分配给当前可用的物理资源并在这些资源之间路由数据。对于很多分布式流处理框架来说,如何将应用程序中的任务调度到物理集群上是主要解决的问题之一。目前分布式流处理系统关于延迟约束的调度算法很多关注的是
大数据浪潮席卷各行各业,新闻业也未能幸免,传统新闻生产方式经历挑战,变革蠢蠢欲动。当计算机技术与新闻变革相逢,由算法驱动的新闻应用向社会展现了新的新闻生产模式,受众
最近几年,钙钛矿作为一种新兴材料受到极大的欢迎,对其的研究发展十分迅速。因为这种材料具有良好的光吸收性,更少的非辐射性复合,溶液加工方便,较低的载流子陷阱密度等特点,有望应用在太阳能电池,有机发光二极管,光电探测器,激光等领域。本文主要研究基于有机和无机杂化钙钛矿的发光二极管。在制作发光二极管方面,可以通过改变卤素阴离子种类来调节发光波长,例如CH_3NH_3PbBr_3发光波长为520 nm左右
目的:探讨运用扩散加权成像(diffusion weighted imaging,DWI)的ADC值评估骨挫伤、骨性关节炎骨髓病灶的价值;探讨21-44岁正常人群与45-69岁正常人群的膝关节骨髓ADC值是否具有差异及正常膝关节骨髓的ADC参考值。方法:招募具有确切膝关节外伤史且病史不超过3个月、MRI平扫结果符合骨挫伤影像学表现的患者17例,符合膝骨性关节炎临床表现及影像学表现且MRI平扫能检出
在互联网技术高速发展的今天,人们的生活和面对问题的解决方法也在相应地发生着变化,随着大量研究学者对计算机智能算法的不断深入研究,计算机智能算法被应用到了各个领域,例如:图像识别、语音识别以及自然语言处理等领域,并且取得了一系列显著的成果。近些年来,人工智能技术开始应用在医学领域,并在医学文本处理方面得到了一些较好的结果。不过在医疗图像方面,由于稀有疾病患病率低以及会涉及到患者的个人信息等原因,使得
在传统粒子群优化算法(PSO)中,每个粒子利用个体最优经验和群体最优经验更新自己的速度和位置。这种学习策略简单、容易实现,但是容易出现“震荡”和“前进两步,后退一步”的现象。因此设计有效的学习策略避免上述现象的发生,进而提高搜索效率是PSO研究中亟待解决的问题。为了保护粒子潜在的优良信息,本文提出了一种维度学习策略(DLS)。该学习策略利用每个粒子的个体最优经验发现和整合群体最优经验的潜在优良维度
约束规划是人工智能领域的重要分支,在产品配置、任务调度、组合优化等问题上有广泛的应用。约束规划为实际问题提供了一种简单有效的解决方案,首先通过约束建模将实际问题抽象成统一的约束模型,然后利用约束求解技术对模型进行求解。结合相容性技术的回溯搜索算法是约束求解的主流方法之一,通过相容性技术对回溯搜索过程进行剪枝可以提高问题求解的效率。表约束是一种重要的约束的表示形式,通过枚举支持或者禁止元组将约束以表
有机发光二极管(organic light-emitting diodes,OLEDs)具有制备过程简单、来源材料价格低和超薄等优势,正逐渐被应用于电视屏幕、手机屏幕以及手环等产品中。通常在OLEDs中只有25%的单重态激子直接跃迁发光,剩下75%的三重态激子只能以非辐射跃迁的形式把能量释放,使器件的内量子效率在理论上最大不超过25%。另外,由于OLEDs本身就具有寿命较短和性能低下等特点,使得O
机器学习是人工智能的核心,它使机器可以像人类一样变得“智能”,并且在保证获取新的“知识”的前提下,他会重新整合已有的“知识体系”使其更加完善,以保证提供更好的服务。本文是在基于深度学习处理器的编译器上实现内存层级的添加,本文的主要实现过程如下:研究、理解LLVM编译器实现原理,明确了LLVM编译器属于三段式编译器,它是高度模块化的编译器,前端与后端可以任意匹配。LLVM可以生成与语言无关的中间代码