基于标签局部相关性的标签降维算法

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:arieswys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类问题中,一个样本有多个类别标签,且标签与标签之间有一定的相关性,使得多标签分类问题难以通过简单的分类器处理。有一类算法通过对标签空间进行降维的方式,消除标签之间的相关性,从而解决多标签分类问题,这类算法称为标签降维算法(LSDR)。LSDR通常使用编码矩阵来保留标签之间的相关性,并将标签投影到彼此独立的维度较小标签空间。然后,将特征和相应的降维后的标签送入学习器进行训练。学习器对于一个新的未知样本做出的预测还需要进行解码以恢复原始标签空间,才能得到最终的预测结果。本文基于标签局部相关性,构建了两个运用于多标签分类的标签降维模型。(1)基于最小标签局部方差的显式降维模型ML-mLV。(2)基于最小标签局部距离重构的隐式降维模型ML-mDR。ML-mLV通过最大化标签全局方差,最小化标签局部方差,同时结合Hilbert-Schmidt独立性准则,融入了特征信息,求得一个正交的编码矩阵,利用编码矩阵实现标签的降维,从而形成了有编码矩阵的显式标签降维模型。实验部分,本文选取了PLST、CPLST、MLC-BMa D、Fa IE四个对比算法,与本文提出的ML-mLV算法在四个多标签数据集上进行对比实验。本文提出的ML-mLV取得了最优的实验结果。ML-mDR利用拉普拉斯特征映射的思想,最小化标签局部距离重构误差,同时最大化标签全局方差,直接求得原标签在降维后的标签空间中所对应标签,从而构建了无编码矩阵的隐式标签降维模型。实验部分,本文在六个多标签数据集上,将ML-mDR与PLST、CPLST、MLC-BMa D、Fa IE四个对比算法进行对比实验。实验结果表明,本文提出的ML-mDR具有更优的性能。
其他文献
《庄子》是我国重要的先秦典籍之一,千百年来对我国文学、哲学和审美的发展产生了深远影响。然这些研究必立足于对《庄子》文本的准确解读。通过比对各家注本,我们发现长期以来存在着较多在注解上有争议的疑难词句。究其缘由,盖前人在作注时对传统训诂学的声训、形训、义训等方法使用不当,或从作品传达出的思想、情理等逆推词句的解释,具有较大的主观性,难以使人信服,故对同一句话的理解往往众说纷纭、莫衷一是。本文采用传统
闪电与人类生存活动密切相关,是自然界中经常发生的瞬间放电现象,由于其发生时间短,且伴随有高温、高压、巨大冲击波和强电磁辐射,对人类生产生活产生巨大影响,因此研究闪电的物理特征对森林防火、高压运输、航空航天等电子领域起着重要作用。闪电梯级先导是闪电的初始阶段,为闪电开辟通道,是研究者们最为关注的课题。通过光谱观测和分析能够得到闪电先导通道内部的微观物理信息,是获得其物理参数的有效途径。由于先导发光较
近年来,随着城市用地的日益紧张和停车难等问题的突出,我国带有地下室式的建筑越来越多。通常情况下,出于对结构的完整性、工期以及成本等方面的考虑,地下室墙体的混凝土采用
瓦西里·瓦西里维奇·洛扎诺夫(1856-1919)是俄国白银时代的宗教哲学家、批评家以及文学家。《落叶》是他晚年的重要作品。本文主要通过归纳和分析洛扎诺夫在《落叶》中体现出的宗教观、生命与死亡观、社会观及文学观探究他整个思想体系与其宗教思想之间的关系。洛扎诺夫的其他作品是本文的辅助补充和佐证文献。本文基于洛扎诺夫的个人生活总结了写作对他的意义,并围绕他对果戈理及普希金的理解阐释了他的文学观。他认为
热应激影响奶牛生产性能与乳腺健康,给奶牛养殖业带来了巨大的挑战。长链非编码RNA(long non-coding RNA,lnc RNA)已被证实参与多种生命活动。为探究热应激对奶牛乳腺lnc RNA表达的影响,本研究通过高通量测序手段,获取了热应激奶牛和非热应激奶牛乳腺组织的lnc RNA表达谱,并对筛选出的lnc RNA进行了相关功能验证以探讨lnc RNA在奶牛热应激中发挥的作用。主要研究内
为研究水分胁迫对赤霞珠葡萄不同叶龄叶片光合特性的影响。本试验以3a生赤霞珠葡萄为试验材料,以黎明前叶片水势反映胁迫程度设置对照、中度和重度3个水分处理,研究赤霞珠葡萄新梢基部(叶1:4月20日展叶)、下部(叶2:4月30日展叶)、中部(叶3:5月10日展叶)、中上部(叶4:5月20日展叶)、上部(叶5:5月30日展叶)叶片随叶龄的增大光合特性的变化规律及水分胁迫对其的影响。结果表明:1.赤霞珠各部
脉冲星计时阵(PTA)的主要目的之一是探测各向同性、随机的引力波背景(GWB),为了研究历表、参考时等引起的误差是否会对PTA探测GWB带来影响,以及影响的大小和程度,我们开展了
近几十年来,基于布里渊光时域分析(Brillouin optical time domain analysis,BOTDA)的分布式传感系统以其长距离传感、高分辨率和能同时获得所测量信号在整根光纤上的空间分布情况等优势,被广泛应用在基础设施的结构健康检测上。在传统的BOTDA系统中,诸如信号产生、数据采集和数据处理等功能是彼此分离的,这一方面使系统的集成度降低,另一方面导致系统由于仪器的数据接口不
随着国际油价的地位徘徊和成品油的需求回落,炼油产能过剩日渐突出,国内外炼油建设项目减少,使工程建设市场竞争日趋激烈,工程项目管理的作用愈发重要,作为项目管理核心之一
背景:牙列缺损是指牙列中有数目不等牙齿缺失,同时仍余留不同数目天然牙,常因严重龋病、根尖周病和牙周病等导致,是老年人常见口腔疾病之一。随着医疗水平和生活质量提升,我国人口老龄化程度日趋严重,据第四次全国口腔健康流行病学调查结果显示,老年人口牙列缺损发病率依旧不容乐观,其中近40%患者未能及时修复,严重影响患者的口腔功能和生活质量。因此,为了恢复患者正常口腔功能,改善其因牙列缺损造成的不美观状况,在