多标记迁移学习算法改进以及在早期阿尔茨海默病诊断中的应用

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:tingyuan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记迁移学习旨在利用相似领域内的多标记样本辅助训练目标领域训练分类器。当前的研究主要关注如何缩小领域间的差异性,通常在特征子空间中缩小跨领域数据的概率分布差异,从而学习共性特征表示。现有的多标记迁移学习算法总是暴力挖掘所有标记的联系,这在理论上虽然充分利用了不同标记间的相关性,拟合现实模型,但是当标记数量过多时,模型面对的待训练类别数会呈爆炸性增长。对于数量一定的小规模训练样本,使得每个类别对应的训练样本数量进一步减少,类间的样本数据分布不平衡问题凸显,大大增加了分类器的训练难度。此外,现有多标记迁移学习算法通常采用缩小领域间的边缘概率分布来映射公共特征子空间,但仅仅缩小边缘分布无法满足所有场景的应用需求,当边缘分布差异较小但类间差异较大时,已有算法无法适用此场景,本研究对上述技术问题展开研究。同时,在基于多模态的早期阿尔茨海默病(Alzheimer’s disease,AD)诊断中,有标记信息的样本稀缺,因此多标记迁移学习常常将晚期阶段患病特征迁移至早期诊断中。据研究表明,皮质厚度反映了不同脑区的萎缩情况,具有较强判别能力。但是,引入皮质厚度会带来一定的冗余特征,已有算法无法解决特征迁移时的冗余问题,本文改进先前算法并将其应用到早期AD诊断中。本论文贡献如下:(1)针对领域间标记空间过大问题,设计了一种基于标记空间分解的多标记迁移学习学习算法(L-MLTL)现有的多标记迁移学习算法忽略了标记空间过大带来的学习难题,设计了基于标记空间分解的多标记迁移学习方法(Multi-label Transfer Learning Via Label Label Space Decomposition,L-MLTL),利用标记一致性矩阵分解技术(Label Consistent Matrix Factorization,LCMF)将原始标记空间分解为一个完备标记矩阵和一个编码矩阵,并利用编码矩阵替代原始标记矩阵进行特征迁移。通过在基准数据集Core15K、ESPGame和 Iaprtc12 上的迁移实验,L-MLTL 的 Hamming loss、Ranking loss、Coverage 和 Average Precision指标优于对比算法约4.2%、9.8%、2.6%和1.1%。值得注意的是,在基准数据集上,当标记数量大于4时,L-MLTL的分类性能将优于已有算法。结果表明,编码矩阵与原始标记矩阵相比,具有更优的判别能力,这将减轻模型的学习复杂度。(2)针对现有多标记迁移学习算法泛化能力较差的问题,设计了一种基于联合分布的多标记迁移学习算法(J-MLTL)现有多标记迁移学习方法通常度量领域间的边缘概率分布而导致算法适用范围受限,因此本文设计了 一种基于联合分布的多标记迁移学习(Multi-label Transfer Learning via Joint Distribution Alignment,J-MLTL)。通过缩小跨领域数据的边缘分布和条件分布差异来降低领域间的差异,同时利用超图学习加强多标记之间的相关性,从而保证良好的迁移效果。通过在基准数据集Core15K、ESPGame和Iaprtc12上的迁移实验,相比于 S-MLTL、M-MLTL 等算法,J-MLTL 的 Hamming loss、Ranking loss、One-Error、Coverage 和 Average Precision 指标分别提升了 5.7%、11.1%、2.8%、21.6%和 7.2%。实验证明,基于联合分布的度量方法明显优于单一边缘分布或条件分布,有效提升分类精度。(3)解决皮质厚度特征迁移时带来的特征冗余问题,本文设计了一种基于两阶段特征迁移的早期AD诊断方法(2STL)为了从冗余皮质厚度特征中寻找到最有判别性的脑区皮质厚度,进一步提升模型学习效率和分类精度,计了 一种基于两阶段迁移的早期AD诊断方法(Early diagnosis of AD based on two-stage transfer learning,2STL)。本研究在 J-MLTL 的特征子空间中引入最小冗余最大相关性(minimal-redundancy-maximum-relevancy,mRMR)方法剔除冗余特征,为了从冗余皮质厚度特征中寻找到最有判别性的脑区皮质厚度,进一步提升模型学习效率和分类精度,最后利用TrAdaBoost算法进行实例迁移,减少无关样本对分类的影响。对于ADNI数据集,2STL的分类精度为68.6%,优于M2LTL、rMLTFL约2.1%。通过实验验证,移除冗余特征能够提升迁移精度,此外两阶段迁移(特征迁移+实例迁移)的性能更佳。
其他文献
农产品的生产、加工和流通等各种环节对人们生活和社会稳定发展至关重要,农产品供应链网络结构和传播动力学行为复杂,其具有层级多、参与节点众多、节点间关系复杂等特点,是一种典型的复杂网络系统。农产品供应链环节的动态行为使得其具有特殊的脆弱性,以往基于静态网络结构脆弱性分析的模型和方法在应用时无法揭示其动态脆弱性特征。复杂网络级联失效的理论和方法近年来受到了研究者们的广泛关注,并应用于各种社会复杂系统进行
学位
学位
茄二十八星瓢虫(Henosepilachna vigintioctopunctata)是马铃薯、茄子等茄科作物上的重要害虫,近年来有危害加重的趋势,已被全国农技中心列为马铃薯重大病虫害“六病四虫”之一。为了实现茄二十八星瓢虫持续的、长期的综合防治,避免害虫抗药性进化,同时满足减肥减药的植保要求,保障我国马铃薯及其他茄科作物的生产安全和可持续发展,新型杀虫方式的研究开发已成为重中之重。芳基贮存蛋白作
学位
气候变化是全球性的问题,这是由于全球变暖所致。高温和氨氮是造成水生环境恶化的主要因素,影响鱼类生理生化状态和相关基因表达,本文研究了水温和水体氨氮浓度双重胁迫对团头鲂的影响。通过测定血清生化指标(总甘油酯、丙氨酸氨基转移酶、总胆固醇、天冬氨酸氨基转移酶、葡萄糖、丙氨酸磷酸酯、总蛋白质和活性氧)来评估团头鲂(Megalobrama amblycephala)在温度和氨氮双因素胁迫下的血液生理生化响应
学位
水稻(Oryza sativaL.)是我国第一大粮食作物,在我国超过65%的人口以水稻为主食,镉(Cd)污染不但对水稻产量造成极大的影响,对食品安全也造成极大的威胁。研究表明镉在不同水稻亚种籽粒中的积累存在很大的差异,通常籼稻>粳稻,关于水稻镉吸收和转运方面国内外已有大量报导,但关于短时间镉处理对籼稻和粳稻苗期的在转录组水平不同影响的报导很少。本实验以高镉积累型水稻‘Kasalath’和低镉积累型
学位
1-(2-氯-4-吡啶)-3-苯基脲又称氯吡脲或膨大剂,是一种重要的植物生长调节剂,属于吡啶取代脲类细胞分裂素,有促进植物生长,增大果实的作用。本实验室前期在筛选氯吡脲的农药降解菌过程中,发现该化合物具有较广谱的抑菌效果。由于氯吡脲生物毒性较低,如果其具有很强的抑菌活性,则该化合物在治疗微生物感染方面有潜在应用价值。因此,本研究旨在评估氯吡脲作为抑菌剂的潜力,所获结果总结如下。1.氯吡脲对土壤细菌
学位
随着经济的飞速发展,中国百货零售业发展早已不可同日而语。同时实体百货零售业相互间的角逐也到了白热化的阶段。优异的服务质量对于零售商场在激烈的实体竞争中获得更高的市场份额,有着非常重要的帮助,在某种情况上决定着企业的零售业绩。南通文峰大世界作为区域性零售民营企业,随着国内外强势零售企业的进驻,近年来年主营业务收入出现了不同程度的下降。区域内国际零售巨头Y公司的主要竞争优势之一就在于其优异的服务质量,
学位
公司建设财务共享服务中心后可优化财务管理资源的利用效率,与此同时财务工作也将因此受益。但在实践层面,部分企业的财务共享服务中心与传统管理机制并存,服务项目、工作流程多有重叠,财务管理资源重设、浪费现象严重。精细化管理的思想内核是最大化利用要素资源,使投入产出比达到较高水平。合理利用精细化管理理念,可控制财务共享服务中心在实践工作中暴露出的诸多不足。R公司是财产保险行业知名企业PI集团在JS省成立的
学位
谷物是人类重要的食物,含有丰富的淀粉、蛋白质等营养物质,同时也是蛋白类α-淀粉酶抑制剂的良好来源。α-淀粉酶抑制剂(α-amylase inhibitor,α-AI)是一类具有抑制糖苷酶水解作用的物质,具有降血糖、降血脂、减肥及抗虫等作用,在医学与农业方面都有广泛的应用。该文对谷物中蛋白类α-AI的分离纯化、检测方法、功能特性等进行综述,并对其在食品及其它领域的应用前景进行展望。
期刊
用光学显微镜对小檗属14种药用植物茎和叶的粉末进行显微特征观察,同时还研究了叶中脉横切的显微特征。用单因素结合响应面法对粉叶小檗叶中的总生物碱进行提取工艺的优化,并用紫外分光光度法测定小檗属14种药用植物茎和叶中的总生物碱含量。用超高效液相色谱法对小檗属14种药用植物茎和叶中的五种生物碱(黄连碱、表小檗碱、药根碱、小檗碱和巴马汀)进行含量测定。主要研究结果如下:1、叶中脉维管束均为无限外韧型,上下
学位