基于组稀疏的子集选择应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：lives63712094

【摘要】

：

从大规模数据中提取有用的信息是人工智能面临的一个主要挑战。作为一种有效的信息过滤和数据摘要手段,子集选择方法通过从大规模数据中选取一个最具信息量的子集来代表整个

【作者】

：

姚亚强

【出处】

：

中国科学技术大学

【发表日期】

：

2004年期

【关键词】

：

代表性子集选择组稀疏多核学习多任务学习机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

从大规模数据中提取有用的信息是人工智能面临的一个主要挑战。作为一种有效的信息过滤和数据摘要手段,子集选择方法通过从大规模数据中选取一个最具信息量的子集来代表整个数据集以减小需要处理的数据规模。此外,子集选择方法也用于改进相关领域中的模型以提高其泛化性能。本文主要研究基于组稀疏的子集选择方法在多核学习和多任务学习中的应用,其中在多核学习中分别利用具有代表性的核来减少不同相似性度量和不同数据源信息的冗余,而在多任务学习中则利用具有代表性的任务来充分发掘任务的潜在聚类结构。首先,本文提出了一种有效的多核聚类方法,其通过选择具有代表性的核函数来增强基础核之间的多样性。具体来说,我们首先设计一种策略从预先指定的核函数中选择一个具有代表性的子集,然后将这种代表性核选择策略合并到多核聚类的目标函数中,最后提出一种交替优化方法来优化聚类成员和核函数的权重。特别地,我们设计了一种定制的优化方法,通过交替方向乘子法来减少优化核权重的时间复杂度。基准数据集和实际数据集上的实验结果验证了所提出的方法的有效性。与现有方法相比,所提方法的优势表明由代表性核选择诱导的正则化可以有效改善组合核函数的质量。接着,基于非负矩阵分解,本文在多核学习框架下提出了一种新颖的数据融合方法来整合来自不同数据源的表示信息以得到高质量的数据表示。不同于直接以凸方式组合多个不同数据源的信息对应的核矩阵,我们引入正则化项来表征这些成对核矩阵之间的相似性以减少不同数据源的信息中存在的冗余。值得注意的是,得到的目标函数可以被视为代表性核选择的变体。接着,一种基于交替方向乘子法的优化方法被设计用于目标函数的求解。我们通过人脸识别任务来评估所提方法,其在三个数据集上的实验结果证明了多样性数据融合的优势。最后,基于假设——多任务学习中每个任务可以通过一些具有代表性的任务的线性组合来表示,本文通过选择具有代表性的任务为聚类多任务学习提供了一种鲁棒的任务分组方法。具体而言,我们通过选择与其它任务共享最多信息的代表性任务来发掘任务的潜在聚类结构。基于共享的代表性任务,相关任务被划分为不同的组,使得组内任务之间可以在一定程度上共享信息。此外,鲁棒的损失函数用于度量每个任务与其代表性任务线性组合得到的表示之间的误差,这可以有效减小异常任务的影响。人工和实际数据集上的实验结果表明所提出的方法优于许多现有的多任务学习方法。

其他文献

全息光镊及相关技术的理论与实验研究

自1986年Ashkin发明光镊技术以来，经过数十年的发展，作为一种重要的光学微操纵工具，光镊技术已被广泛应用于从原子到数百微米级别的各种微观领域的研究。光镊技术本身也朝着多个

学位

光学捕获全息光镊空间光调制器纯相位调制Gerchberg-Saxton算法计算全息图

中国南方汉族哮喘人群IgE高亲和力受体β链基因E237G突变与健康人群的对比研究

Objecti"ef To ana1yze the assoc1at 1on between Fc s RI-- Dgene E237G variant and asthma in the peoD1e of the Haflnat iona1 itv of south china.Methods’ Amp1 1 f

学位

FcεRI-- β geneE237G variantSusceptibility of asthma

下丘脑室旁核内微量注射P物质对哮喘大鼠的神经免疫调节作用

【目的】探讨下丘脑室旁核(PVN)内微量注射P物质(SP)及其拮抗剂S0145对哮喘大鼠的神经免疫调节作用及可能机制。【材料与方法】制备哮喘模型后,静脉注射卵蛋白(OA)溶液激发哮

学位

室旁核P物质哮喘大鼠神经免疫调节

γ干扰素联合甲强龙对人胚肺成纤维细胞的影响

目的:观察γ干扰素（interferon-gamma, IFN-γ）联合甲强龙（methylprednisolone, M-pred）对人胚肺成纤维细胞（human embryonic lung fibroblast, HELF）增殖、胶原合成及转化生长因子

学位

人胚肺成纤维细胞γ干扰素甲强龙转化生长因子β1胶原

基于BIM模型放样及后处理在工程中的应用

本文在介绍BIM应用的基础上,以沈杜泵站工程为例,重点讲解了基于BIM的放样技术应用。首先,本文阐述了基于BIM模型的放样方法,然后结合Revit二次开发技术,研究将放样后的桩基

期刊

BIM沈杜泵站Revit二次开发

水泥企业安全生产标准化创建成效

水泥企业安全生产标准化的创建,使水泥行业安全管理体系从无到有,使水泥行业安全管理工作走向规范化。大型集团率先开展安全生产标准化一级企业创建,截止目前,已有近200家水

会议

安全生产标准化成效

矿山“草根明星”的音乐梦

在搜索引擎里输入“娅琪朵”三个字，便会跳出一长串的搜索结果。“娅琪朵”真名朱娅琪，是山东能源临矿集团古城矿职工，她凭借着自己的音乐才华走红网络，已经有北京的文化公司准备

报纸

近20年来两汉西域治理问题研究

<正>西汉以来,"西域"是作为一个地理概念而使用的,有广义和狭义之分。广义的西域指玉门关和阳关以西的今新疆地区以至于更远的中亚地区。狭义的西域则指玉门关、阳关以西,天

期刊

戊己校尉张德芳汉王朝悬泉汉简

双波段共口径复合制导位标指示器光学系统研究

针对探测环境的复杂性和目标的多样性,单模制导位标指示系统已经处于劣势地位。而双模制导能够较好地匹配探测所存在的问题。现有双模制导主要类型有红外/雷达、雷达/电视、红外/紫外、毫米波/红外、红外双波段等,但在可见/长波红外方面研究较少。红外成像具有穿透能力强、探测精度高,但易受红外诱饵、烟幕、隐身的影响;可见光成像具有分辨率高、光谱信息丰富,但其图像抗干扰能力差。因此,将可见/长波红外复合,既可以在

学位

双波段共口径MRTD模型消热差图像模拟像移补偿

红外测试技术应用

介绍利用红外线非接触在线测量分析物质中某种成分含量仪器的测试原理及反射式测试仪器结构原理，讨论了仪器研制过程中的技术问题和红外光谱的适用范围．

期刊

红外线测试测量波长比较波长

基于组稀疏的子集选择应用研究

与本文相关的学术论文