基于特征选择和任务相关性的多任务最小二乘支持向量机

来源 :深圳大学 | 被引量 : 0次 | 上传用户:endest
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多任务学习作为机器学习的一个重要分支,在处理多个小样本相关联任务和挖掘相关任务之间的内在联系与共享信息等方面发挥了重大的作用。其中多任务支持向量机(Multi-task Support Vector Machine,MTSVM)是多任务学习中的一个重要的发展方向。然而现有的多任务支持向量机大多并不具备特征选择的功能,在面对高维度任务或者高噪声任务并不能达到很好的效果。此外,多任务支持向量机通常假设任务彼此相似且接近同一个均值超平面,但实际情况往往更加复杂。本文针对多任务支持向量机中的特征选择和任务相关性两个问题进行研究,主要工作包括:(1)从特征选择的角度出发,本文提出稀疏最小二乘多任务支持向量机-SMTLS-SVM和SMTLS-SVR,分别解决分类问题和回归问题。算法引入一个0-1向量来控制特征稀疏性,通过交替最小化算法迭代地进行特征选择和子问题求解。在算法的每次迭代中应用了最优特征排序方法来选择所有任务之间的共享特征。在模拟和现实数据集的实验中,SMTLS-SVM和SMTLS-SVR都表现出更好的性能,尤其是在含大量噪声的情况下,本文提出的算法较其它算法的具有更强的鲁棒性。(2)进一步考虑任务相关性,本文提出了一种二阶段正则化多任务学习算法(TSRMTL),算法将SMTLS-SVM作为多任务特征选择工具与基于任务层面的正则化多任务学习算法相结合。此外,为了更好地应对复杂的现实环境,本文使用集成学习方法对基于不同任务相关性假设的正则化任务学习方法进行融合,提出了二阶段正则化多任务集成学习算法(TSRMTL-EN)。实验从特征选择和任务相关性两个角度出发,证明了SMTLSVM比起其它传统特征选择算法要更适合作为多任务特征选择工具。并将TSRMTL和TSRMTL-EN与经典多任务学习方法进行对比,实验表明,TSRMTL和TSRMTL-EN具有更好的性能,而TSRMTL-EN在保持性能的同时更加稳定。本文针对多任务支持向量机的特征选择问题和任务相关性问题,提出了针对性的解决方法。本研究可为后续相关研究提供经验和借鉴。
其他文献
多任务进化是进化领域中的一个新兴研究方向,主要研究如何充分利用任务之间的协同作用提高种群搜索的效率和性能。相对于传统的单任务进化,多任务进化能够通过多个任务之间的知识迁移提高算法的性能和进化的效率。基于多任务进化框架提出的单目标多任务进化算法和多目标多任务进化算法已经进化获得了优异的成果。本文对多任务进化算法进行了研究,并且对该领域做出了以下贡献:(1)提出了一个基于种群分布的两阶段知识迁移多任务
图像是日常生活中的重要信息媒介,在获取、使用等过程中,不可避免受到噪声的影响,破坏图像的质量,妨碍后续的处理。图像去噪问题是典型的病态逆问题,通常是图像迭代求解算法的关键步骤,需要利用先验信息对其进行正则化约束。通常图像去噪技术利用单幅图像的各种先验特征,结合不同滤波方法完成去噪,可采用的先验信息有限,难以有效选取特征保护图像边缘细节,且需手动多次调整参数,效率较低。近年来以卷积神经网络为代表的深
随着信息科技的逐步发展,人们越来越能更加快捷方便地获取信息。但网络技术的迅猛发展与网络信息量的快速增长,却使人们逐渐迷失在大量无效信息的包围中。信息超载问题伴随着信息科技与互联网的发展逐渐被人们重视、研究,由于信息超载问题使得人们在面对海量信息时无法有效获取自己感兴趣或者对自己真正有用的信息,使得信息整体的使用效率降低。与搜索引擎依靠特定策略和算法对用户提交的关键词进行搜索不同,作为解决信息超载问
多目标优化问题在现实生活中广泛存在,这些问题具有复杂度高,不易求解等特点,传统的数学方法难以对该类问题进行很好的求解。为解决这个问题,多目标进化算法被提出来并获得了广泛应用。多目标进化算法是启发式搜索算法中的一种,在处理多目标优化问题上,该类算法表现出了良好的鲁棒性和适用性。然而,随着目标个数的增加,这些多目标优化算法的有效性将逐渐地失效。原因是当目标数大于三个时,非支配解的数量将快速的占据整个种
多目标与超多目标优化问题广泛存在于现实世界当中,处理好这些问题具有重要的现实意义。然而,这些问题具有多个需要被同时优化且可能相互间存在冲突的目标函数,导致传统的数学方法很难进行处理。进化算法是一种基于种群的启发式算法,具有较强的搜索能力,能够解决很多传统方法无法解决的优化问题,已被广泛用于求解多目标与超多目标优化问题。近年来,为处理好超多目标优化问题,学术界提出了大量超多目标优化算法(Many-o
随着我国商品经济的飞速发展,人民精神需求水平日益提高,城市商业空间愈发受到公众关注。其中,动线系统和室外公共空间不仅是设计中的主要关注点和要素,更可作为整个商业建筑的点睛之笔和亮点所在,增添城市商业中心的活力。本文以环境行为学及消费心理学作为全文的理论铺垫和基础,以空间的合理性、流畅性、趣味性和活力性的分析视角来研究现当代商业综合体动线系统及外部公共空间的设计的现状情况,并以问卷调查和实地调研的研
在金融市场,股票预测一直是投资者和学术界的热门研究话题之一。随着经济全球化和股票市场的不断成熟,发展出了多种股票投资方式。近年来机器学习在多个研究领域取得了显著的成果,其中在股票预测方向除了传统的预测方法外,研究人员提出许多新的方法,并对已有的方法不断进行改进。例如利用深度学习预测股票中使用深度卷积网络、深度Q网络以及基于LSTM(长短期记忆网络)的深度循环神经网络预测股票。还有基于SVR(支持向
强化学习是一类关键的机器学习方法,普遍应用于以目标为导向的训练环境,并基于目标在环境中自发地探索最优策略。近来已在一些领域,如游戏操控、机器人操控、车辆自动驾驶等工程应用的部分问题中,获得显著的成绩,其中包括动态规划算法,应用于已知完整的马尔可夫问题模型;蒙特卡洛算法,与时间差分算法基于无模型问题进行寻策,是本文的主要研究内容。深度学习在机器学习中作为另一大热门研究技术,使用非线性的神经网络于分析
多目标优化问题广泛存在于科学研究与实际工程应用中。由于多个优化目标之间相互冲突,单个解不可能同时使所有的目标都是最优的。因此,多目标优化问题的最优解是由多个帕累托最优解组成的集合。进化算法是一种基于种群的元启发式算法,能同时优化一组解。因此,在求解多目标优化问题时,进化算法是一种非常适合的优化算法。然而,随着多目标优化问题复杂性的变化,现有的多目标进化算法越来越难以平衡种群的收敛性与多样性。因此,
目前,物联网、边缘智能和边缘计算等技术在网络边缘上生成了大量数据,而这些日益增多的数据需要在越来越复杂的深度学习算法上进行训练,以检测、分类和预测未来事件。这个趋势在未来还会继续扩大,为了加快深度学习算法的训练速度,分布式计算正变得越来越重要。然而分布式训练在主节点与计算节点间进行着频繁的梯度交换,这使得训练承受着巨大的通信开销,并且限制了分布式深度学习的训练效率。为了降低分布式深度学习的通信开销