【摘 要】
:
由于半监督学习能充分运用标记样本和未标记样本信息,因此它在很多领域都表现出优越的性能,已成为机器学习领域中的研究热点之一。在众多种半监督学习方法中,基于图的半监督学习方法具有计算速度快和准确率高等优点,已经成为近年来机器学习和模式识别中最为活跃的方向之一。标签传递是一种有效的基于图的半监督分类方法,被广泛应用到图像分类,文本分类等任务中。本文就标签传递算法中存在的不足提出改进方案并利用该模型解决其
论文部分内容阅读
由于半监督学习能充分运用标记样本和未标记样本信息,因此它在很多领域都表现出优越的性能,已成为机器学习领域中的研究热点之一。在众多种半监督学习方法中,基于图的半监督学习方法具有计算速度快和准确率高等优点,已经成为近年来机器学习和模式识别中最为活跃的方向之一。标签传递是一种有效的基于图的半监督分类方法,被广泛应用到图像分类,文本分类等任务中。本文就标签传递算法中存在的不足提出改进方案并利用该模型解决其他机器学习算法的不足,具体工作如下:第一,在标签传递算法中,图的构建在很大程度上影响算法的性能。尽管已有大量的图构建方法被提出,然而现有方法存在图的构建与标签传递过程分离以及图构建中忽略数据的局部和稀疏结构问题。为了解决上述问题,本文提出了一种基于局部和稀疏约束的自适应图标签传递(Locality and Sparsity Constrained Adaptive Graph based Label Propagation,LSCAGLP)算法。在该算法中,本文将图构建与标签传递结合形成统一框架,并且在图构建过程中同时考虑样本的局部性与稀疏性,使得图更具有稀疏性和判别性,从而有利于标签传递。此外,提出一种迭代优化算法求解目标函数。在四个数据集进行大量的实验,实验结果证明LSCAGLP算法优于其它对比方法。第二,岭回归算法能充分运用标记样本的标签信息,但不能利用未标记样本。为了解决上述不足,本文将LSCAGLP算法与岭回归算法结合,形成一种基于自适应图标签传递的半监督岭回归(Semi-Supervised Ridge Regression with Adaptive Graph-Based Label Propagation,SSRR-AGLP)算法。该模型不仅使岭回归能充分运用未标记样本信息,而且解决标签传递存在的“样本外”问题。本文还提出一种迭代优化算法求解该目标函数。大量实验结果证明了该算法的有效性。第三,非负矩阵分解是一种有效的降维技术,但其忽略了样本的标签信息,在一定程度上降低了特征判别能力。为了解决这个问题,本文将LSCAGLP算法引入到非负矩阵分解算法中,提出一种基于自适应图的半监督非负矩阵分解(Adaptive Graph based Semi-Supervised Non-negative Matrix Factorization,AGSSNMF)算法,该算法引入了样本的标签信息,从而增强算法的性能。与上述模型一样,提出一种迭代优化算法求解目标函数,并用大量实验验证算法的优良性。
其他文献
认知无线传感器网络(Cognitive Wireless Sensor Networks,CWSN)是将传统无线传感器网络(Wireless Sensor Networks,WSN)与认知无线电(Cognitive Radio,CR)技术相结合产生的一种新型的智能化网络。认知无线传感网可以利用频谱感知技术发现授权频段内的频谱空穴,机会式接入进行通信,因此该网络可以同时在ISM频段和授权频段进行通信
M2M通信技术是一种可以连接智能无线设备的新兴技术,是5G系统三大应用之一。本文以5G系统M2M传输业务为背景,研究了不同M2M通信系统模型下的无线信道分配和功率控制算法,主要
图像着色技术是一种常见的图像处理技术,被广泛地应用于不同领域的生产和研究中。在医学邻域,医学图像大多都呈现为灰度图像,医学图像彩色化技术能突出组织器官,方便医生和患
随着我国全民医疗保险的铺开,医疗费用增速加快。一方面医疗服务需求的释放以及老龄化进程的加速,医疗费用增长加速,另一方面我国经济进入新常态,经济增长速度下滑,财政收入
在半导体制备工艺向14nm节点发展的过程中,基于多晶硅的传统存储技术逐渐接近其极限,需要探索新型的存储技术。自旋转移力矩磁随机存储器(STT-MRAM)因具有非易失、低功耗、高存储密度的特点而成为微电子学领域的研究热点。如何在器件尺寸持续微缩的同时维持磁性层的热稳定性是制约STT-MRAM商业化的关键问题。考虑到材料热稳定性对其垂直磁各向异性(PMA)的依赖,需要使用高PMA材料作为磁性层,或者设
随着社会的发展,人们对孩子的教育要求越来越高。基于奈达的功能对等理论,译者对美国作家Ashley Dymock De Tello的World Schooling一书的第4-6章进行翻译并撰写了翻译实践报
可见光通信技术(Visible Light Communication,VLC)是具备照明和通信双重功能的新一代无线通信技术,具有安全、保密性高、无电磁干扰、成本低等优点,得到了各界的广泛关注。
编码衍射成像系统中的测量值是幅值数据,丢失了含有大量信息的相位部分,从幅值数据中恢复原始信号就是相位恢复问题。在经典相位恢复算法中,必须用到多个编码衍射图案才能精确重构原始信号,但是在实际实验中多次重复测量编码衍射图案不易实现,如何仅用单个编码衍射图案精确重构原始信号的研究很有必要。该文对单个编码衍射图案的相位恢复方案进行研究,具体工作内容如下:首先,在基于幅度正则化近似消息传递算法(Approx
本文通过观察一些日常行为注意到一种普遍存在的头部转动现象:人体在行走左转之前,头部会提前向左侧转动;右转之前,头部会提前向右侧转动。因为头部转动发生在行走转向之前,所以本文认为可以将头部转向动作作为行走转向时人体意图的一种表现形式,设计一种下肢助力外骨骼,在助力模式下使用人体头部位姿调控外骨骼的行走方向与速度。本文设计了一种对输出力矩具有放大效果的下肢助力外骨骼结构,分析了其力位关系以及运动学和动
在无线通信系统中,提高数据传输速率和增大信号带宽已成为发展趋势,数模转换器(Digital to Analog Converter,DAC)作为系统中重要的组成部分,其能够处理的信号带宽以及频域性能需要满足无线通信系统的要求。电流舵DAC由于其结构本征的高速特性和较强的驱动能力等优点,被广泛应用在无线通信系统中,但随着采样时钟频率以及输入信号频率的增大,电流舵DAC的动态性能受时序误差、输出波动效