【摘 要】
:
半监督学习已经成为模式识别和机器学习的重要组成部分,被国际机器学习界所广泛关注。近年来随着机器学习在数据挖掘和分析中的广泛应用,半监督学习的一些理论已经成功应用于
论文部分内容阅读
半监督学习已经成为模式识别和机器学习的重要组成部分,被国际机器学习界所广泛关注。近年来随着机器学习在数据挖掘和分析中的广泛应用,半监督学习的一些理论已经成功应用于实际问题的处理。本文对半监督学习进行了研究,主要内容如下:通过扩展核一致性方法,提出了基于核策略的半监督学习算法GCM(Generalized Consistency Method),深入分析了五种不同的度量及它们之间的关系,实验研究了不同度量方法中的参数与算法性能间的关系,并对使用不同度量的GCM算法的性能进行了比较,实验结果表明,使用指数度量的GCM算法的性能最优,而使用欧几里得度量的GCM算法的性能最差,同时,不同度量中的参数取值对算法的性能具有一定的影响;由于CCA是一种线性学习模型,线性变换的本质限制了抽取样本更具鉴别力的非线性的特征,因此,Semi-CCA在处理非线性问题上具有不足之处;在Semi-CCA算法的基础上引入核方法,提出了基于核典型相关分析的半监督学习算法Semi-KCCA(semi-supervised learning based on kernel canonical correlation analysis),使得原空间上非线性问题转化为特征空间上的线性问题,通过实验研究了该算法处理非线性问题的性能;最后,研究了一致性学习算法及其变形,对该算法收敛的重要条件给出了详细证明;除此以外,也研究了该算法几种变形的收敛性,证明了CM算法中使用变形矩阵的合理性。
其他文献
目前在各类企业信息系统、特别是高校信息系统应用中,经常会遇到一类新的应用需求,用户经常会随机地突然需要查询某些特定信息,这些查询需求给当前信息系统带来了新的挑战。
本硕士论文对SUPANET流量控制技术进行了研究。SUPANET(单物理层用户数据交换平台体系结构)是由四川省网络通信重点实验室提出的下一代网络体系结构,其基本思想是将所有必须
随着数据库以及其管理系统的广泛应用,数据库中存储的海量数据急剧增大。因此,频繁模式和多关系数据挖掘已成为数据挖掘中快速发展的重要研究课题。现实数据通常存储于由多个关
肝脏的解剖分段是肝脏规则性切除术和活体肝脏移植术的理论基础,肝脏的自动化分段则可以加快分段速度以及分段的准确度。如何利用CT数据获取肝脏的相关信息,实现自动化分段,并开
由于现实生活中存在海量无标签的数据样本,如果单纯依靠人工对这些无标签数据样本进行标签的话,花费代价通常会很高。如何以最少的代价给这些海量无标签数据样本进行标签这一难
过程纹理生成一直是计算机虚拟现实领域中一个至关重要的问题,它主要用于模拟自然界中常见的大理石、云朵、树木表皮等纹理。大多数的过程纹理都是基于某类噪声函数的,本文采
代码安全在计算机系统中占有重要的地位,针对软件源代码进行安全性分析的工具和方法大量出现,对加强软件的代码安全起到了很好的作用。然而大量使用的商业软件是以二进制代码
网络中关键边挖掘因其广泛的应用价值及理论研究意义,受到众多研究人员的关注,各种针对特定应用需求的边关键度评估方案不断被提出。为了更精准地评价不确定动态流网络环境中各
随着社会的不断进步和计算机科学技术的飞速发展。计算机及软件渗透到了人类社会的各个角落,成为国民经济、国防和社会日常生活中必不可少的重要组成部分。作为计算机的灵魂,
本文先介绍了供应链网络设计的领域背景,接着分析了当前领域内的研究成果及带鲁棒性的分析方法,并提出一种改进的鲁棒性网络设计策略,这种策略是在确保有灾难发生时结果不会太差