多视角特征选择和半监督支持向量机研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:laopengtou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会日新月异的发展和科技的不断进步,人们通过互联网进行的信息交互越来越频繁,随之而来的是数据的爆炸式增长,如何准确高效的挖掘大数据中的有效信息逐渐成为人们关注的热点。不断增加的数据维度和规模带来了“维度灾难”、高计算复杂度、数据冗余以及昂贵的标签获取代价等问题。因此特征选择、半监督学习和无监督学习逐渐进入人们的视野。而且从单一的视角来分析问题往往是有局限性的,如果可以从多个视角来观察同一事物,并给出综合的评估,可以极大提升数据挖掘的有效性。以上述问题为切入点,本文着眼于事物的多面性以及关注数据的子空间结构信息,做出了如下工作和贡献:1.本文在第三章中提出了一种新的多视角无监督特征选择算法,该方法可以学习投影矩阵的全局稀疏解,并且通过使用一组用于评估特征重要程度的比例因子来调整最小二乘回归的回归系数,最终将比例因子嵌入到投影矩阵中,从而扩展了最小二乘回归模型。比例因子的引入为可以使用投影矩阵进行特征排序给出定义并提供了理论上的解释。参考特征权重比例因子的嵌入,同时可以将视角权重嵌入到投影矩阵中,使其对回归系数进行调整,实现对不同视角数据重要程度的度量,并且可以在优化出投影矩阵的同时自动获得特征权重和视角权重,从而通过引入一个新的稀疏正则项降低模型复杂度提升模型稳定性。由于从任意视角来评估样本并不会改变样本之间的类别信息,本文使用样本自表征的形式,利用样本自表征矩阵来构建无监督多视角学习中各视角之间的联系实现无监督学习。为了优化新模型,本文提出了一种简单有效的收敛算法,在求解过程中获取相邻样本数目k避免了预先设置k的麻烦。通过对特征选择后的数据进行聚类来与多个当前优秀的特征选择算法进行对比,可以看出本文所提无监督特征选择算法在特征选择效果上的优越性。2.本文在第四章中提出了一种新的半监督自适应拉普拉斯支持向量机方法,并给出了其原始解,因为有研究表明支持向量机的原始解比其对偶解拥有更多的优势。与其他拉普拉斯支持向量机算法相比,本文还同时考虑了无标签样本的hinge损失来最大化不同类别的无标签样本之间的距离来提升支持向量机模型的分类性能和泛化能力。与此同时,本文所提方法将拉普拉斯矩阵与支持向量机同时训练来提升拉普拉斯矩阵的自适应性和准确性,并且引入原始解求解器来解决本文所提自适应拉普拉斯支持向量机问题。经过与多个优秀的半监督支持向量机算法对比的实验结果可以看出,本文所提半监督支持向量机算法拥有着良好的分类效果。
其他文献
我国水利工程项目建设越来越多,为保证工程质量,在建设过程中溢洪道控制段启闭机复合结构深梁施工至关重要。新疆卡拉贝利水利枢纽工程是以灌溉、防洪为主,兼顾发电的综合水
钢筋混凝土桥梁在我国土木桥梁中是运用最广的一种桥型,因其取材方便,结构受力简单,所以倍受青睐。随着新建桥梁的逐渐减少,已建桥梁桥龄的慢慢增长,未来,我国桥梁工程师和桥
普通公路的可持续发展对于湖北省整个公路体系的可持续发展,乃至全省经济社会的科学发展、跨越式发展都具有重要推动作用。基于湖北省普通公路发展现状,从可持续发展方面存在
2009年9月30日,印度尼西亚巴东市发生7.6级地震。之后,印度尼西亚又接连遭受了几次强震袭击,如2009年12月23日6.1级、2010年3月6日7.1级、2010年4月7日7.8级和2010年5月9日7.
团簇研究是一个多学科交叉领域,在实验和理论上都取得了很大进步,不断有新的光、电、磁、热等物理性质和催化、反应活性等化学性质为人们所发现。过渡金属团簇由于其复杂的d
美国次贷危机给全球房地产业及金融市场带来了巨大冲击,通过分析危机发生的深层次原因,并根据中国房地产业自身特点和房地产金融发展的现状,针对房地产抵押贷款业务活动存在
2018年11月26日,咸宁市鄂南秋暴课题研究领导小组、市委党史研究室联合举行《鄂南建立全国第一个县级红色政权研究》出版座谈会。咸宁市政协主席曾国平,省委党史研究室宣教处
筛查作为疾病的二级预防,旨在疾病的临床前期做好早期发现、早期诊断和早期治疗,以改善预后。乳腺癌筛查是通过有效、简便、经济的乳腺检查措施,对无症状妇女开展筛查,其最终
前苏联数学教育家斯托利亚尔指出:“数学教学是思维活动的教学”.因此,充分暴露数学思维过程应成为数学教师的重要任务.数学教学活动中存在三种思维活动,即数学家思维活动、
<正>"踢皮球、打太极、拖字诀还是不少。""小鬼难缠,办事难只是换了个马甲。""脸不失微笑,门始终敞开,可事就是不办。"翻看我们刊发过的干部群众反映"四风"问题的投稿,"新衙