基于自表达的低秩属性选择算法

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:xiongmao_yang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和大数据产业的发展,人类社会的各个领域都积累了大量的高维数据,如何有效地进行高维数据挖掘成为了迫在眉睫的问题。为了提高高维数据挖掘中各类算法的性能和效率,我们必须对高维数据做属性约简预处理。因此,属性约简领域很自然地取得了巨大的发展,并受到了广泛的关注。一般地,属性约简方法包括属性选择和子空间学习。属性选择通常是通过一些特定的模型从数据中提取一些必要的属性,从而达到减少数据维度的目的。子空间学习是通过投影矩阵将高维数据投影到低维空间,以此来保持数据之间的关联结构。总之,属性选择比子空间学习更具解释性,而子空间学习比属性选择更具稳定性。本文结合以上两种属性约简方法,针对高维数据中存在较多离群点等特点,合理地利用属性自表达来缓解离群点的影响,并根据低秩表示和稀疏表示技术来进一步地去除噪声的干扰,选出最具代表性的属性子集,最后用于文本和人脸数据的分类研究中。本文的核心内容和原创点为:(1)由于属性自表达在建模时具有良好的特性,本文同时结合低秩、超图等相关技术,提出了一种无监督属性选择算法——基于属性自表达的低秩超图属性选择算法(BHSLR_FS算法)。具体地,BHSLR_FS算法首先利用属性自表达特点用其他属性稀疏地表达每个属性,此自表达形式使用低秩假设寻找高维数据的低秩表示,然后建立超图正则化因子保持高维数据的局部结构,最后利用稀疏正则化因子进行属性选择。属性自表达特性确定属性的重要性,低秩表示相当于考虑数据的全局信息进行子空间学习,超图正则化因子考虑数据的局部结构对数据进行子空间学习。该算法实际上考虑数据全局和局部信息进行子空间学习,更是一种嵌入了子空间学习的属性选择算法。通过跟对比算法在六个真实数据集上的实验比较,BHSLR_FS对数据进行属性选择后,比对比算法拥有更强的分类性能。(2)由于结构化学习能够提供补充信息,增强属性选择的效果,论文设计了一种结合局部结构学习和稀疏学习的无监督属性选择算法(LSS_FS)。LSS_FS算法首先利用属性自表达建模。接着,根据样本间的相似性来动态地调节自表达系数矩阵使其达到最优。然后,利用低秩表示来考虑数据的全局流形结构。最后,结合稀疏学习进行属性选择。实验结果表明,LSS_FS算法相比其它对比算法,能更有效地选取属性,并能取得很好的分类效果。本论文主要针对各式各样的高维数据(包括文本数据和人脸数据等),设计了新奇的属性约简算法。具体地,本文以属性自表达和低秩表示为核心技术,并针对不同类型的数据结构,结合相关技术,筛选出代表性的属性子集。同时,为了保证实验的公平性,论文中全部算法均在特定实验设置下,进行验证和分析。而且本文以分类效果来验证属选的效果,同时利用三个评价指标来验证提出的算法的性能,在多个公开数据集上的实验结果表明,本文提出的新算法在鲁棒性和属选性能方面均强于所有的对比算法。在未来的科研工作中,本人将考虑融合深度学习等相关技术,来进一步地优化和提升提出的属性约简算法的性能。
其他文献
传统的机器学习技术依赖于大量有标记样本进行训练,但是在实际应用中大量的有标记样本获取困难,相比之下,无标记样本廉价、容易获取。因此,只需要少量的有标记样本和充分利用
人脸表情识别在许多领域已得到广泛应用,例如:人机交互、生物学、安防等领域。近几年在深度学习的助力下,人脸表情识别的识别率更是显著提升。就目前人脸表情数据集而言,大多
科学技术尤其是网络技术的急速发展与广泛应用,给人们的日常生活带来了前所未有的便捷,但随之而来的是信息泄露导致的种种干扰。图像作为一种直观可视的消息表达方式,在日常
清洗剂在许多工业生产或实际生活中,已经成为不可缺少的试剂。人们的环保意识随着社会进步而增强,关于清洗剂成分的环保性、对资源的节约性以及清洗高效性的关注度逐渐增高。目前所制备的众多清洗中,真正环保的寥寥无几。由于生产工艺以及配方等各方面原因,含磷的助洗剂以及其他添加剂,虽然增强了清洗能力强,但是磷排放在水中会造成危害水中动植物的富营养化状态,远达不到环保的要求。此外在节能方面,浓缩型玻璃清洗剂在我国
节能减排是世界各国的共识,结构轻量化是实现节能减排的关键。铝合金具有比强度和比刚度高、耐腐蚀、塑性好等优点,在载运工具制造领域,采用铝合金部分替代钢材,可以有效实现轻量化的目标。搅拌摩擦焊(FSW)技术是铝/钢异种金属最具前景的焊接方法之一。首先利用有限元软件ANSYS建立厚度为2.5 mm的Q235钢材和6061铝合金(T6)平板对接三维热力耦合有限元模型,对铝/钢异种金属FSW接头中温度场及残
深海沉积物、冰心、黄土-古土壤、湖泊沉积物、树轮、礁珊瑚、洞穴沉积物是古气候和古环境重建的重要档案库(Mazany et al.,1980;Singer,1984;Liu et al.,1991;Thompson,1997
会议
公共环境下视频监控系统的普及所带来的海量视频给传统的人工智能视频监控分析方法带来了前所未有的挑战。在监控视频分析中,行人重识别具有重要的理论研究意义和实际应用价
人脸识别在不同应用场景下对准确率、精确率、召回率等要求不同,容易受到光照,姿态变化以及遮挡的影响,因此研究不同应用场景下人脸识别算法的参数变化,对提高人脸识别水平有
为了避免长期、大面积使用硼酸湿敷时导致的吸收中毒,我们使用河北本草药业有限责任公司出品的“疮疡灵”(复方黄柏液)治疗皮肤疡渗出期的病人123例,取得较好疗效.123例病人
会议
雷达作为一种实现目标定位与追踪的主流手段,近年来在各类军事活动中占据着越来越重要的战略地位,这也促使雷达向更高分辨率,更大宽带方向发展。它带来了一系列关于雷达开发