基于图学习的属性选择与谱聚类算法改进研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户：macgrady2006

【摘要】

：

图方法因其可以计算和保持数据内在关系的特性相较于原始数据可以展现出更强的表达能力,所以被广泛应用到不同的领域中。尤其是在机器学习领域中,图的结构保持性质可以保证在

【作者】

：

杜婷婷

【出处】

：

广西师范大学

【发表日期】

：

2020年01期

【关键词】

：

属性选择谱聚类图学习自表达学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图方法因其可以计算和保持数据内在关系的特性相较于原始数据可以展现出更强的表达能力,所以被广泛应用到不同的领域中。尤其是在机器学习领域中,图的结构保持性质可以保证在学习过程中获取更多有效信息的情况下保持数据的原始结构不变。而在不同的图结构保持方法中,图的局部近邻关系保持方法已经在谱属性选择算法和谱聚类算法中得到应用。不过,先前图局部邻域关系保持方法的局部结构构造方式仅依赖欧式距离来衡量空间中样本相似关系,一旦数据中存在噪音或冗余则会影响建立后的图矩阵的质量从而进一步影响最终的机器学习模型学习效果。因此,本文将针对现有图学习存在的问题,利用两种不同的改进策略来分别提出两种能够建立更高质量图矩阵的方法并利用这两种新方法分别提出更加有效的基于图学习的机器学习算法。论文的主体部分为下述内容:（1）基于局部协方差和正则化的谱聚类算法（LCSC算法）。LCSC算法将结合图学习、局部协方差和数据正则化来提出一种高效的谱聚类学习模型。此算法通过引入样本的局部协方差矩阵来解决单一欧式距离度量可能带来的簇交叉问题,并使用正则化方法归一化样本的相似性量级从而达到提升聚类算法准确率的目的。具体地,LCSC首先在传统聚类算法中添加样本协方差矩阵间距离作为补充判断条件提升相似性矩阵的质量,然后使用正则化方法平衡获得的矩阵元素的量级,最终获得一个更加精确的谱聚类算法模型。通过聚类实验评测,LCSC算法在真实数据集上相较其他聚类算法获得了更好的效果。（2）基于谱旋转策略的动态谱属性选择算法（DFS-SR算法）。DFS-SR算法将结合谱旋转方法、图学习及稀疏学习技术,提出一种鲁棒的谱属性选择算法模型。此算法结合自表达图学习、稀疏学习及谱旋转方法来提升属性选择算法在处理真实数据上的性能。具体来说,算法首先利用基于自表达的图学习方式替代传统的基于欧式距离的图学习方式获得高质量的图矩阵;然后添加谱旋转方法通过真实数据标签微调原始数据矩阵的投影方向实现进一步提升模型学习质量的目标;最后在模型中添加具有组稀疏效果的稀疏正则化范数——l_2,1-范数从而实现最终的属性选择效果。经聚类实验验证,该算法较对比算法能取得更好的效果。本论文首先针对传统机器学习算法中谱属性选择算法及谱聚类算法依赖基于单一欧式距离的数据局部结构保持方法可能会造成的在学习过程中获得的图矩阵质量不佳的问题进行改进提升。然后通过真实数据实验来评估所提出方法和所有对比算法,其中所有属性选择算法将采用经典聚类算法K-均值算法作为属性选择效果的评测途径。此外,为进一步验证提出算法的正确性和有效性,论文采用多个评价指标对所提出的算法结果进行验证分析,并且文中所有算法将采取统一的实验条件进行测试。最终实验结果显示本论文提出的新算法均优于选取的同类算法。在未来的工作中,本人会考虑将提出的图学习改进方法直接应用到分类、回归或者更多真实应用场景当中。

其他文献

初中生对科学的态度现状及影响因素调查与研究

国际上与科学态度有关的研究始于上世纪60年代,而在我国,该领域的相关研究起步较晚,直到2001年新一轮的基础课程改革中提出情感态度价值观的教育目标后,科学态度这一名词才引

学位

对科学的态度初中学生影响因素

海量数据近似top-k查询算法研究

信息科技的飞速发展使得全球数据量爆炸增长,在海量数据中快速、有效地检索到目标数据的top-k查询方法是当前计算机研究的热点问题。在海量数据中,使用传统的top-k查询方法返

学位

确定性保证概率性保证近似查询top-k查询

MIMO信道下基于LDPC码的自适应功率分配

如今,5G通信技术已经在2020年步入商用,除了人们对可靠通信有着越来越高的要求外,移动通信也面临着更多越来越复杂的应用场景,通信终端为了满足物联网的需求也更加多样化。第

学位

LDPC码高斯近似MIMO信道预编码功率优化

基于暗原色先验和二阶变分模型的图像去雾

传统有雾图像中不仅含有雾气,更含有严重的噪声。这些噪声有些是因为空气中含有的烟、灰尘等小颗粒所造成的,有些则是因为在雾天拍照数字图像在传输过程中所产生的噪声。基于

学位

暗原色先验二阶变分模型交替方向乘子法图像去雾图像去噪

基于饱和非线性系统随机共振机制的图像去噪的研究

意大利科学家Benzi等人提出了随机共振的概念,用来解释地球远古气象中出现的冰期与暖气候期周期交替出现的现象。其原理是在非线性系统、信号与噪声达到某种协调关系时,部分

学位

随机共振饱和非线性系统图像去噪峰值信噪比

基于激光视觉的镀锌钢板MIG焊接质量监测

众所周知,焊接工艺参数决定了焊缝几何形状,而后者可以反映前者。研究有效的方法来建立焊接工艺参数和焊缝几何形状之间的关系,对于提高焊接质量和降低焊接成本非常重要。焊

学位

镀锌钢板MIG激光视觉传感贝叶斯网络层次分析法

基于改进LLE的哈希图像检索算法研究

随着互联网时代的到来,图像、视频、音频等数据呈指数趋势不断地增长。“维度灾难”让传统的图像检索技术中的检索效果和检索速度逐渐发生退化。在图像检索的研究中,特征提取

学位

图像检索哈希学习流形学习视觉搜索

冰勺外观缺陷在线检测方法研究

冰勺是一种用于冰激凌等冷饮食用时不可缺少的辅助工具,其主要以桦木为原材料。冰勺的制作加工过程中,受铣刀磨损情况以及桦木材料自身存在的缺陷的影响,加工完成后的成品冰

学位

冰勺外观缺陷纹理提取在线检测

中学地理创新型教师成长路径与影响因素的个案研究

随着教育现代化进程的推进,建设高素质专业化创新型教师队伍成为我国教育事业发展的十大战略任务之一。创新型教师是实施创新教育的关键,创新教育是世界各国各地区为适应知识

学位

创新型教师中学地理个案研究

合作研究在高中地理调查活动中的应用研究

随着新课程标准的提出,一线地理教师想要对学生进行地理学科核心素养的培养,就要按照学生自身的学习特征以及学生所处环境的实际情况,通过小组间合作探究的学习方式,开展形式

学位

合作探究地理调查活动应用实证案例

基于图学习的属性选择与谱聚类算法改进研究

与本文相关的学术论文