基于L1图的半监督学习算法

来源 :山东大学 | 被引量 : 0次 | 上传用户:xinhua9966
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习凭借在模式识别以及人工智能等领域的重要地位,使得其自诞生之日就引起了国际机器学习领域极高的关注,其目的是为了提升监督学习所生成的模型泛化能力以及解决无监督学习模型精度等问题。随着机器学习等科技理论的研究以及模式识别的实践,人们的现实生活当中已涌入大量的半监督学习技术。与此同时基于图的半监督学习作为该领域中的主流方法,凭借着其能够将刻画出的数据图以少量标记数据和大量未标记数据结合的方法进而提高学习性能的优势,因此其逐渐在机器学习领域中占据研究热点。其中,如何用图有效地刻画出样本数据之间的关系,如何选择模型中的参数以及图半监督算法中以损失函数度量的适当选取,对提升分类效果具有重要的指导作用。在分析了基于图的半监督学习的发展现状以及存在的问题的基础上,本文从图的构建和优化学习算法两大方面着手,在基于图的半监督学习的典型分类任务当中进行了系统性的研究,论文的主要工作和创新点如下:提出了以迭代重加权最小二乘方式构建L1图的方法,考虑到在不同数据集上图的构建是保证基于图的半监督学习方法能够快速、准确进行分类的关键前提,本文以传统L,范数思想为指导,结合其稀疏、无参且同时确立连接关系和连接权重的特性,在通过最小化约束条件得到稀疏图的过程中引入迭代重加权最小二乘法。该方法通过对原始L1构图方式的改进,经连续迭代计算更新权重以最大程度的利用每个样本进行稀疏表示,算法降低了所构造图的时间复杂度。在大量数据集及实验当中,本文提出的方法能够快速、精准地构造出对数据拓扑关系具有反映能力的图,同时提升了后续图半监督分类算法的性能,且本方法的准确率及收敛性均优于其他构图方法。提出了一种对局部与全局一致性算法参数自动选择的优化方法,传统局部与全局一致性算法的分类效果极易受到其自身参数的影响,超参数选择的好坏将直接影响分类准确率的高低。为减少在超参数选择上的成本以及提升算法的分类效果,本文在局部与全局一致性算法的基础上引入了黄金分割法,该方法通过连续获取参数取值区间的试探点与其函数值进行比较,使包含极小点的搜索区间经不断压缩以逼近目标函数的极小值点,最终获得所在极小值点的最优参数。与此同时,本文也将群智能算法中的粒子群优化算法引入至局部与全局一致性算法的寻参过程当中,并与黄金分割法在相同分类算法上进行了时间复杂度与分类精度的比较。黄金分割法凭借其本身具有自动寻参的优势,其能够精确高效的在所规定的阈值区间取得使分类精度最佳的参数,同时算法本身避免了传统寻参等诸多方法造成的成本爆炸等问题。实验验证了使用黄金分割法寻参的局部与全局一致性算法在各类数据中的低时间复杂度和分类算法精度的有效性。提出了一种解决多分类问题当中以L1范数为度量的局部与全局一致性方法。传统局部与全局一致性算法中损失函数项以L2范数作为度量标准,在此度量下相应的损失会伴随误差的增加而呈指数倍放大,当数据中含有离群值或噪声时,将导致模型向离群值严重偏移。鉴于近年来对L1范数以及稀疏工作的广泛研究表明,L1范数的损失仅随误差线性增加,并且其误差速率低于以最小二乘作为损失函数的度量标准,故本文引入以L1范数的思想与性质进而取代传统L2范数的度量模式。在对原目标函数进行了系统性的分析和推导后,通过与迭代重加权最小二乘法思想结合,有效地解决了后续推导过程中目标函数不可导的情况,进而定义了一种全新的局部与全局一致性算法(IRLS-LGC)。大量实验验证表明,与原始局部与全局一致性算法相比较,该算法对数据的分类效果有所提高。本文根据上述方法在实际问题中进行了综合研究,将提出的IRLS-L1图,黄金分割参数优化方法以及L1范数为度量的局部与全局一致性算法在人脸识别中进行了实践应用。
其他文献
随着信息技术的突飞猛进,银行业自助机服务迅速普及。自助机的使用对扩大银行规模、减少交易成本、提高服务效率和树立银行竞争能力起到了重要的作用。但也面临大批中老年客户对自助机使用困难、亟需银行提升自助机使用服务质量的问题。基于此,本文以农行LC分行为例,在大量问卷调查的基础上,运用客户满意度等相关理论,深入分析农业银行中老年客户自助机使用中遇到的难点问题、影响因素和解决之策,以求进一步提高服务质量,研
学位
经济新常态下,中小型企业在我国经济发展中发挥的作用日益凸显,然而知识经济在飞速发展,人才竞争更为激烈,员工的流失是中小企业必须思考和解决的问题。鉴于此,本文以A公司为例,采用问卷调研的方式,对统计数据进行量化分析,发现影响员工流失的诸多因素,并对因素权重展开有效分析,以此为切入点展开对策设计,有的放矢,解决A企业员工流失问题。通过研究发现:对于A公司而言,整体处于员工年龄年轻化、服务年限相对较低、
学位
我国民营企业生产活动的主要力量逐渐由“新一代”青年担任,企业运营管理者逐步发现青年员工对企业的忠诚度逐渐降低,付出巨大的时间和金钱培养出来的员工往往因为一些意外因素提出离职。员工归属感低、缺乏奉献精神、崇尚自由成为制约企业尤其是对普通劳动力需求旺盛的制造业发展的最大阻力。“千防万防,人心难防”是经常令企业困扰的事情,即便组织设计了非常精妙的规章制度,但是单纯靠书面指令很难面面俱到地监督到员工的态度
学位
研究背景万古霉素(vancomycin,Van)的使用已经有半个多世纪,它是治疗严重革兰氏阳性耐药球菌的首选药物,在住院感染病人中的使用比例高达35%。但是急性肾损伤(acute kidney injury,AKI)是万古霉素临床应用中不可忽视的严重副作用。Klotho是一种在正常肾小管上皮细胞中高度表达的跨膜蛋白,研究表明Klotho对多种肾脏疾病具有保护作用,但是Klotho在万古霉素诱导急性
学位
信贷业务是商业银行的主要业务之一,政府、监管机构、银行管理层和公众都十分关注它的运行和发展。随着政府对外资银行进入中国市场政策的放宽,银监会正在加快相关法律法规和配套体系的建设。在此背景下,加快我国银行信贷业务风险管理与控制的建设迫在眉睫。众所周知,农村信用合作社是农商行的前身,与其他类型商业银行相比它的起步比较晚,体制改革不是很彻底,在风险管控方面还存在一定的差距,在市场化运行中出现的一些风险性
学位
企业的内部控制是企业管理现代化的必然产物,加强内部控制体系建设则是建立现代企业制度的内在要求。有效的内部控制不仅可以使企业的资源得到合理分配从而提高劳动生产率,而且还能预防和发现企业内部和外部的欺诈行为,减少企业面临的风险,有助于企业健康的发展。随着我国经济的转型,民营企业面临的竞争更加激烈,生存形式愈加严峻,良好的企业内部控制则能为企业的生存提供一定的保障,因此越来越多的企业开始重视内部控制。货
学位
在水产养殖渔业中,鱼的尺寸等生长态势信息对于水产品的养殖管理有着重要的意义。鱼的尺寸及其变化信息不仅反映了其自身的生长状况,还反映了在水产养殖过程中存在的问题。传统的鱼体尺寸测量方法是将鱼捞出后用尺子等工具进行手工测量,这种方法不仅费时费力,还会对鱼体本身产生一定的伤害。随着集约化生产养殖规模的不断扩大,传统尺寸测量方法的弊端日益显露,如何高效、准确、原位的获得养殖鱼类的尺寸等生长信息成为当前急需
学位
癫痫作为神经系统常见疾病,以大脑神经元异常放电所引起的短暂性神经系统功能失常为特征。目前癫痫治疗主要以药物治疗为主,现有抗癫痫药物大都是通过抑制神经环路过度兴奋发挥抗癫痫作用,近年来,越来越多研究聚焦于癫痫中的神经炎症和氧化应激,它们成为研发新治疗策略的靶点。炎症在癫痫发生发展过程中的重要作用已经在临床以及基础研究中得到广泛证实,炎症分子可与其相应受体结合直接或间接影响神经元功能,使神经元兴奋性升
学位
当今世界能源需求日益增长,化石能源燃烧已经成为二氧化碳排放的主要来源,中国政府于2020年在联合国大会上提出“2030碳达峰”、“2060碳中和”的重大战略目标,因此在“双碳”目标下,能源改革势在必行。风能是一种清洁可再生能源,风电场的大规模建设为风能利用提供了条件,然而由于风电具有间歇性、波动性和不确定性等特点,大规模风电并网也为电力系统的稳定运行带来了巨大挑战。准确的风电功率预测结果有助于电力
学位
在鱼类的育苗选种与养殖生产中,体质量是极其重要的选种指标和生产指标。传统的测量方法需要抽样后人工称重,操作难、效率低、结果不可靠且容易对鱼造成伤害。鱼类体质量与其多种形态参数具有显著相关性,因此可通过测定形态参数反演得到体质量。本研究将机器学习和立体视觉的方法引入鱼类体质量测定中,实现了鱼类体质量的非接触测量,提高了测量的效率和精度。首先,通过双目立体视觉方法以及基于主动形状模型的关键点定位技术获
学位