面向支持向量机的字典和辅助信息的算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:abdusamat128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机是一种基于统计学习理论的机器学习方法,最早是在1995年由Vapnik等学者针对二值分类问题提出来的一种方法,主要是防止模型过学习与欠学习、局部极小点等问题。随着研究学者的深入研究,先后提出了多种基于支持向量机的学习方法,如模糊支持向量、最小二乘支持向量机、鲁棒支持向量机、基于k近邻支持向量机、基于卷积神经网络支持向量机。并且广泛应用在众多领域如图像分类、文本分类以及模式识别。虽然支持向量机在解决二分类问题已经取得了丰硕的成果,但是研究学者仍旧不断研究,并且把支持向量机拓展到双支持向量机的研究上,双支持向量机有着与标准支持向量机相类似的形式,它构造了两个非平行的分类超平面,把一个大的二次规划问题转化成了两个小的二次规划问题,并且把与目标类别相对的数据样本点纳入二次规划问题的约束条件中,这样可以大大的加快了模型训练的速度。二十一世纪是崭新的时代,是信息科技的时代。数据可以随时随地从网络上收集到或者是利用各式各样的特征提取器提取得到。例如,一份文本、一张图片、一段音频以及一则新闻等。在机器学习领域,有些收集到的数据带有额外的特征,例如一份文本或图片上有注释和标注,这些额外的特征被称为是特权信息。有标签的数据样本,可以标签信息得知其所属类别。但是,在正类和负类数据样本的交界处,存在着第三类数据样本,既有与正类数据样本相似的信息,也有负类数据样本的相似信息,被称作是Universum数据。这两种类型的数据都是可以提供先验知识辅助训练模型。如何充分利用这两种类型的数据去构建统一的模型和辅助训练分类器,已经成为了重要的挑战:(1)如何把特权信息引入到双支持向量机模型,并且能利用特权信息提供的先验知识辅助训练分类器。(2)如何把字典学习模型引入到双支持向量机中,利用字典学习对输入的数据样本进行去噪和去冗余,让转换后的数据样本更加具有稀疏性。(3)如何把Universum数据嵌入到基于字典的迁移学习模型中,并且在源域和目标域分别构建两个字典,确保把在源域学习到的先验知识迁移到目标域。为了能够有效利用这两种类型的数据,以及处理以上的相关问题,本文针对面向支持向量机的字典学习、特权信息和Universum数据的方法展开了深入的研究。本文的主要研究工作如下:1.针对有效利用数据样本的附加信息,数据样本之间的关系的问题,本文提出了一种名为具有特权信息的双支持向量机(TWSVM-PI)的新方法。该方法首先是利用校正空间的校正函数将特权信息嵌入到双支持向量机中,以构建一个统一的模型。同时,为特权信息引入一个惩罚权重和松弛变量,在训练过程中利用样本的潜在特权信息和样本的原始特征来训练分类器模型,即是利用不同权重的特权信息来调整两个非平行的超平面确保正类数据样本和负类数据样本被非平行的超平面分开。在优化过程,把一个较大的二次规划问题转化成两个较小的二次规划问题(QPPs)来优化求解得到两个非平行超平面。最后,我们进行了广泛的实验来评估所提出的TWSVM-PI方法的性能。结果表明,与基线方法相比,所提出的方法可以获得更好的性能。2.针对收集到的数据样本存在着噪声、数据冗余和数据不平衡,以及数据样本不是服从同一分布的问题,本文提出了一个结合双支持向量机和字典学习的模型,称为具有字典学习的双支持向量机学习方法(TSVMDL)。该方法首先是结合双支持向量机和字典学习构建一个统一的分类模型,通过字典学习来训练基于双支持向量机的判别分类器。同时,针对二分类问题构建一个二分类特定字典,并学习了一个分析字典,用于确保数据样本能够与稀疏编码桥接。此外,在字典学习模型中采用l2,1范式稀疏约束条件代替l0或l1范式稀疏约束条件,以确保系数在行中是尽可能稀疏的。最后,在不同的基准数据集上的执行了大量的实验,实验结果验证了模型的可行性。3.针对目前大部分的研究工作都忽略了位于正负两类数据样本交界处附近的未标记的数据样本的问题,即Universum数据。本文提出了一种具有Universum数据基于字典的迁移学习方法,即U-DTL。该方法利用ε敏感损失函数把Universum数据嵌入到基于支持向量机的迁移学习模型中,利用Universum数据提供的先验知识辅助训练分类模型。而后,该方法为源域和目标域分别构造了一个字典,利用字典学习增强原始数据的稀疏性并减少噪声对迁移数据的影响。此外,两个域的字典之间的相似性约束项被引入到统一的模型中,以确保把在源域学习到的先验知识迁移到目标域,辅助目标域分类。最后,在多个基准数据集上执行大量的实验,其结果验证了该方法的有效性。
其他文献
光电催化(PEC)工艺是一种高效的水净化技术。其中,新型设计和制备的PEC材料是水污染治理的关键。然而,传统PEC体系中电极材料的界面反应仍面临着高催化效率和低反应能耗的挑战。近年来一维和二维纳米结构的电极材料的发展为研制新型高效的PEC体系提供了机遇。针对水中普遍共存的重金属离子和新兴有机及PPCPs类污染物,本论文基于TiO2纳米线阵列(TNA)电极开展了各种复合电极材料的设计、制备及其对水中
学位
金属卤化物钙钛矿量子点(Pe QDs)是一种新型的光电纳米材料,其具有光致发光量子产率(PLQY)高、发光(PL)峰窄(半峰全宽约为15-40 nm,甚至比传统量子点更窄)、光谱可调、色域宽和载流子迁移率高等优点。基于这些优点,Pe QDs在发光二极管(LED)和太阳能电池中有良好的发展前景。自2014年以来,仅仅经过8年光景,基于Pe QDs所制备的LED和太阳能电池的效率已接近商用标准。然而,
学位
刺激响应嵌段共聚物组装体能够在特定条件下(如光、p H、温度等)发生物理或化学性质上的突变,在药物释放、传感器、水凝胶等不同领域有广泛的应用。刺激响应嵌段共聚物组装体主要通过溶液自组装等自组装方法制备,存在固含量低(<1%)且需后处理等问题,限制了其大规模制备。近年来,我们课题组发展了基于可逆加成-断裂链转移(RAFT)聚合的光引发聚合诱导自组装(Photo-PISA)。Photo-PISA具有操
学位
锂离子电池由于其高能量密度、绿色无污染等诸多优势,实现了电子设备的小型化、便携化和无线化。随着风力发电、光伏发电等新兴领域的技术成熟以及大规模投入使用,对大规模储能器件的需求与日俱增。由于全球锂资源短缺及其导致的价格腾贵,锂离子电池逐渐难以适应上述大规模储能需求。资源更丰富、价格更低廉的钾离子电池正逐渐成为新一代储能器件的最佳候选。电极材料作为储能器件的最核心组件,极大的影响着储能器件的能量和功率
学位
随着化石燃料的过度开采和使用,人类社会面临着严峻的环境污染和能源紧缺问题。为推动“双碳”重要战略,发展新型清洁能源迫在眉睫。氢能由于比能量高、温室效应气体零排放等优点被认为是理想的能源形式。燃料电池和电化学水分解制氢被视作实现氢能经济的关键技术。然而,应用最广泛的质子交换膜燃料电池(Proton exchange membrain fuel cells,PEMFCs),其阴极氧还原反应(Oxyge
学位
非晶态合金是一类缺乏晶态材料原子周期性排列、呈长程无序原子结构、无晶界等结构特性的新型金属材料,表现出优异的物理和化学性能。而以非晶态为前驱体所构筑的纳米晶/非晶复合组织结构合金,往往因异质结构作用和纳米效应加持而显示出新特性和功能。近年来,众多非晶态合金体系被研究者开发,在材料科学领域展现出独特性能并且具有潜在应用价值。金属Mn是一种具有奇特结构与磁性的过渡元素,Mn-基合金更是具有多种磁结构,
学位
近年来,不可再生化石燃料的持续开采与消耗带来了严峻的环境和能源危机。而可再生的清洁能源存在不稳定输出的问题,因此二次电池作为一种新型储能装置显得非常关键。其中,锂硫电池(lithium sulfur batteries,LSBs)因为其高理论能量密度而备受关注,但其商业化应用仍面临着众多挑战,如巨大的体积变化(~80%)、缓慢的氧化还原反应动力学以及可溶性的多硫化物(Li PSs)的穿梭效应等。研
学位
<正>谭汝为先生说,比喻是人类思维的智慧闪光,是语言艺术绽开的灿烂花朵。比喻修辞格的使用使得文学作品更加生动形象。雪莱的《致云雀》为统编版高中《语文》必修一第一单元选编的诗歌,在“学习提示”部分,编者称《致云雀》这首诗歌“比喻新奇”“修辞大胆、灵活”。那么,这首《致云雀》中比喻修辞格的使用到底新奇在哪里呢?
期刊
癫痫是一种脑部神经系统疾病,其发作主要由大脑中枢神经细胞阵发性超同步异常放电引起的短暂性脑功能失调,具有突变性、暂时性以及可反复性等特点。根据2019年世界卫生组织统计,全球接近5000万人口患有癫痫症,大约占世界人口的1%到2%。脑电图作为大脑状态的定量评估手段,可反映大脑中电生理活动的大多数病理信息,为分析癫痫的活动状态提供了有效的依据。此外,大部分临床医生通过视觉监测来观察患者24小时脑电图
学位
随着计算机技术、网络通信技术和控制技术的发展,非线性系统分布呈网络化趋势并被广泛部署与应用,网络化与非线性系统的结合给非线性系统的研究带来了突破性的发展和动力,相应的也为非线性系统在网络环境下的分析和研究带了新的问题和挑战。本文重点研究网络化离散非线性系统在系统受限、传输受限等影响下的有限时间状态估计与同步问题。为了处理以上问题,本文提出了马尔可夫非对称区间时变建模方法、部分测量值传输调度方案、周
学位