基于图拉普拉斯的半监督判别特征选择研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:sdqzdx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息获取技术的发展,各领域的数据呈现高维化。高维数据的出现意味着我们可以获取更多有价值的信息,同时也意味着我们在处理数据和挖掘信息时会遇到更多的挑战。比如,高维数据的稀疏性会使得模型的训练以及参数的估计更加困难,会导致“维度灾难”问题。另外,随着数据维数的增长,特征的冗余度和无关性也会随之增长,这将不仅增加算法的时间复杂度,而且可能会降低算法的性能。研究人员采用降维技术将高维数据映射到低维空间中,以此来解决高维数据带来的问题。特征选择作为降维技术的一个重要研究方向,能有效地剔除不相关及冗余的特征,并保留数据的原始含义,可解释性强,便于研究人员对数据的后续探索。本文在拉普拉斯得分算法的基础上,针对半监督特征选择算法展开研究。拉普拉斯得分算法是一种简洁有效的无监督过滤式图拉普拉斯特征选择算法,已经被扩展到半监督学习领域。然而,拉普拉斯得分算法忽略特征之间的关系,只考虑特征的单局部结构,导致特征子集的冗余度较高。另外,针对带噪声特征的数据,已有的基于拉普拉斯得分的半监督方法并不能提取具有强判别能力的特征子集。为此,本文融入邻域判别的思想,通过计算邻域关系的基数而不是邻域相似度来衡量特征子集的判别能力。在此基础上,本文提出了三种基于拉普拉斯得分的半监督算法,具体总结如下:提出基于拉普拉斯得分的半监督判别特征选择算法。针对基于拉普拉斯得分的半监督算法对噪声特征数据不能很好地提取判别特征的问题,本文提出了基于拉普拉斯得分的半监督判别特征选择算法。本文算法利用拉普拉斯得分算法来度量数据的单局部结构,并利用邻域判别增益来衡量特征子集的判别能力,从而提高了算法提取判别特征的能力。在人工数据集以及UCI数据集上,我们验证了所提方法能有效地筛选出具有判别能力的特征,并提高了分类的准确率。提出基于修正拉普拉斯得分的半监督判别特征选择算法。针对拉普拉斯得分算法不能衡量特征之间关联性的问题,本文提出了无监督的修正拉普拉斯得分算法。该无监督算法可以衡量特征子集的联合局部结构。进一步,我们将该无监督算法与邻域判别指数相结合,提出了基于修正拉普拉斯得分的半监督判别特征选择算法。实验结果验证了基于修正拉普拉斯得分的半监督判别特征选择算法具有更好的分类准确率,并能有效地处理高维数据。提出基于前向迭代拉普拉斯得分的半监督判别特征选择算法。在修正拉普拉斯得分算法的基础上,本文先提出无监督的前向迭代拉普拉斯得分算法。该无监督算法能衡量特征子集的联合局部结构保持能力。结合邻域判别增益,本文提出基于前向迭代拉普拉斯得分的半监督判别特征选择算法。在文中,我们对修正拉普拉斯得分算法和邻域关系进行了理论分析,以此来优化前向迭代拉普拉斯得分算法的迭代过程以及邻域判别指数的计算过程。实验结果说明了该算法可以在保证准确率的同时,还能降低时间的消耗。
其他文献
随着城市治理中数据科学日渐广泛的应用,城市体检作为规划管理领域中的数据化改革正在全国范围内推广。住建部2017年在北京市率先发起城市体检试点,其主要目标是通过监测和管理城市数据来缓解实际的“城市病”问题。但是城市体检作为一项数据治理活动,其既往研究主要关注理论上的体检指标构建和技术创新,却忽视了治理实践方面的思考,部分表现在城市体检缺乏对试点项目数据治理能力的评估和指导,进而限制了其在2020年开
学位
第一部分三叉神经颈髓复合体S1PR1参与慢性偏头痛中枢敏化目的慢性偏头痛(chronic migraine,CM)是指患者连续三个月以上每月头痛至少发作15天,其中偏头痛样发作至少8天。CM治疗反应差、致失能性高,常给个人和社会带来严重的负担。慢性偏头痛病理生理机制的深入研究对于临床工作具有重要意义,其中中枢敏化被认为是慢性偏头痛的主要病理机制。近年来在多种疼痛模型研究中发现,鞘氨醇-1-磷酸受体
学位
目的:探讨我院就诊伴中央-颞区棘波儿童良性癫痫(BECT)患儿出现睡眠中癫痫电持续状态(ESES)现象的危险因素以及BECT合并ESES患儿出现认知功能损伤的危险因素,分析不同诊断标准下的不同治疗方法对BECT合并ESES患儿的有效性及耐药性。对象和方法:选取从2017年11月至2020年10月苏州大学附属儿童医院小儿神经内科门诊和住院部254例诊断为BECT患儿临床资料。(1)根据有无ESES现
学位
目的调查ICU护士留职意愿、自我效能及工作嵌入的现状;分析不同人口社会学因素、自我效能、工作嵌入对ICU护士留职意愿的影响;进一步探讨ICU护士高留职意愿的形成原因,并给出提高留职意愿的初步建议。方法采取横断面调研方式,对常州地区三级医院ICU护士进行问卷调查,量表包括一般资料调查表、护士留职意愿量表、护士自我效能量表、护士工作嵌入量表,调查ICU护士留职意愿、自我效能及工作嵌入的现状。比较不同人
学位
基于图像的物体认知系统蕴含了人类智能中的“示教、学习、识别”基本过程。人脸识别、工业产品的缺陷检测等都可以抽象为物体认知。嵌入式物体认知系统是嵌入式人工智能的重要分支,是人工智能实际应用的主要侧面之一。目前,嵌入式人工智能的发展处于初期阶段,算法轻量化、资源高效利用、硬件构件设计、终端部署方法等技术问题有待深入研究。本文设计开发了一套基于图像处理的嵌入式低资源物体认知系统,对人工智能落地进行了一些
学位
基于分子界面作用的先进气敏功能材料,在生态保护、公共安全和能源开发等领域应用广泛。传统气敏材料的性能研究大多从材料的表象参数定性分析,存在耗时较长、工作量较大以及缺乏预知性等问题。随着微悬臂梁研究的不断深入,气敏材料分析仪利用谐振式微悬臂梁作为生化传感器,变温微称重法为测试理论基础,定量提取气敏材料的特征参数,从热力学与动力学这一特征参数着手,实现气敏材料敏感特性的快速定量评估,在气敏材料性能分析
学位
为了满足长期快速增长的通信容量需求,基于空分复用(Space Division Multiplexing,SDM)技术的多芯光纤(Multi-core Fiber)开始被广泛研究。然而,相比于传统单芯光纤,多芯光纤中独有的芯间串扰(Inter-core Crosstalk)在多芯光纤传输系统中会严重影响光信号的传输质量、降低信道通信容量,成为限制空分复用性能的重要影响因素。在实际多芯光纤中,由于弯
学位
事件同指消解任务旨在判断多个事件实例是否指向现实世界中同一个具体事件,并将指向同一个事件的事件实例链接成同指链。根据事件实例的来源,事件同指消解可分为文档级任务和跨文档任务。本文从中文、英文和跨语言三方面展开文档级事件同指消解任务的研究,主要内容有:(一)基于结构化表示的事件同指消解方法针对事件句表述复杂存在一词多义、多种指代现象,本文提出了基于结构化表示的事件同指消解方法。首先,通过事件五元组构
学位
随着云计算、物联网和5G等技术的发展,边缘设备的数量迅速增加。各种边缘设备产生了大量数据,人们希望这些数据可以在边缘端直接处理。同时,边缘计算产生的一系列数据需要与用户进行实时交互,而最直观的数据交互形式就是图形显示。对于边缘设备,通常来说是资源有限,并且对功耗十分敏感。因此,研究有限资源系统中图形显示的实现对边缘计算来说具有重大意义。本文基于嵌入式图形显示系统课题背景、研究意义与国内外研究现状,
学位
目的 探讨早发型子痫前期(early onset pre-eclampsia, EOSP)患者血清内皮细胞特异性分子-1(endothelial cell specific molecule-1,ESM1)及低密度脂蛋白受体相关蛋白-1(low-density lipoprotein receptor-related protein-1,LRP1)水平及与病情严重程度的相关性。方法 选取2019年
期刊