基于HSIC与多核学习的多标记特征选择

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:lfs888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习的目的是构建一个学习模型,对未知样本预测其所属的标记集。但多标记数据往往与高维特征相关联,不可避免出现特征冗余问题。因此,在考虑特征与标记之间关系的情况下,解决多标记数据中特征选择的问题至关重要。本文基于多核框架,利用希尔伯特-施密特独立性准则(HSIC),将特征空间与标记空间的关联性实现最大化,并同时考虑标记之间的关系,从而对多标记数据的特征进行排序和选择。主要算法研究结果如下:(1)提出基于标记重要度的多标记特征选择算法。在特征空间与标记空间中,分别为每个特征和每个标记定义一个权重和核矩阵,并引入多核学习,将特征空间与标记空间的核矩阵分别表示为单个核矩阵的凸组合,之后将这两个核矩阵代入到希尔伯特-施密特独立性准则中,实现特征核矩阵与标记核矩阵的关联性最大化,最后根据各个特征的权重对特征进行排序,选择最佳特征构成的最优特征子集,实现考虑标记重要度的多标记特征选择算法。(2)提出基于标记相关性的多标记特征选择算法。在特征空间中,核矩阵仍采用单个核矩阵的凸组合,在标记空间中,通过核对齐思想,定义融合标记相关性的标记核矩阵。最后,利用希尔伯特-施密特独立性准则,实现特征核矩阵与标记核矩阵的关联性最大化。基于特征空间中线性组合核的权重大小实现对相应特征的排序,选择最佳特征构成的最优特征子集,实现考虑标记相关性的多标记特征选择算法。本文提出的两个多标记特征选择算法,利用希尔伯特-施密特独立性准则,实现了特征与标记之间的关联性最大化,并充分利用了多个标记之间的信息,在不同的多标记数据集上,表现出良好的性能。
其他文献
综合实践活动课程是在新一轮基础教育课程改革中应运而生的一门新型课程,被国家规定为必修课程。综合实践活动课程的提出更加符合新时代培育人才的要求,注重对学生品德、问题意识、实践能力和创新能力的培养;关注学生的需求,面向学生的生活世界,鼓励他们从生活世界中取材,获得更加真实的体验。因此调查学生的想法,让儿童参与到综合实践活动课程的开发中,对加深他们在活动过程中的反思和体验,促进他们各方面的能力发展具有重
学位
报纸
党的二十大报告明确提出加强全媒体传播体系建设,在媒体深度融合背景下,这也是对融合出版高质量发展提出的时代命题和目标要求。新闻出版业通过在理念创新、内容呈现、技术更迭等方面不断推进融合出版的高质量发展,但也面临技术、伦理、资本等多方博弈的问题。因此,全媒体传播体系建设目标的实现,需要在打造内容IP、建构人才体系、提升技术服务等方面不断深化改革、优化升级。
期刊
2001年Akimitsu等人发现二元化合物MgB2具有超导电性,其超导转变温度高达40K。研究表明MgB2属于常规超导体,符合传统的电子-声子耦合机制,其费米面由两个二维的σ带和两个三维的π带组成。目前,关于MgB2的双能隙图像已经由电子隧道、比热测量以及de Hass-van Alphen的量子振荡测量等实验广泛证实。由于MgB2具有晶体结构简单、相干长度较长、易于制备加工和较高的临界电流密度
学位
<正>党的二十大报告提出:“加强全媒体传播体系建设,塑造主流舆论新格局。”全媒体时代,舆论生态、媒体格局、传播方式发生深刻变化,地市级党媒困难重重。在媒体深度融合的大潮里,地市级党媒要谋生存、求发展、创佳绩、树品牌,进一步发挥主流媒体的传播力、引导力、影响力、公信力,让党的声音传得更开、传得更广、传得更深入,就必须以此为指导思想和行动指南,坚持在守正中不断创新,在创新中更加守正,通过努力建设全媒体
期刊
可再生能源具有绿色环保的优点,大力发展可再生能源是解决能源危机以及环境问题的有效措施,但其出力具有随机波动性且难以准确预测,大规模并网发电势必冲击电网稳定性,要求化石能源机组能够灵活调峰以便备用。燃气轮机调峰性能较好,常采用日起停调峰的运行方式运行,但其常用检修模式过于保守,在规模可再生能源并网的电力系统中易导致大量检修费用的浪费。机组组合问题是电力系统优化运行的重要组成部分,研究大规模可再生能源
学位
半马尔可夫跳变系统作为典型的混杂网络控制系统,因其在模拟实际系统结构变化方面建模效果出色而备受关注。同时,通信网络的介入带来了网络迟延、带宽受限、网络攻击等问题。针对带宽受限,现有的网络化半马尔可夫跳变系统在利用事件触发机制时,并未充分考虑触发阈值的更新。针对网络攻击,半马尔可夫跳变系统中对于随机欺骗网络攻击等系统安全问题的研究还很少见,而关于网络化半马尔可夫跳变系统的事件触发耗散控制问题的研究还
学位
随着交通电气化的不断推进,电动公交得到了广泛的普及应用,有效缓解了传统燃油公交造成的能源危机和环境污染问题。然而,在传统公交向纯电动公交的转型过程中,还存在诸多困难。一方面,电动公交由于电池容量限制和充电时间长的问题,必须在传统的公交行程调度中考虑充电决策,另一方面,基础设施配置不合理、不完善也限制了电动公交的进一步发展。本文以电动公交的充电成本为切入点,考虑充电成本对电动公交日运行调度决策的引导
学位
随着对风电需求的增长,风电场并网导致的次同步振荡已经威胁到电力系统的安全稳定。目前研究出的风电场等值建模方法忽略了机组间及机组与电网见的相互作用,构建的仿真模型难以准确反映风电并网系统的动态特性。针对风电场详细模型运算时间长、单机模型不能准确反应系统运行特性的问题,本文围绕风电场等值建模方法、次同步振荡机理、风电场并网稳定性分析方法等放没进行了系统深入研究,主要工作如下:(1)提出基于机组次同步频
学位
作为我国民营经济的先发地、风向标,2018年10月,温州率先以创建全国首个新时代“两个健康”先行区为目标,以贯彻习近平总书记关于非公经济领域构建“亲清政商关系”“两个健康”等重要讲话精神为指导,扎实开展推进“清廉民企”建设工作。瓯海区作为“温州模式”的发源地之一,现有规模以上企业587家,在民营企业的服务管理上具有较强的实践性和创新性。本文以瓯海区积极推动“清廉民企”建设为背景,采用归纳总结法、实
学位