基于标签结构的特征选择方法研究

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户:lt5185
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘和机器学习中,特征选择是解决“维数灾难”的有效方法。特征选择结果的好坏与分类精度和模型的泛化性能有着较大的相关性。研究高效的特征选择算法对高维数据的聚类和分类至关重要。本文重点研究了嵌入标签的特征选择方法及标签具有层次结构情况下的特征选择方法,具体研究成果主要体现在如下两个方面:(1)提出了基于稀疏聚类的标签特征选择算法。与现有的无监督特征选择算法相比,它是将高维数据映射低维空间,得到一个嵌入标签,利用低维空间对高维空间的拟合,构造降维目标函数,通过范数稀疏回归,对每个特征进行评分。最后,设计了相应的特征选择算法。实验结果表明,所提算法在聚类精度和互信息两种指标下均取得较好结果。(2)提出了基于标签层次结构的特征选择算法。解决了大多数现有的特征选择方法忽略了类别间的层次结构的问题。该方法首先利用正交转换计算特征对类别的权重,其次,根据权重选择特征,预测出样例的标签。实验表明,所提出的算法在分类精度方面获得较好的实验结果。
其他文献
背景:神经鞘瘤(Nerve Sheath Tumor,NST)又称施万瘤或者神经鞘膜瘤,是一种源自神经鞘细胞的神经周围肿瘤。根据组织学特征、肿瘤细胞生物学活性以及肿瘤起源,在组织病理学上可将其分为良性神经鞘瘤(Benign Nerve Sheath Tumor,BNST)或恶性神经鞘瘤(Malignant Nerve Sheath Tumor,MNST)。口内BNST约占所有头颈肿瘤的1%,迄今为
在图像处理过程中,图像矩作为有效描述图像全局不变特征的一种手段,例如正交矩与非正交矩。非正交矩,例如几何矩,具有几何不变性等优越特性,但是存在信息冗余,不利于图像重构
网络编码理论是近年来通信领域的重大突破,是一种能够提升网络性能的新型路由技术。相比于传统的路由技术,网络编码的精髓在于网络中继节点不仅仅只对接收到的信息进行简单的
企业内部控制质量评价不仅能够检验内部控制相关政策的实施是否有效,还能评价出企业内部控制方面存在的问题以及其内部控制水平的高低。因此,目前内部控制的质量越来越被企业及监管部门重视,相关的法律法规也不断出台,对于内部控制质量的评价也显得尤为重要。本文以2016-2018年共计147家新疆上市公司为研究样本,在COSO内部控制整合框架和内部控制目标的基础上,结合内部控制基本规范和配套指引,构建内部控制评
随着物联网的兴起,作为物联网重要组成部分的无线传感器网络(Wireless Sensor Network,WSN)也得到了不断的研究和发展。无线传感器网络是一种面向应用的网络,网内包含大量密
云计算以其快速部署和可扩展性等优势,现已成为重要的技术趋势。越来越多的组织和企业通过将数据和查询服务外包给云,可以以较低的价格来实现极大的灵活性。由于云是不完全可
随着我国社会主义市场经济的深入发展和城市化进程的不断推进,农业用地融入市场机制、实现农业现代化已是必然趋势。在新的形势下,旧有的家庭联产承包责任制己经无法适应农业现代化、产业化发展的需要,农地流转势在必行。为此,我国政府对农地制度进行了改革与调整,提出了“三权分置”的农地运行模式,即在家庭联产承包责任制的基础上,农地所有权、承包权、经营权三权分置,鼓励农地经营权的合理流转。与碎片化的农地经营模式相
闪存固态盘由于高性能、低功耗、高并发以及相对成熟的工艺,目前被广泛使用在各种存储系统中,尤其是移动端和高端服务器中。但由于闪存介质特性,闪存固态盘具有有限次的擦除
大气气溶胶光学特性是大气科学的一项基础性研究,其对了解气候效应等具有无与伦比的意义。中亚地区作为全球典型的干旱区,每年作为沙/盐尘暴策源地向周边甚至跨海洋广大区域输送了大量沙尘粒子,获取中亚干旱区气溶胶光学特性长时间序列上的变化对评估“一带一路”沿线地区气溶胶对气候变化的影响意义重大。本文利用全球气溶胶自动观测网(AERONET)、太阳-天空辐射计观测网(SONET)和自设站点所获得的观测资料分析
目的:使用DSM-5第三部分人格替代模型,评估双相障碍抑郁发作患者的人格维度及人格特质,探讨人格维度及人格特质是否对双相障碍患者的治疗疗效存在影响。方法:以2018年6月至2019年9月期间在南京脑科医院住院治疗的51名双相障碍患者(首次HAMD得分大于15分,且YMRS得分小于5分)作为研究对象,使用DSM-5人格障碍替代模型评估被试的人格维度及人格特质,在治疗开始、治疗2周、3周及4周对研究对