特征选择方法相关论文
非负矩阵分解(Non-negative Matrix Factorization,简称NMF)方法是一种新的降维方法,该方法具有可解释性、直观上的“局部构成整体”......
词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)是一种经典的基于VSM模型的权重计算方法,其算法相对简单,非常......
在文本分类问题的研究中,高维度的特征表示空间会严重影响文本分类的效率,特征降维是文本分类问题中重要并且关键的一步。目前特征......
海量音频数据检索技术的迅速发展,对已有的特征选择算法提出了严峻的挑战。迫切需要适应音乐数据集的准确性和运行效率等综合性能......
眼下,机器学习、数据挖掘等技术已经普遍运用于医疗、生命科学、经济学等社会各行各业。 本文的主要内容是机器学习方法在生物数......
生物科学与计算机科学是目前发展最迅速的两大学科,而作为这两大学科的交叉产物—生物信息学在基因组研究中发挥了重要的作用,基因......
博客,是一种通常由个人管理、不定期张贴新的文章的网站。随着博客的快速发展,博客作为一个重要的信息源的价值也在增加。在自然语......
荷尔蒙连接蛋白(HBP)可以选择性地、非共价地与荷尔蒙蛋白(HP)相互作用,从而充当HP的调节剂或抑制剂。准确地识别HBP也为正确理解......
面对海量专利数据的分类,传统的手工分类方式已经无法满足人们的需求,因此如何实现专利快速有效的自动分类,成为专利分析处理工作的关......
21世纪是信息时代,万维网上出现了海量的文本资源。对于互联网用户来说面对如此海量的文本信息,出现了拥有海量信息但知识相对贫乏的......
在软件缺陷预测研究中,若考虑了大量度量元会造成数据集中含有大量特征,其中冗余特征和无关特征会降低缺陷预测模型的性能。提出一......
在分析了传统特征选择方法构造的4项基本信息元素的基础上提出一种强类别信息的度量标准,并在此基础上,提出一种适用于不平衡文本的......
以肿瘤基因表达谱指导肿瘤的分类是目前机器学习领域的一个研究热点.对多类别肿瘤分类中的关键问题——特征基因选择方法进行了研究......
分类回归树(CART)算法在处理特征类别较多的数据以及相关性较强的数据集时,分类准确率也会受到影响,并且没有学者研究进行特征选择......
近年来老年人口数量越来越多,老年疾病的发病率显著升高,其中最具有代表性的是阿尔茨海默病(Alzheimer’s Disease,AD),也就是我们......
为提高不均衡文本分类的准确率和稳定性,提出了一种基于类别加权和方差统计的联合特征选择方法.首先,基于类别文档数大小对特征选......
针对通信信号的特点,该文提出了一种适用范围较广的新的特征选择方法。它运用高效、稳健的遗传算法,按照使同一类别特征的集群程度......
对台风暴雨泥石流发生的可能性进行定量预测,有助于减少危险区内的人员伤亡、降低经济损失。以台湾地区南投县陈有兰溪流域的47条......
<正>近年来,随着信息化技术与互联网的飞速发展,各行各业积累的数据资源急剧增长,大数据已成为国家层面的基础性战略资源,引起各国......
为了在电子侦察设备中采用模式识别技术自动实时识别雷达信号类型和性质,推导了一种统计模式识别判决准则,介绍了两种可采用的特征......