基因表达数据特征子集的冗余研究

来源 :统计与信息论坛 | 被引量 : 0次 | 上传用户:tata890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过滤式特征选择是一种在基因表达数据上广泛使用且简单有效的方法。针对其特征子集冗余性问题,使用皮尔逊相关系数,提出一种带冗余去除的特征选择算法。研究了在不同相关强度下特征子集冗余去除及分类准确度效果。实验选用三个不同的基因表达数据集,使用支持向量机、k近邻、随机森林作为分类器分别进行了测试。实验结果表明,带冗余去除的过滤式特征选择方法在不同分类器上均能获得良好的分类性能,另外,此方法在降低特征子集维度的同时能够提高分类准确度。
其他文献
本文以抓好安全生产是构建和谐企业的必然要求为主线,分析了如何发挥思想政治工作的政治优势、宣传优势、渗透优势和创新优势,从而确保企业安全生产工作更加有效。
人参,既是“东北三宝”之首,又是我国传统的“百草之王”。曾几何时,这个“宝贝”、“王者”在其主产区吉林省长白山区,竟然身价大跌,“人参不如萝卜价”的可悲事实令人扼腕,很多参
过去,人们把去美国淘金称为“美国梦”,在黄永军的心中,也有一个“中国梦”——随着中国经济的崛起,来中国工作、投资创业的外籍人士越来越多,外国读者对中国图书的兴趣越来越浓厚
企业品牌是企业的重要战略资源,进行企业品牌建设可以有效的提高顾客对企业产品的忠诚度,让顾客更容易接受企业的产品。因此,打造企业品牌具有重要意义。同时,企业品牌主要根
通过对1219名高职生的调查研究表明:高职生的创新精神和社会自我效能感较好,但学习动机普遍不足;高职生的学习动机、社会自我效能感与创新精神呈显著正相关;社会自我效能感对
农业、农村与农民问题是贯穿我国现代化进程和中华民族复兴之路的基本问题。党的十九大报告高瞻远瞩地提出了实施乡村振兴战略。湖州作为"两山"理念诞生地,地处沿海发达地区,
目的:了解杭州市萧山区冷菜食品卫生现状,为今后该类食品卫生监督监测提供依据,方法:对2003—2005年杭州市萧山区餐饮行业中的冷菜食品进行抽样卫生监测,并对抽检的4类537份冷菜样
随着社会经济文化的发展,预算管理在行政事业单位中的地位与作用日趋显著,其能利用国家有限资源,实现经济效益最大化。而内部控制制度能将预算管理制度化,为预算管理提供有力
据国家知识产权统计数据显示,2011年,宁波全市专利申请量突破4.5万件,授权量突破3.5万件,专利授权总量在全国15个副省级城市中仅次于深圳。其中,授权发明专利量出现较大幅度增加,授权