【摘 要】
:
随着DNA微阵列技术的出现,大量关于不同肿瘤的基因表达谱数据集被发布到网络上,从而使得对肿瘤特征基因选择和亚型分类的研究成为生物信息学领域的热点。基于Lasso(least abs
论文部分内容阅读
随着DNA微阵列技术的出现,大量关于不同肿瘤的基因表达谱数据集被发布到网络上,从而使得对肿瘤特征基因选择和亚型分类的研究成为生物信息学领域的热点。基于Lasso(least absolute shrinkage and selection operator)方法提出了K-split Lasso特征选择方法,其基本思想是将数据集平均划分为K份,分别使用Lasso方法对每份进行特征选择,而后将选择出来的每份特征子集合并,重新进行特征选择,得到最终的特征基因。实验采用支持向量机作为分类器,结果表明K-split Lasso方法减少了冗余特征,提高了分类精度,具有良好的稳定性。由于每次计算的维数降低,K-split Lasso方法解决了计算开销过大的问题,并在一定程度上解决了"过拟合"问题。因此K-split Lasso方法是一种有效的肿瘤特征基因选择方法。
其他文献
高校新生入学实行“绿色通道”是党和国家对贫困生的关怀,本文对实施过程中存在的问题和入学后高校的后续矛盾进行了分析,提出了确保“绿色通道”持续顺利实施的途径。
程序切片是一种重要的程序分析技术,广泛应用于程序的调试、测试与维护等领域。面向方面程序设计作为一种新的软件开发范型,能够实现横切关注点的模块化,其特有的语言元素和
系统演(Demonstration Program)主要关注数据管理的创新技术与实现技术,展现我国在数据库系统研究方面的成就。通过演示原型系统,作者能够用更为有趣、直观的交互方式介绍自己的
加快技术进步和创新,需要一大批高素质的科技和管理人才,同时也需要千百万高素质的技术工人。中国要提升国际竞争力,必须注重劳动者素质的提高。本文深入透析了当前存在的问题及
本文从监测质量管理、常规环境要素监测、应急监测、自动化监测、监测信息网络等五个方面对县级环境监测体系的现状进行了调查,分析了存在问题的原因,提出了建设和完善县级环境监测体系的对策。
针对已有方法在XML数据上基于SLCA(smallest lowest common ancestor)语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同
系统演示(Demonstration Program)主题主要关注数据管理的创新技术与实现技术,展现我国在数据库系统研究方面的成就。通过演示原型系统,作者能够用更为有趣、直观的交互方式介
云计算是并行计算、分布式计算和网格计算等高性能计算的进一步发展,它的异构性、按需等特征对高性能计算提出了新的挑战。针对云计算的典型特征,提出了基于并行任务和云环境相
随着时代的发展,科技的进步,信息技术走进我们的生活,而具有代表性的互联网正以迅速、便利、超时空的传递方式改变着人们的生存空间和生活方式,并在很大程度上推动着社会经济的发
传统的基于模型的老化与再生研究方法已不适于动态开放的网络环境。以对服务器内部状态、行为、环境等信息进行运行时监测,并准确、全面地评价老化趋势为基础,采用资源动态重