基因表达数据分类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiangcool2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文重点研究了支持向量机(SVM)和Fisher线性判别分析两个分类算法在基因表达数据分类中的应用,并用实验测试了算法的分类性能,发现了算法的一些缺点.针对支持向量机还不能满足医学诊断疾病高分类正确率的要求,本文提出一个基于支持向量机的决策树算法;针对Fisher线性判别分析分类基因表达数据非常差的缺点,本文改进了Fisher,并提出了使用多个改进的Fisher给基因表达数据分类的新算法.用结肠癌数据实验证明:新算法比原算法更先进,具有更高的分类正确率.最后,本文将新算法同原算法以及当前该领域的几个先进算法在多个基因表达数据集上进行对比实验,结果表明:改进的支持向量机算法的性能不逊于那些先进算法;改进的Fisher算法是所有算法中性能最好的,其分类错误率最低.两种新算法相比,改进的Fisher算法比改进的支持向量机算法适用性更强,分类正确率更高.
其他文献
本文是在我们承担的国家863项目"乳业专家系统开发与应用"的研发基础之上,结合专家系统技术在具体应用领域的特点,阐述了一种基于BP神经网络的知识表示方法以及相关的推理技
公平数据交换协议是安全电子商务的核心技术,近些年来得到了蓬勃的发展。随着互联网用户数目的增多,越来越多的日常商务活动都逐步电子化、网络化。因此对如何在计算机网络上开
本文对生物信息学中的一个重要分支——RNA二级结构预测进行了详尽的阐述,介绍了各种预测算法,包括各种经典的预测的算法,如系统发育比对方法,Nussinov和Zuker的动态规划
计算机免疫是参照生物免疫学原理提出的一种计算机安全解决方案,在一定程度上弥补了传统安全技术的不足。当前对它的研究主要集中在免疫检测方面,对免疫应答却很少涉及。通用
在无线网络迅猛发展与移动终端不断增加的环境下,互联网未来的发展将成为有线网络、无线网络与卫星网络等组成的异构网络。拥塞控制机制的改进也由于网络结构的复杂而更加困难
基于分布式散列表(Distributed Hash Table,DHT)的第二代结构化P2P系统是P2P研究的最新进展和研究热点。内容寻址网络(Content-Addressable Network)是结构化P2P系统的典型代表,
针对手语样本缺乏、非特定人样本过于分散的问题,本文引入了基于统计学习理论的支持向量机(SVM)模型,该模型基于结构风险最小化原则,易收敛,具有很好的泛化推广能力,同时它还
  嵌入式系统是以应用为中心,以计算机技术为基础,软硬件可裁减的专用计算机系统。近十几年来,嵌入式系统的发展异常迅速,嵌入式操作系统作为嵌入式系统的核心,其应用也越来越广
  本文首先介绍了粗集理论的一些基础概念,这些概念是整个粗集理论的基础,特别是如何认识和定义知识以及利用不可分辨关系将特定的论域划分为知识和概念。 重点介绍了决
计算机网络和通讯网络的综合发展,促成了智能网系统在通信领域的飞速发展。通讯网络在这几年的发展方向己经开始从扩展网络容量向增加和丰富业务内容的方向转变。智能网系统