基于SAM基因筛选方法的支持向量机逐步判别分析

来源 :2007年中国卫生统计学术大会 | 被引量 : 0次 | 上传用户:liuyanan508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用支持向量机对未知样本进行预测时,由于差异表达基因的作用容易被大量的噪声所掩盖,其判别效果通常不是十分理想。若能够对分类的主要特征进行适当的提取,即采取某种基因筛选的方法,尽可能将对分类不起作用的冗余噪声基因筛除,然后在此基础上建立统计判别模型,通过较少的差异表达基因实现临床诊断有重要的意义。但选择何种基因筛选的方法,所建立的模型能否能达到预期的效果,是一项具有挑战性的工作。本文结合SAM筛选基因的方法,按照基因重要性排序,通过迭代算法自动选择"最优"支持向量机分类模型,然后用实际基因表达数据考核其应用效果,并用R语言编程通过模拟试验验证其有效性。
其他文献
目的:探讨膳食暴露评估概率性模型及如何量化其变异性和不确定性。 方法:运用Monte carlo方法量化变异性,运用Bootstrap方法量化不确定性。 结果:概率性模型比目前应用
目的:在基于思维作业的脑-机接口中,探讨如何提取脑电信号特征并对其进行准确有效地分类。 方法:对5名受试者进行3种不同思维作业实验,并对每名受试者两种不同思维作业脑电
会议
多元统计分析经常被用来研究多个随机变量之间的相互依赖关系以及内在的统计规律性。而当同一响应变量在不同时间被重复测量时,数据被称为纵向数据。本文旨在对多元纵向数据建
会议
由于不同的指标具有不同的性质和要求,在进行医院综合评价求算分值时不可一概而论,而应区别对待。本文在对加权评分法的计分进行合理设计的基础上,整合出医院综合评价指标计分时
由基因芯片可以获得大量的基因及其基因相互作用的信息。对基因表达谱数据进行分析,主要问题是基因的数量巨大,有意义的基因表达信息被大量的噪声所淹没,且基因表达信号具有非常
本文就欧氏距离的加权处理对K-means法聚类效果的改进进行了论述,从聚类分析简介、为什么要对K-means法进行改进、如何对iC-means法进行改进以及改进的K-means法效果如何这些
目的:探讨等效性检验中一些相关统计概念和应用公式问题。方法:采用文献资料分析法。结果:等效性检验有关概念和应用公式存在歧义和不一致。结论:等效性检验有关概念和应用公
发表偏倚是影响Meta分析质量的一个很重要因素。本研究应用Monte Carlo方法,比较目前公开发表的五种识别发表偏倚的方法。模拟结果显示,现有的定量判断Meta分析是否存在发表偏
In this study,a new strategy for estimating codon homozygosity when there is an albsence of amino acids was introduced.Totally 124 eubacterial genome codon usag
会议