六种差异基因筛选方法及筛选效果的比较

来源 :2007年中国卫生统计学术大会 | 被引量 : 0次 | 上传用户:yy20092
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对基因表达数据的分析,其重要任务之一是筛选差异表达基因,即通过比较正常和疾病状态下基因转录及表达的差异,研究疾病的发生机理、进行疾病的早期诊断及治疗。差异基因筛选方法有多种,各种差异基因筛选方法处理由基因芯片获得的微阵列数据的过程基本相同,即先计算表达每一个基因的组间差异的统计量,然后按统计量的绝对值大小进行排序,可以认为排位越靠前的基因其组间差异为真实差异基因的概率较大;也可以将计算所得统计量以0为界分为两部分,然后按其绝对值大小分别排序,大于0的部分排序靠前的基因与小于0的部分排序靠前的基因可分别认为是上调/下调或下调/上调基因。本文在简要介绍6种差异基因筛选方法的基础上,采用计算机模拟实验的方法,针对不同类型的数据对其进行比较和研究。 与其他研究相比,本文主要进行了以下几点改进:一是在相同条件下对六种方法进行比较:二是通过选择不依赖样本分布的ROC曲线下面积AUC值对变量的组间差异进行设置,增强了不同类型数据筛选结果间的可比性;三是以真实基因芯片实验数据为基础产生模拟实验的噪声数据,使模拟结果更接近真实情况。
其他文献
多元统计分析经常被用来研究多个随机变量之间的相互依赖关系以及内在的统计规律性。而当同一响应变量在不同时间被重复测量时,数据被称为纵向数据。本文旨在对多元纵向数据建
会议
由于不同的指标具有不同的性质和要求,在进行医院综合评价求算分值时不可一概而论,而应区别对待。本文在对加权评分法的计分进行合理设计的基础上,整合出医院综合评价指标计分时
由基因芯片可以获得大量的基因及其基因相互作用的信息。对基因表达谱数据进行分析,主要问题是基因的数量巨大,有意义的基因表达信息被大量的噪声所淹没,且基因表达信号具有非常
本文就欧氏距离的加权处理对K-means法聚类效果的改进进行了论述,从聚类分析简介、为什么要对K-means法进行改进、如何对iC-means法进行改进以及改进的K-means法效果如何这些
目的:探讨等效性检验中一些相关统计概念和应用公式问题。方法:采用文献资料分析法。结果:等效性检验有关概念和应用公式存在歧义和不一致。结论:等效性检验有关概念和应用公
发表偏倚是影响Meta分析质量的一个很重要因素。本研究应用Monte Carlo方法,比较目前公开发表的五种识别发表偏倚的方法。模拟结果显示,现有的定量判断Meta分析是否存在发表偏
In this study,a new strategy for estimating codon homozygosity when there is an albsence of amino acids was introduced.Totally 124 eubacterial genome codon usag
会议
利用支持向量机对未知样本进行预测时,由于差异表达基因的作用容易被大量的噪声所掩盖,其判别效果通常不是十分理想。若能够对分类的主要特征进行适当的提取,即采取某种基因筛选
会议
汽车是一样较大件的消费品(当然对于很多人,比如说我,它是一样奢侈品),众多购车族在买车前对于车都经历了从入门的精通的过程,大多数人可能对衣服、饮食甚至是住房的消费都比