随机森林在基因表达数据分析中的应用及研究进展

来源 :2007年中国卫生统计学术大会 | 被引量 : 0次 | 上传用户:chsmfzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对基因表达数据的分析,其重要任务是筛选差异表达基因及对基因或样品进行分类,通过比较正常和疾病状态下基因转录及其表达的差异,研究疾病的发生机理、疾病的早期诊断及治疗;而对基因或样品进行分类,可以将功能相似、具有共调控的基因或不同的组织分型聚在一起,帮助我们根据已知基因发现和识别有意义的未知基因。基于此,本文介绍了随机森林的基本原理与方法,论述了随机森林在基因表达数据分析中的应用情况,并简介绍了其研究进展。
其他文献
本文从国内医院数据挖掘的研究现状、医院数据的特殊性、医院数据挖掘的应用领域进行了分析与探讨。数据挖掘的关键技术分类分析、聚类分析、关联分析、预测分析和异常检测等
乙型病毒性肝炎,是危害人类身体健康最严重的疾病之一。温岭市是乙肝的高流行区,乙型肝炎表面抗原(HBsAg)携带者约占人口的10-20%。了解温岭市青少年乙型病毒性肝炎感染情况,为乙
会议
目的:了解河南省居民失能程度及失能对河南省居民健康影响。 方法:采用多阶段分层整群随机抽样方法,抽取河南省居民3000人,利用WHO《家庭健康调查问卷》调查河南省居民失能
2004至2006年我院共出院病人46335人,其中损伤与中毒的有11618人,占出院病人的25.07%,是收治病人数最多的一种疾病。本文就损伤与中毒的疾病构成及外部原因进行统计分析。
目的:了解浙江人群伤害的发生情况及影响因素,为伤害干预提供依据. 方法:采用方便抽样的方法对浙江省11761名在2005午内的伤害情况进行回顾性问卷调查,采用方差分析,秩和检验或
会议
效度(validity)是指一个测验在测量某项指标时所具有的准确程度。量表效度常检查三部分的效度:即:内容效度、效标效度和结构效度。这些效度都有评价方法并主要评价群体或样本的
会议
在研究人类遗传相关疾病的过程中,利用家系结构和群体调查资料进行连锁分析、关联分析或连锁不平衡分析已成为基因定位的重要方法。由于遗传学数据庞大,分析繁琐,结构复杂,需要专
本文作者对近几年的研究工作进行总结,主要研究方面为:基因芯片表达数据的标准化、功能基因的聚类分析、基因调控网络建立和分析、差异表达基因筛选等基于基因芯片表达数据处理
会议
目的:探讨伴随着高血压病程的逐渐增加,分析可能逐步出现的并发症; 方法:2005年的8-10月,采用等比例多阶段整群随机抽样的方法,对北京市全部18个区县的16711名18岁以上的常住居
会议