基因表达谱对组织样品分类的统计方法研究

来源 :福建医科大学 | 被引量 : 0次 | 上传用户:reato
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:本课题全面深入探讨根据基因表达谱对组织样品分类的统计学方法,主要是探索减少基因数的有效统计学方法和对比研究对组织样品有效分类的统计学方法,同时对分类效果的考核方法作应用研究。方法:本课题所统计分析的数据集是由72例白血病病人(行)和7129个基因(列)组成的白血病基因数据集。通过剔除取值变动不大的基因、基因变量聚类、典型指标(基因)的选择和共线性诊断这四个步骤和方法筛选出对白血病分型有用的基因。应用11种系统聚类分析方法对筛选后的白血病基因数据集进行样品聚类,采用预测强度法对这11种聚类分析方法的聚类效果进行考核。为了评价预测强度法应用于聚类结果合理性的考核是否可行,应用错误率考核法及真实性评价指标来考核各种聚类分析方法聚类结果的合理性,并与预测强度法的考核结果作一比较。结果:1.基因筛选结果表明:通过剔除取值变动不大的基因、基因变量聚类、典型指标(基因)的选择和共线性诊断这四个步骤和方法共筛选出对白血病分型有用的基因共48个。2.聚类分析结果表明:用11种系统聚类分析方法对由48个典型基因与72例白血病病人组成的数据集进行样品聚类分析,分为2类,其中由于此数据集不是坐标型数据,故不适合用最大似然法分析。其余10种聚类分析方法中,只有可变类平均法和离差平方和法将该数据集分为两类。3.聚类效果考核结果表明:应用预测强度法考核可变类平均法和离差平方和法对组织样品分类的效果,结果发现在其他条件相同的情况下,可变类平均法在b=-0.9和b=-0.5时的聚类效果是较好的,比较适合该白血病数据集的,其中在b=-0.5时,可变类平均法的聚类效果既是合理的又是最好的;可变类平均法在b=-0.8,b=-0.7,b=-0.6,b=-0.4和b=-0.3时的聚类效果是较差的,分类是不合理的;离差平方和法的考核结果表明该法的聚类效果是较差的,分类是不合理
其他文献
背景与目的 O~6—甲基鸟嘌呤—DNA甲基转移酶(MGMT)是一种重要的DNA修复酶,MGMT在保护细胞免受烷基化试剂诱导的突变方面起着关键作用。烷化剂是一类重要的环境致癌物,其分
爱默生在散文《诗人》中深入探讨了诗人的本质和作用,塑造了一个理想的诗人形象。这一形象可以追溯到希腊神话中的奥尔弗斯。本文结合19世纪美国的社会文化背景,以《诗人》为
本文在阐述广州汽车产业发展的成就,分析广州汽车产业发展面临问题的基础上,提出了加大自主创新力度,着力发展环保型新能源汽车等对策措施,以促进广州汽车产业新一轮的大发展
依靠科技进步实行产销结合勤县养猪业迈向产业化杜宪章,胡至刚,徐利民(浙江省鄞县畜牧兽医技术服务中心宁波315040)鄞县地处宁波市近郊,农业以水稻为主,是一个产粮大县,县、镇、村工业发达
<正>由于企业中存在着相当多的既不是变动成本也不是固定成本的混合成本,将混合成本分解为变动成本和固定成本就成为应用管理会计的前提条件和基础工作,因此显然正确地分解混
随着中药需求的增加,在人工种植中使用农药成为保证其质量、产量的常用手段。但农药的不合理使用使中药中农药残留情况越发严重,甚至影响了中药疗效和患者安全,也严重制约了
档案记载了经济社会发展的方方面面,常被称为“社会记忆”。档案馆作为文献材料的存储机构,不仅具有行政职能,还具有社会服务功能。经济社会的飞速发展,促进了社会整体素质的
目的本研究总结我院鼻咽癌患者临床资料特点,旨在反映云南省鼻咽癌发病特点,为防治工作提供理论参考。方法收集2003年至2010年我院就诊1514例鼻咽癌患者病历资料,分析鼻咽癌
随着我国经济的快速增长,国内企业越来越需要依赖安全可靠的国内快递服务来运送包裹、拓展商机。现阶段我国快递市场拥有三大市场主体,国有快递企业、民营快递企业及外资快递
钢箱梁高强轻质的特点使其广泛应用在桥梁建设中,稳定问题是影响其运营安全的重要因素,为了解稳定问题的实质,不仅仅要分析线性稳定性问题,同时必须考虑分析材料非线性和几何