基于网络模块的特征基因分析方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhanggh20060363
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达谱常常用于癌症的识别与诊断,基因芯片技术能大规模、高通量地研究癌症的基因表达谱,克服仅就该疾病与一个或几个候选基因之间连锁、关联研究的局限。该技术已经被广泛应用到很多领域。基因表达芯片所产生的海量数据具有高维,高噪,高冗余特点,并且大部分基因与疾病分类无关而且样本数也比较少。因此特征基因选择不仅可以帮助我们找到有很好判别分类能力的基因,而且还能降低计算的时间与空间复杂度。因此基因选择显得相当重要。本文主要的研究工作如下:一般的基因选择方法只考虑单个基因的独立性而没有考虑基因之间的相互作用,本文提出了基于网络的权重基因共表达方法并应用于癌症的识别与诊断。症数据集上根据基因之间的皮尔逊相关系数计算不同节点之间的相异系数,接着构建一个权重网络,网络模块内的基因共表达程度高,而不同模块之间的基因共表达程度低。然后,根据模块特征向量研究模块与特定表型的关联性,找出与疾病相关的显著模块。最后用三个公开的基因表达谱数据集来检验我们的方法。用决策树和支持向量机作为分类器来检验候选基因的分类预测准确率。实验结果证实本文提出的方法能够取得不错的分类效果。为了进一步验证选出来的特征基因的生物意义,我们采用基因本体论来研究与疾病相关的特定模块内部显著增强通路的生物过程。我们发现在三种不同的数据集通路上找出来的显著基因很多都已被先前的研究验证与该疾病相关。还有一部分没有被验证的基因也很有可能是该疾病的易感基因,有待进一步研究验证。针对精神分裂症的脑神经机制,首先对降维后的三个不同脑区的基因表达谱数据集进行基因网络模块的构建。接着对脑区各模块之间进行两两比对分析。找出脑区之间的差异性,并对这些差异性模块进行网络连接可视化分析。然后把找出的那些显著基因映射到人类基因数据库中进行GO分析。最后得出结论证明基底核区是精神分裂症基因的表达中心。
其他文献
中肠是昆虫消化食物和吸收营养的主要场所,还具有分泌和有害物质的储存功能,在一些马氏管缺乏的昆虫中兼具排泄功能。马氏管是昆虫排泄系统的主体,位于中肠和后肠的交界处。中肠
目的通过正畸丝结扎联合牙龈卟啉单胞菌脂多糖(Porphyromonas gingivalis.Lip opolysaccharide,P.g LPS)注射法建立大鼠实验性牙周炎模型,建模成功后去除正畸结扎丝然后分别
研究背景恶性黑素瘤(malignant melanoma)是源自黑素细胞的恶性肿瘤,在皮肤肿瘤中恶性程度最高,转移性黑素瘤患者的五年生存率不足10%。近年来,黑素瘤的发病率逐渐增加,已成为危害人类健康的严重疾病之一。黑素瘤相关抗原家族A1(MAGEA1)是MAGE-A基因亚家族的成员,亦称为癌症-种系(CG)基因或肿瘤-睾丸抗原(CTA)基因。MAGEA1在多种肿瘤中均有表达,但其内在的生物学机制
本文主要对印象派绘画的发展及其对中国写实油画的影响进行了详细的论述,以期为中国写实油画的发展提供一些理论依据。
随着我国经济迅猛的发展,科学技术也在不断地更新发展,不仅为企业带来了更多的发展机遇,同时也为企业带来了一定的难题与挑战。而会计成本控制可以帮助企业节约更多的资金,并
<正>全科医学将于2012年正式被列入临床医学二级学科目录,同时,有关部门将积极推进全科医生培养模式与学位制度相衔接,全科医生规范化培养合格者可获得临床医学(全科医学领域
针对内蒙古黄土高原春旱严重、春播保苗困难的问题,在防雨棚和与盆栽两种条件下,采用311-A最优回归设计方法,研究不同土壤墒情、不同黄腐酸浸种浓度和播种补水量对燕麦和谷子
科学与工程的很多领域如常微分方程和偏微分方程求解、信号处理、数字图像处理、排队网络、积分方程求解等都需要求解Toeplitz线性代数系统.大规模Toeplitz线性代数系统求解
研究背景:近年来,大强度、间歇形式运动防治脂代谢紊乱相关慢性疾病的研究,受到国内外众多学者的广泛关注。很多研究已经证实,大强度间歇运动训练对肥胖、2型糖尿病以及高血
3D打印技术应用于青瓷旅游工艺品的设计制作中,能够对已有实物利用3D扫描仪进行扫描,基于扫描的点云数据进行二次设计,以优化青瓷旅游工艺品的造型和功能。同时3D打印技术中