论文部分内容阅读
在精神分裂症的研究中利用微阵列技术分析基因表达谱数据可快速识别基因表达的差异,对精神分裂症的诊断、快速治疗、药物研究都有巨大的意义。人类大脑每个脑区的基因转录谱对于理解精神分裂症等病症将会有极大的益处。分治的对其进行基因聚类,样本聚类,将会取得前所未有的新成果。本课题主要针对大脑子脑区的精神分裂症候选基因的共表达模式及其所蕴含的生物意义和致病机理进行研究,主要工作包括以下两点:(1)本文基于脑区分治的思想,根据脑区分子组成特点,提出了共表达2D层次聚类方法,得到了比传统层次聚类更好的时空复杂度,并应用于选出的六个脑区的基因表达数据集。在本文中,在包括额叶、颞叶、顶叶、基底、枕叶、海马六个子脑中,选则了前250个精神分裂症候选基因,本课题对这些基因的表达模式进行了共表达2D层次聚类方法的分析。此后对于各个脑区的聚类结果簇运用了 PCC分析。在所得到的共表达模式的分子组成这个方向上所得的局部模式能够较清晰的反映其中三个脑区的分子组成,而在另外三个脑区这种映射关系则显得相对模糊,但却与PCC分析结果有良好的对应。在基因聚类簇这个方向上,从GO富集的方法中发现基因在某些脑区有相似的表达共程度,同时在其他一些脑区,则相反。此课题的实验结果很好的证明了脑区的精神分裂症候选基因表达数据的局部模式不仅仅能反映子脑的分子组成结构,而更重要的是也能反映功能组成结构。这些脑区的共表达模式,对于理解各个子脑区在精神分裂症中的病理机制的解释有信息学帮助。(2)分析脑区基因共表达模式和脑区分子组成的共调控模式这两个方面,都包含蕴含了很多微妙而丰富的生物意义的局部信息。但传统的聚类方法并不能很好地挖掘出这些藏在局部信息中的数据的生物意义,进一步的本课题对于对生物意义敏感的双聚类算法做了深入研究,并结合脑区共表达模式的研究,提出一种基于脑区共表达模式,以CPB算法为内核,以Scaling-shifting模式结合PCC打分标准的全新双聚类算法 CHPBC(Co-expression Hierachical Pattern Biclust)。在信息丰度和生物意义的敏感度两方面都获得了好的结果。