论文部分内容阅读
在后基因组时代的基因功能研究中,生物信息学和实验生物学之间的紧密协作和互动日渐重要。本文的工作围绕芯片数据的生物信息学分析方法展开,既有较为专门的生物信息学算法研究和创新,也有面向具体肺癌分子机制研究的生物信息学应用。这些生物信息学方法的建立和应用有力地支持了肺癌发病分子机理的研究。 在利用基因表达谱芯片进行信号通路的分析上,考察并指出了细胞通路中不同基因之间的不对等性,提出了用基于基因网络的权重计算方法来估计这种不对等性;并通过整合蛋白质相互作用数据,Gene Ontology基因功能分类数据,以及基因共表达数据建构了新的基因关联网络(gNET)。随后提出了一个基因加权的通路分析的新框架。使用了多个实际数据集,在准确性、可靠性和可重复性等多方面对这一新的做法进行了评估,证实了它的优势。还进一步地校正了一些通路中因为多亚基蛋白质的存在而引起的权重误差。 在外显子芯片的基因融合检测上,改进了前人的算法使之更适合于基因组范围内的筛选。在将该方法应用于中国肺腺癌的数据集时,寻找到了肺癌样本中包括RET在内的潜在基因融合,后续的实验结果表明,是CCDC6的第1个外显子和RET的第12个外显子发生了融合,从而导致了RET基因的高表达。 在miRNA及其靶基因在癌症中的功能预测上,考虑到miRNA对靶基因的调控发生在mRNA降解或mRNA翻译这两个不同的层面上,借助于gNET和基因表达谱数据对基因及其相邻基因的表达变化进行评估,并以此来衡量基因活性的变化,然后通过整合miRNA表达谱数据,来寻找在癌症中发挥潜在功能功能的miRNA-靶基因对。将该方法应用于肿瘤糖代谢的研究时,发现miR-143以及糖酵解关键限速酶HK2可能是潜在的重要调控因子,而进一步的实验研究在肺癌样本以及细胞系中都证实了这一点。