基因富集分析方法研究及基因与疾病关联性分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:daifeng216216
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现阶段,基因测序技术主要基于高通量测序,其技术不断成熟的同时基因数据也大量产生。人类对基因的研究也不再集中于基因数据的获取上,重心开始逐渐偏移,着重探讨基因的功能及基因的多样性。当前面临的主要挑战在于解释和分析基因测序产生的大量数据,尝试从这些大量基因数据中挖掘出潜在的规律,为人类带来福音。癌症,又被称为恶性肿瘤,目前是对人类健康最大的威胁之一。利用基因技术进行癌症预防及治疗将会成为未来癌症治疗的重大突破点。利用生物先验知识,分析一组具有相同功能的基因(基因集)在不同表现型下的差异性的方法渐成为当前的主流方法,即基因富集分析方法。本文提出了一种基于拓扑势模型的基因富集分析方法。该方法将单个基因看作一个表达势场,并且利用拓扑势模型量化此表达势场的强度。基因表达势场的强度主要取决于两个方面:基因表达值的高低以及基因之间调控关联程度的强弱。基因的表达值越高,并且与其他基因之间的调控关系越强,则基因的表达势场越强。反之则其表达势场越弱。可以将传统的基因富集分析方法分为两个大类:基于基因表达值的分析方法以及基于基因间相互关系的分析方法。由于基因之间存在调控关系,因此可以将人体的所有基因看成一种调控网络,基于此调控网络,可以将基于基因表达值的调控方法称为“点方法”,将基于基因间相互关系的方法称为“边方法”。本文提出的拓扑势模型可以看作是“点方法”与“边方法”的结合。在对模型的分析上,使用了三组肠癌数据,并将拓扑势模型与当前主流的算法进行了比较,实验结果表明拓扑势模型比之其他方法具有更优的性能。同时,本文还将人体基因调控网络HTRN引入到了拓扑势模型,并给出了基于此网络的拓扑势模型具体的计算方法。HTRN网络是DNA元件百科全书项目的一部分,引入此网络使得拓扑势模型只需考虑网络中存在调控关系的基因对,如此使得模型在生物上更具解释性。在对引入HTRN网络的拓扑势模型性能的分析上,本文用到了一种新的分析方法,该方法要以大量的实验数据为依托,利用不同数据目标基因集的p-value以及p-value排序位置为衡量标准对算法性能进行评估。在不同算法的比对分析中,可以看到引入大网络的拓扑势分析模型具有更优的性能。换句话说,其在基因富集分析方面具有更加优越的竞争力。
其他文献
<正>现如今的教育之难,难在我们的教育有太多的悖论和问题需要面对。而首先要面对的问题,便是我们是否了解现在的孩子?我在这个问题上很有发言权,因为近20年来,我大概接触了8
细胞色素P450(CYP)2C亚家族包括CYP2C9、CYP2C19、CYP2C8等,都是重要的药物代谢酶。据估计,CYP2C9负责代谢清除15%的在人体内的经过一相代谢的药物。而CYP2C19也代谢很多临床
随着社会发展和科技进步,我国的综合国力不断增强,并大踏步地跨入国际舞台,这就意味着对科技英语翻译的要求越来越高。而随着国家海洋事业的迅速发展,海事英语翻译的作用日渐
国内展览界一些知名展会正在努力向世界一流展览迈进,除了扩大规模是当务之急外,提高展览服务水平同样刻不容缓。$$  慕尼黑博览会集团的项目总监PeterKnoll先生曾这样阐述过
报纸
高层建筑作为应对城市人口和经济增长的重要手段,是世界性城市发展的必然趋势之一。高层建筑的空间分布与高度控制对城市景观有显著影响,是城市景观控制的重要方面。本文以伦
近年来随着人们追求健康、追求有机理念的逐渐深入,有机农产品在中国农产品市场所占的比重也逐步增加,有机农业在中国农业发展中得到了重视。本文对新西兰农业发展模式进行了
随着信息时代的到来,经济和社会的发展对计算机的依赖也愈来愈强。很多企业开始注重企业信息化发展,希望通过提高计算机信息管理能力来推动企业的发展。近几年来,企业信息化
不同水质具有不同的光谱特征,可以利用遥感技术对水质进行监测。水质监测结果是水质评价与水污染防治的主要依据,随着水体污染问题的日渐严重,水质监测成为社会经济可持续发
我国民办幼儿园教育质量总体偏低,其质量问题亟须政府治理。目前,民办幼儿园教育质量保障中政府治理工具的选择存在"理想化""行政化"和"单一性"问题。政府治理工具的运用存在
刑事和解,作为多元化纠纷解决机制之一,具有不同于传统刑事司法的特殊优势。相对于破坏性、武断式的传统的解决案件方式,采取恢复性、平和性解决刑事案件方式的刑事和解制度