基于基因表达谱及序列特征的转录调控关系挖掘

来源 :中国人民解放军军事医学科学院 | 被引量 : 0次 | 上传用户:tiantianaimeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因转录调控在生物体中广泛存在,并对生物体行使正常的生理功能起着至关重要的作用。对基因调控网络进行研究,有助于增进人们对生物系统特征的了解。实验技术的进步,尤其是包括微阵列芯片技术在内的高通量实验的广泛开展,使得生物学数据海量涌现。利用微阵列等高通量数据进行转录调控关系挖掘的生物信息学方法研究,也逐渐得到了学术界的广泛关注。然而,目前众多的基因转录调控的生物信息学研究,仍然存在以下多个问题:相当一部分工作是围绕着某一个具体的生理、病理问题,设计有针对性的湿实验,再对得到的实验数据进行挖掘,这类方法缺少推广性;而另外一些宏观层次的工作往往引入了复杂的模型,没有对基因表达谱数据本身特征或性质进行进一步的提取和挖掘;还有一些工作对转录调控关系元的序列特征进行了分析,但只考虑了已知的模式或特征结构,在数据挖掘方面具有一定的偏性;另外一些工作使用了基于微阵列或染色质免疫共沉淀芯片等数据所得到的转录调控关系强度,但由于这些数据本身敏感性的问题,具有较大误差。为了解决上述问题,本文基于基因微阵列表达谱及序列特征就转录调控关系挖掘方法展开研究,并取得了如下成果:首先,我们利用微阵列表达谱进行调控关系挖掘的新参数体系的构建。从微阵列所表示的基因表达水平出发,我们引入及提出包括表达谱相关性、动态变化范围,以及表达水平矢量等多种参数或方法,描述了转录调控关系元表达水平相似度、动态变化范围差异、统计性质差异、各条件下表达水平的一致性程度等特性,用以进行转录调控关系分析。结合转录因子与靶基因的功能共注释分析,衡量转录调控关系元功能一致性,提高模型预测的准确度。在此基础上,我们使用贝叶斯模型对几组参数进行整合,以获得转录调控关系的存在概率。同时,为增强预测的效能和可信度,我们提出了联合似然比来描述成对参数的性质。利用时序微阵列数据中所体现的扰动的时延特性,选取合适的参数,辅助判定转录调控关系方向性,从而得到了完整的转录调控关系,为准确构建基因调控网络打下基础。其次,我们提出了微阵列表达谱特征的无监督机器学习与优化方法。参数化的学习,固然可以给出直观的参数,便于后续的分析研究。但是将高维的微阵列数据进行参数化提取信息,可能会导致信息损失,或产生先入为主的偏性。另一方面,微阵列数据中包含的大量噪声也会对转录调控关系挖掘带来负面影响。有鉴于此,我们以无监督的机器学习降维算法,代替经验的参数选择,提取有代表性的表达量信息,并排除干扰信息影响,进行转录调控关系的挖掘。我们定义了转录调控关系对的表达模式参数,通过非负矩阵分解以及主成分分析来提取表达水平的主要特征,提高了转录调控关系预测的准确率。第三,我们提出调控关系元序列特征的无偏提取方法。受微阵列表达谱原理的局限,某些随条件或时序变化较小的基因所参与的转录调控关系难以通过分析微阵列表达谱数据而获得。因此,对转录调控关系元的序列特征进行考察是很有必要的。我们利用氨基酸序列的特征,结合数学降维算法,提取转录调控元的序列特征。结合先验知识,通过机器学习方法训练模型参数,提出寻找转录调控关系元的特征序列的无偏提取方法。同时我们还使用空间向量作为特征序列的数学表示方法,构建合适的模型,将序列特征与转录调控关系存在与否联系起来。结果表明基于序列进行转录调控关系挖掘是可行的。进一步的分析证明,不同的特征选取方法与聚类方法,对结果的影响不大。通过进一步改进特征提取方法,可以得到更为理想的预测准确度。总之,使用序列信息构建的向量空间模型可以较为有效地预测出转录调控关系的存在。该方法具有其重要性和可行性,与基于微阵列进行转录调控关系的方法可以互为补充和参照。不同于其它通过全局计算微阵列表达谱的基因调控网络构建方法,本文通过寻找多种参数,辅以其它生物学知识,挖掘转录调控关系元与其表达谱之间的联系,构建较为精细而准确的基因调控网络。并结合转录因子与靶基因无偏序列特征提取的方法,发展利用序列特征进行转录调控关系预测的新方法。最终,建立了一套结合不同数据源、利用多种策略进行转录调控关系挖掘的综合性方法。这套方法可以在一定程度上避免或者减少现有方法的不足,提高转录调控关系挖掘的灵敏性和覆盖度,从而促进对以基因调控网络为代表的生化网络乃至整个生物学系统的了解。全文研究内容层层递进,互为支撑。本文的主要创新点包括:利用微阵列表达谱进行转录调控关系挖掘的新参数体系的构建;微阵列表达谱特征的无监督机器学习与优化;转录调控关系元序列特征的无偏提取。几方面研究互相支持和补充,用于转录调控关系的预测和挖掘。此外,从方法学研究来说,本研究具有较强的通用性和可拓展性。同时,疾病的遗传学检验日益成为研究的热点,目前来看,微阵列是最适用于这一领域的分析手段。因此,我们所建立的这一系列快速、参数化的表达谱分析体系,将会对临床诊断中利用微阵列的基因型研究和分析有所帮助。
其他文献
中国与日本食用菌贸易在两国对外经贸关系中占据重要地位,然而近年来技术性贸易壁垒问题成为两国食用菌贸易进一步拓展的消极因素,制约了两国食用菌贸易的健康发展。本文以此
生育保险是国家和社会通过生育保险基金的形式给予怀孕和分娩期女职工物质和医疗补偿的一项社会政策。实行生育保险制度是对广大妇女生育价值的认可和尊重,有利于保障育龄妇
目的:目前非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)的发病率日益增长。在发达国家,80%患有肥胖或糖尿病的成年人同时患有NAFLD[1]。由于NAFLD与胰岛素抵
嘉兴,历史上的嘉禾,拥有深厚的水乡文化,和秀丽的自然景观。为了使其能够持续发展,笔者从地理色彩学的角度提出保护和更新嘉兴具有地域特点的景观,通过对嘉兴城市周边环境色
新课改的全面落实,使得实际教学工作发生了翻天覆地的变化,微课成为一种重要的教育教学资源。当前,微课的应用十分广泛,无论是学生的自主预习,还是教师在课堂中的讲解,乃至于
目的观察加味当归补血汤预防人工全膝关节置换术后失血性贫血的价值。方法将60例人工全膝关节置换术患者随机分为干预组与对照组各30例,2组术后均常规给予琥珀酸亚铁片口服,
在企业管理中,会计管理占有重要地位,其中会计核算质量如何直接会对企业的发展产生影响。若会计核算质量较佳,则能对企业经营决策起到支持作用。然而在各种因素综合作用下,企
本文根据2FSK调制解调的工作原理,提出了一种基于FPGA芯片的2FSK调制解调器的设计方法。该方法采用频率选择法实现调制器设计,非相干解调法实现解调器设计。同时利用VHDL语言
近年来,随着经济的发展和城市化进程加快,大空间等高层建筑不断出现,带来了实用美观、通透性和采光性好的同时,也带来了一定的火灾风险,快速准确地实现大空间早期火灾报警,防
树立良好的社会形象是保险业发展之本,但当前行业失信行为屡见不鲜,社会形象面临挑战。本文揭示了行业社会形象欠佳的现状,分析了原因。并提出了提高保险业社会形象的相应对策。