面向生物数据集成分析的方法和工具研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:q87995210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术和计算机技术的发展,各类生物数据正在急剧增长,如何利用大量数据从综合整体角度研究问题将成为研究重点,计算技术为生物数据的分析和形成新的生物假说提供了重要技术支持。生命科学的研究越来越离不开计算机科学,需要计算方法和辅助工具来支撑生物学的研究。一方面是对生物实验的支持,设计生物实验是复杂和容易犯错的,尤其是随着高通量技术的发展,仅凭人工设计实验几乎很难实现,需要工具来辅助设计:另一方面是从数据处理和分析的角度,面对大量生物数据,如何将数据集成以及发现数据内部及它们之间的内在联系和区别已经成为生物信息学中的热门课题,需要计算方法和辅助工具来帮助研究者更好地科研。计算机科学对于生命科学的发展影响越来越大,针对上述生物实验设计、数据处理和分析两方面的计算方法和工具需求,本文开展了相关研究,主要工作包括:(1)面向DNA芯片合成技术的计算技术研究。针对芯片技术应用于基因合成的问题,基于传统基因合成设计方法提出了一种改进方法,适应新的芯片合成技术,并在此基础上应用于代谢路径合成设计和蛋白质定向进化,设计实现了面向芯片合成技术的代谢路径合成设计CAD系统和基于改进重组方法的同源蛋白库构建工具。(2)基于文献挖掘和数据库集成构建疾病网络。基于文献挖掘和数据库集成,综合利用数据库和文献来获取关于疾病的全面知识,取代人工收集信息,设计实现了一个自动化构建疾病网络的系统。(3)结合生物通路和网络知识整合分析Cancer Genome Atlas(TCGA)癌症多维数据。结合生物通路信息,给出了一种分析多种癌症突变基因的方式,相关分析结果揭示了显著突变基因参与的多种细胞过程、不同癌症共同显著突变和特异性突变以及同组织内的癌症具有相似性,应用集成网络发现了不同癌症的显著突变基因具有强连通关系:提出利用蛋白相互作用(PPI)网络来集成分析结肠癌三种类型数据之间的关联,相关分析结果说明了不同基因的异常改变通过相互作用网络产生相似的表型,识别了重要致癌基因。
其他文献
随着计算机网络技术的迅猛发展和广泛应用,特别是Internet的快速普及,促进了计算机与互联网科技的不断创新与升级。网络设施和资源对于国家、企业和个人的重要性日益增强,在
关键词抽取是文本信息处理的重要技术,是在进行文本自动摘要、文本自动分类、主题提取及专利检索分析等文本信息理解工作时,都要应用到的一项关键技术。关键词一要反映文本的
近年来,随着互联网的发展,服务器整合、虚拟主机和资源管理等需求的出现,虚拟机进入了另一个繁荣时代。同时,随着x86服务器市场的快速增长,x86虚拟机更是为人们看好。但由于
在计算机网络、数据通信以及存储系统中存在许多潜在的不安全因素,密码技术是保护信息系统机密性、完整性的有效手段,是解决信息网络数据安全和应用安全的核心问题。密码编码技
随着近年来信息技术和知识产业的迅猛发展,过往的一些传统服务产业逐步演化成为一个以信息技术为主导的新型的服务产业。海量的信息数据已经变成新兴产业中不可或缺的重要元
本文研究主要包括两方面内容。一是图案主题色彩的定义及设置方法。对一些图案设计实例进行分析,发现它们的色彩主题并对它们进行形式化说明。提出了基于语义的主题色彩渲染
随着经济的高速发展,世界酒店业在集团化和连锁化的方向下高速成长,B2B集中预订是网络时代酒店预订发展的趋势。本文在充分分析基于Agent模式的B2B酒店预订系统功能的基础上,在
合规系统在现代信息处理中发挥着越来越重要的作用,在金融交易,企业管理,政府财政和高校招生等领域有着广泛的应用。本文以合规系统为研究对象,提出了“面向域”的概念,并实
随着互联网的不断发展,DSL技术作为宽带接入技术中的主流,被应用到各种家庭网关和企业网关中。与此同时,随着无线技术的广泛使用,无线AP的分布也是越来越广泛。手工安装和维
运动数据的采集是计算机辅助训练系统中的关键技术。为了给运动仿真提供更快捷和准确的数据,本文提出了一种基于立体测量的运动数据采集的方法。这个方法主要由两部分组成:运