基因表达数据的集成、分析和可视化

来源 :东南大学 | 被引量 : 0次 | 上传用户:engineer2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成以及分子生物学等相关学科的发展,基因组学的研究重心开始从揭示生命的所有遗传信息转移到分子水平功能的研究上。生物信息学的研究重心也随之由基因组序列转移到序列生物学意义的研究上。在后基因组时代,生物信息学主要研究基因组编码序列的转录、翻译的过程和结果,着重分析基因表达调控信息,分析基因及其产物的功能。由芯片技术产生的基因表达数据包含了丰富的生物过程信息,这些信息在人类疾病相关研究中有着重要的作用,基因表达与基因功能相结合也成为研究基因调控机制的一个重要手段。如何有效地分析利用这些数据成为生物信息学研究的中心任务。为了推动基因组学的研究,我们实验室建立了基因表达调控信息集成数据库系统(GRI)。目前GRI系统的数据主要是以基因调控信息为主;GRI系统提供了基因调控信息复合查询工具和基因相关信息下载工具。为了更好地研究基因的功能,为相关领域的科研工作者提供数据挖掘和分析的平台,本文将基因表达数据集成到GRI系统中,实现了基因表达数据和基因调控数据的有机结合并提供了相关的工具。基因表达信息主要包括:基因表达数据、基因表达数据的实验信息、基因表达数据对应的探针信息,这些数据之间互相关联,形成有机的整体。本文在研究了GEO、ArrayExpress等国际知名的基因表达数据库和现有GRI系统的基础上,完成了基因表达数据库的需求分析与设计,实现了对基因表达信息的集成,使之与GRI系统中的基因调控信息有机地融合到一起。本文实现了GRI系统中基因调控信息的智能更新;完成了基因表达数据库的设计,表达数据的获取、分析和集成;实现了基因表达数据的可视化工作以及基因表达数据相关信息的查询,为用户提供了友好的查询界面。在完成GRI系统表达数据库设计之后,对获取的数据进行分析,提取出基因表达相关的信息并集成到系统中。这是一项复杂的工作,因此我们设计了基因表达数据分析集成程序,实现了基因表达信息自动分析处理。同时,为了保证GRI系统的数据及时更新,我们采用智能代理技术,编写了程序,初步实现了基因调控信息地更新。在GRI系统现有查询服务的基础上,我们将基因表达信息查询服务与现有的基因调控信息查询服务有机地结合在一起,实现了基因调控信息和基因表达信息之间的关联查询。同时,我们还详细分析了国际知名网站可视化的设计。结合实际情况,采用了Servlet +Applet可视化方法,以柱状图和曲线图两种显示方式实现了基因表达数据的可视化,使用户对数据库所提供的信息有一个直观的理解。用户可以下载自己感兴趣的信息作进一步地分析。GRI系统是一个自主开发研制的基因表达调控信息数据库系统,它不是单纯的国外数据库的镜像,而是一个能够兼容不同数据,可以从不同数据源自动下载和更新数据的集成系统。它有机地将基因调控信息和表达信息融合在一起,为科研人员提供了一个很好研究的平台。GRI系统采用了先进的Oracle以及Java的相关技术,具有很好的性能以及跨平台能力;它友好的界面为用户提供了不同数据间的关系查询,为进一步的分析奠定了良好的基础。我们希望,GRI系统能成为生物信息学相关领域的研究人员的有力工具。目前GRI数据库系统已经初具规模并进入运行阶段。
其他文献
铜是一种用途十分广泛的金属,随着经济的日益发展,其市场需求量逐年增长。近年来铜冶金技术发展迅速,但我国铜矿石资源有限,导致出现铜冶金原料供应紧张的现象,铜矿品位从二
随着商业的不断发展,各种形式的商标进入人们的视野。2013年《商标法》在商标构成要素中,新增“声音”要素,而且改变商标元素的完全列举形式,表明我国开始重视非传统商标的保护。虽然萨塔商标案和阿迪达斯案曾引发人们对位置商标的讨论,但是在旧的商标制度下,位置商标明确是不能注册的商标。近期,北京市高级人民法院对鲁布托“红鞋底”商标案的判决引发各界对位置商标的关注,法院将涉案商标认定为“限定使用位置的单一颜
<正> 65-1-8号南瓜种子只有种仁而无种皮,故称裸仁南瓜。它是由山西省农业科学院周祥麟研究员选育的。其裸仁性状稳定,可代代遗传。1984年通过国家鉴定。65-1-8号裸仁南瓜在
产业集聚作为经济活动的一种普遍现象,在区域经济增长中的作用日益突出,已经成为经济学科重点研究的领域。产业集聚在特定区域形成,产生集聚效应作用于区域经济,促使区域内的
近年来,铁矿石价格连续上升,高品位矿石日趋枯竭,炼铁厂不可避免地使用越来越高脉石含量的原料,原料的恶化对烧结工艺有了新的挑战。在烧结过程中,复合铁酸钙(SFCA)是高碱度烧
针对适合在小空间运行的新型双臂翻板门的负载特性,设计基于ARM控制的直流无刷电机控制系统.采用磁场定向控制算法控制直流无刷电机的电机定子相电流,使之接近于正弦波,使得
目的:本实验旨在探索血红素加氧酶-1(HO-1)基因的表达水平与患者接受异基因造血干细胞移植(allo-HSCT)后发生急性移植物抗宿主病(aGVHD)严重程度之间的关系,并通过慢病毒转基
【背景】 卵巢癌的死亡率居妇科恶性肿瘤首位,70%的患者就诊时已属晚期,且多因转移而死亡,因此探讨肿瘤浸润转移分子作用机制和基因治疗成为目前卵巢癌研究的热点。CD147属免疫
随着互联网的急速发展,微博依靠着它的个体性和及时性等特点,得以迅速发展并成为了网络用户用来分享和发布信息的重要载体。人们越来越多的借助于微博等社交媒体分享自己生活和情感,这就使得微博等社交媒体中出现大量携带主观色彩的信息,这些主观信息往往具有较强的情感色彩,对这些主观信息进行归纳分析能够获取很多知识和数据,对我们生活、工作带来帮助,因此对于微博的情感分析具有较大的价值和意义。目前,文本情感分析正在