论文部分内容阅读
基因芯片技术是90年代以来影响最深远的重大科技进展之一,基因芯片使得同时研究成千上万个基因的表达成为可能。如何对基因芯片实验产生的海量数据进行有效的管理和分析已成为使用这一高通量技术的瓶颈。一方面,已有的分析软件虽然提供了聚类分析和一定程度的数理统计分析,但仍然很难从结果中得到有价值的生物学知识及数据背后隐藏的相互联系;其次,它们大多集成度较差,常需要在处理数据时切换于多个程序之间,既造成使用不便也带来了数据交换及保密安全性方面的顾虑。目前,国外很多大学(如斯坦福大学),研究机构(如NCBI、EBI),软件公司纷纷建立自立的生物信息集成系统(如SMD,ArrayExpress),对基因芯片产生的数据按照国际公认的标准进行管理。在我国,这方面的研究领域还是一个空白。因此,开发具有自主知识产权的有关基因芯片表达数据管理和分析软件系统,为基因芯片数据的知识发掘提供技术手段,是我国能否在这一领域跟上世界先进水平的关键之一,具有非常大的科学研究价值和市场价值。论文中研究开发的ArrayLims体系,作为基因芯片表达数据管理和数据挖掘平台,由ArrayStore数据管理系统和ArrayMiner数据分析系统构成。ArrayStore数据管理系统能够对芯片生命周期全过程所产生的各种数据进行全程监控、管理,提供了便利的网上提交、修改、删除及查询功能。相关数据提取能够导入到基因芯片分析系统中作进一步分析。ArrayMiner数据分析系统提供了聚类分析、GO注释、生化代谢通路分析等功能,可视化的图形分析结果通过web页面返回用户。与现有同类系统相比较,ArrayLims具有以下特点:1.基于国际先进技术及工业标准MIAME(The Minimal Information About aMicroarray Experiment),使得其能很好的与国际上其它实验室及公共数据库进行数据交流。2.构造了基于工业标准的通用生物芯片数据仓,具有自主知识产权。数据库设计具有极大的灵活性,可以同时满足实验室管理和作为大型公共数据仓的需要。