基因芯片数据管理及数据挖掘

来源 :中国科学院研究生院(上海生命科学研究院) | 被引量 : 3次 | 上传用户:Mr_Zhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术是90年代以来影响最深远的重大科技进展之一,基因芯片使得同时研究成千上万个基因的表达成为可能。如何对基因芯片实验产生的海量数据进行有效的管理和分析已成为使用这一高通量技术的瓶颈。一方面,已有的分析软件虽然提供了聚类分析和一定程度的数理统计分析,但仍然很难从结果中得到有价值的生物学知识及数据背后隐藏的相互联系;其次,它们大多集成度较差,常需要在处理数据时切换于多个程序之间,既造成使用不便也带来了数据交换及保密安全性方面的顾虑。目前,国外很多大学(如斯坦福大学),研究机构(如NCBI、EBI),软件公司纷纷建立自立的生物信息集成系统(如SMD,ArrayExpress),对基因芯片产生的数据按照国际公认的标准进行管理。在我国,这方面的研究领域还是一个空白。因此,开发具有自主知识产权的有关基因芯片表达数据管理和分析软件系统,为基因芯片数据的知识发掘提供技术手段,是我国能否在这一领域跟上世界先进水平的关键之一,具有非常大的科学研究价值和市场价值。论文中研究开发的ArrayLims体系,作为基因芯片表达数据管理和数据挖掘平台,由ArrayStore数据管理系统和ArrayMiner数据分析系统构成。ArrayStore数据管理系统能够对芯片生命周期全过程所产生的各种数据进行全程监控、管理,提供了便利的网上提交、修改、删除及查询功能。相关数据提取能够导入到基因芯片分析系统中作进一步分析。ArrayMiner数据分析系统提供了聚类分析、GO注释、生化代谢通路分析等功能,可视化的图形分析结果通过web页面返回用户。与现有同类系统相比较,ArrayLims具有以下特点:1.基于国际先进技术及工业标准MIAME(The Minimal Information About aMicroarray Experiment),使得其能很好的与国际上其它实验室及公共数据库进行数据交流。2.构造了基于工业标准的通用生物芯片数据仓,具有自主知识产权。数据库设计具有极大的灵活性,可以同时满足实验室管理和作为大型公共数据仓的需要。
其他文献
依据上海高校"一流本科建设引领计划"项目,从项目背景、项目成效和项目反思三个方面进行文本分析,目的是积累经验、总结规律、发现亮点、找出问题,积累一流本科人才培养的制
问题提出:案外人异议之诉实务困境民事执行中,执行机关为及时、迅速地实现债权人享有的执行依据所载明的债权,遵循的是形式化原则,即在对执行标的物进行查封、扣押、冻结时,
本文介绍了金花葵的植物学特性、药用价值、医疗保健作用、观赏价值和栽培技术要点。随着农业供给侧结构性调整的深入,金花葵将是一种具有广阔开发前景的植物。
网红经济正在成为中国经济的新亮色,而隆力奇也正在积极探索新零售方式,拥抱网红经济,赋能青年创业。2019年12月11日,近百位来自全国各地的抖音、快手短视频网红达人齐聚隆力
邓小平理论和"三个代表"重要思想一脉相承,它们具有共同的理论基础,是当代中国的马克思主义;拥有共同的本质特征,体现了"解放思想、实事求是、与时俱进、开拓创新"的科学精神
国医大师柴松岩擅治闭经。对因节食减肥致闭经阴血亏虚证,施养阴益肾、活血通经之法,强调补养阴血。药用女贞子、墨旱莲、枸杞子、熟地黄、阿胶珠、当归、玉竹、北沙参、百合
最近,国内外出现了一种新型的机械无级变速器——钢球无级变速器。原理。利用几个(3~8个,球数越多受力越均匀)耐磨材料(镍钢)制成的光滑钢球和圆锥盘来实现其传动(见示意图)
《新著国语文法》的语法体系是句本位的,该著作的的句本位思想主要体现在四个方面:依句辨品、离句无品的词类观,句子结构分析上的中心词分析法,语法分析的工具——图解法,实体
采用随机抽样方式共调查了黄山学院710名在校生的日常饮食情况。经过调查,在这些调查对象中仅有5.07%的学生没有外卖消费行为。学生订购外卖时间段主要集中在10点至12点,选择