论文部分内容阅读
该文根据生物学研究领域的不同需要,运用数据库系统理论和技术,结合生物信息学研究方法,首次构建了转录因子细胞特异表达数据库(CYTOMER)、中华民族基因组多样性数据库(Genomic Polymorphism of Chinese Ethnic Groups, GPCEG)和中国蛋白质数据库(Chinese Protein Database, CPDB)三个生物信息专用数据库,对中国生物信息学数据库的建设具有一定的价值.转录因子细胞特异表达数据库CYTOMER(中德科技合作项目)是转录因子数据库(TRANSFAC)的扩充和延伸.作者在构建该数据库时收集了人和小鼠两个物种的已知转录因子在不同生理系统、不同器官、不同细胞类型及其不同发育时期的表达状况,并整合了转录因子结合位点预测软件MatInspector和转录因子数据库TRANSFAC,用户可以通过该数据库系统预测某DNA序列中可能的转录因子的结合位点,以及这些转录因子在不同细胞、器官和系统中的表达情况,为从基因组水平上研究基因表达调控提供了生物信息数据分析平台.中华民族基因组多样性数据库是配合"中华民族基因组的结构和功能研究"(自然科学基金委重大项目)中基因组多态性研究而构建的专用数据库,包括民族名称及基本情况介绍、生理特征、基因多态性数据、永生细胞株系、参考文献、相关数据库链接等内容.中国蛋白质数据库是"中国生物医学数据库"(科技部重点项目)的子库,作者收集了国内科学家或国外华人科学家研究工作得到的蛋白质一级结构序列、三维结构原子坐标及其相关文献等信息资源,此外,还包括糖尿病、乳腺癌、流感等常见病、多发病相关蛋白质,以及抗原抗体、蛋白质工程等方面的数据,并将扩充到高血压、心脏病、肝炎、肿瘤等其它疾病数据.该数据库具有基于Web的浏览、检索功能,并与SWISSPROT等国际著名蛋白质数据库建立了链接.上述三个数据库的构建,均基于关系型数据库系统,基中转录因子细胞特异表达数据库和中国蛋白质数据库基于UNIX操作系统,并以MySQL作数据库管理系统、以Apache作Web服务器,以Perl脚本语言作为数据库和应用程序的接口.这两个数据库已经通过互联网为国内外用户提供服务.