论文部分内容阅读
基因组学的发展推动了整个生命科学的发展,包括生物学、脑科学、心理学和行为学,在此背景下诞生了认知神经科学、行为基因组学等新兴交叉学科。这些交叉学科的研究重点虽有所不同,但都希望从基因组的层面了解人类大脑、心理与行为之间的关系,并已发现了大量与人类精神、行为表现或疾病相关的基因。为使研究者能够便捷、及时地获得有关基因数据以及国际上最新的研究成果,本实验室先前建立了一个精神与行为相关基因在线数据库。数据库靠人工采集并录入相关基因信息,效率及准确性都较低。
为此,设计了一套自动化基因信息采集及录入数据库的软件工具,其主要包括:基因数据库数据自动获取、文献挖掘、基因名共词分析和单个基因添加四个部分。其中,基因数据库数据自动获取工具以使用最广泛的NCBI基因数据库为搜索对象,返回相关的基因,然后自动下载这些基因的记录文件,从中挖掘出基因各项信息录入数据库;文献挖掘工具通过PubMed搜索到相关生物医学文献,然后下载每篇文献的记录文件,挖掘文摘中出现的基因名,从而找到与搜索词相关的基因;基因名共词分析工具通过分析基因名共同出现于同篇文献的情况,体现出基因之间的关联性,从而帮助研究者分析基因的功能,寻找可能的新候选基因;另外,单个基因添加工具方便单个基因信息的自动下载、添加及更新。
通过使用该软件工具快速、准确地添加了大量基因信息,使精神与行为相关基因数据库的基因数量由三百多个增加至七百多个,保证了数据库数据的完备、及时和准确。
此外,本软件工具还具有良好的可扩展性和可移植性,通过加载其他领域的相关医学术语便可用于采集相关的基因,构建该领域的基因数据库。因此,本软件工具结合先前建立的在线数据库系统为各种领域相关基因数据库的构建提供了一种通用、高效的方法。