干细胞中microRNA和靶基因相互作用的数据库

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:llongll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一、课题研究的背景随着生物信息学的兴起,文献的挖掘慢慢成为生物医学的研究辅助手段,同时也成为大范围获取原始数据的重要手段之一;为推进疾病的诊断、预防和治疗研究起到关键作用。文献的挖掘在很多重要的生物信息范围(例如,获取蛋白质之间的作用、基因功能注释和生物通路等)起到关键作用。随着人类后基因组计划的进一步开展,占人类基因组99%的非编码序列越来越引起科学家的关注,其中最引人注目的是microRNA (miRNA)的发现。microRNA (miRNA)是真核生物中一类非编码单链长度约为21-25核昔酸(nt)的小分子RNA,与靶mRNA序列的3’UTR区或编码区通过碱基配对结合,使得靶mRNA降解或抑制蛋白质的合成,从而在转录后调节基因的蛋白表达。干细胞研究被美国时代周刊列为20世纪世界十大科技进展之首。在细胞分化的过程里,细胞会因为高度分化从而完全丧失了再分裂能力,最后衰老死亡。机体在生长适应过程中为了改变这一缺点,保存了一部分未分化的原始细胞,称之为干细胞。干细胞是生物个体起始细胞,拥有增殖、复制和分化潜能的特性。干细胞由受精卵发育分化而来,最初形成原始胚胎干细胞,然后分化增殖为囊胚样的结构,其内细胞团的胚胎干细胞具有形成人体种种组织的全能性,可慢慢分化发育成各个阶段胎儿的各种组织器官,干细胞随之失去全能性,成为亚全能、多能干细胞或具有特定功能的组织专能干细胞。生物信息学分析表明人类全部基因的三分之一都受到miRNA的调控,这表明miRNA分子实际上是基因调控网络中的核心成分。miRNA在多种生物的进程中起到了关键的作用,分别为调节细胞早期发育、细胞增殖、干细胞分化和凋亡,而突变的miRNA则与多种疾病和肿瘤相关。它具有近似癌基因或抑癌基因的功能。miRNA对靶基因的调控主要通过与其mRNA的3’UTRs碱基互补配对来呈现,具体的方法将取决于匹配的水平:近乎完全互补配对的时候则对其进行切割,反之则知识对其翻译表达的抑制。目前还没有在真核细胞中发现具有表达上调能力的miRNA。植物miRNA与靶基因匹配水平比较高,所以大部分为切割形式,而动物miRNA与靶序列的匹配水平比较差,所以大部分表现为抑制翻译。在生物体内,miRNA的特异性都不是很明显,往往是一个miRNA对多个靶基因作用,也可能有多个miRNA对一个靶基因进行调控的情况。miRNA的调控作用可能构成一种复杂网络,而且它自己也受到其他条件的调控作用。全部正常的细胞分化过程都可以随着miRNA表达谱的改变而改变,这种改变的反常就是各种肿瘤所共有的特性。所以,miRNA可能成为新的癌症分类、分型甚至分期的标记。由于其靶基因种类很多而且数量庞大,miRNA普遍介入到许多细胞信号转导系统中,并与其共一起组成巨大的调控网络,从而施展多种生物学功能。miRNA通过与信号蛋白直接或者间接作用来介入到肿瘤发生相关的信号转导过程里,进而影响肿瘤发生。甚至有研究表明,一些与肿瘤相关的信号转导通路可以直接调节某些特别的miRNA的表达。随着生物信息学的兴起,文献的挖掘慢慢成为生物医学的研究辅助手段,同时也成为大范围获取原始数据的重要手段之一;为推进疾病的诊断、预防和治疗研究起到关键作用。文献的挖掘在很多重要的生物信息范围(例如,获取蛋白质之间的作用、基因功能注释和生物通路等)起到关键作用。GenCLiP2.0结合了文献挖掘和数据库挖掘的能力,可以给生物医学研究人员提供一站式的服务,同时能够利用他们的专业知识对信息进行深度挖掘。从单个基因查找到批量基因的分析;从基因功能的注释到文献的关键词注释;从自动文献的关键词注释到手动添加的词注释;词相关基因查找从根据摘要到根据句子的共发生;从批量基因网络的自动构建到人工参与构建特定词的基因网络;从批量基因的模糊聚类到平均连锁等级聚类。GenClip2.0在查询摘要或者句子中基因的基础上,简历了摘要和句子中的单词和词的索引,系统可以根据用户提交的查询词汇迅速查找与它相匹配的摘要或者句子还有其中的基因,确定和查询词汇共发生的全部基因。1)在NCBI的MeSH网站上,查找关于干细胞的词汇结果有如下:[Stem Cell]、 [Stem Cells]、[Cell, Stem]、[Cells, Stem]、[Mother cell]、[Mother cells]、[Cell,Mother]、[Cells,Mother]、[Progenitor Cell]、[Progenitor Cells]、[Cell,Progenitor]、[Cells, Progenitor]、[Colony-Forming Unit]、[Colony-Forming Units]、[Colony Forming Unit]、[Colony Forming Units]、[Unit, Colony-Forming][Units, Colony-Forming]。2)登陆GenClip2.0 (http://ci. smu. edu. cn/GenCLip/analysis. php),获得包含关键词为干细胞的的基因。3)将获得的基因复制到Exce12007中进行筛选,选择以“MIR”开头的基因。4)将以“MIR”开头的基因重新输入GenClip2.0中,分别选择关键词,得到相关文献。5)对相关文献摘要进行详细阅读,收集文献的题目、PMID以及文献涉及的干细胞类型、物种类型、靶基因、microRNA和靶基因之间的相互关系6)去掉没有靶基因和干细胞类型的数据,最终获得记录。2.数据库构建MySQL数据库根据结构化查询语言(Structured Query Language, SQL)来实现和数据库之间的交流。SQL语言的主要功能就是构建各种数据库系统操作指令,用于插入、查询、修改或删除各类数据库对象。实现和MySQL的交互方式有指令行、编程接口、各类本地和远程的客户端。最方便快速的方法是通过指令行与数据库直接交流,在对SQL语言熟练的前提下,可以用编程接口对大数据量进行操作。对于不熟悉SQL语言的或者想方便日常管理的用户可以使用客户端,进行可视化的操作。1)下载WampServer软件,并安装调试。2)新建数据库,名称为"anaysis_of_microRNA"。3)数据库创建的下一步是对表格的创建。在数据库中新建表格,名称为"microrna_stemcell_targetgene"4)将目前得到的记录加载到数据库中。加载数据有两种方法,第一种方法为在MySQL命令提示符下,对每一条记录进行加载到数据库中,该方法保证了数据的准确性,及时发现所加载数据存在的问题,但是消耗大量时间和人力;另外一种方法为将所收集的记录经Excel表格进行“.csv”格式转换,在WampServer软件利用数据直接加载控件直接将转换的记录加载到数据库中,该方法可以节省时间,缺点为精确性不够,不能实时发现所加载数据存在的问题。因此,在记录加载中,应结合实际,合理使用两种方法。5)数据加工浏览加载到数据库的数据,将不能正常显示的数据进行改正。3.网站建设在浪潮高性能计算集群服务器上,使用LAMP组合(Linux+ Apache+ MySQL+ PHP/Perl),即整个系统工作在Linux平台,Web服务器是Apache,使用MySQL作为数据库系统,同时运用PHP/Perl脚本语言联合HTML语言和JavaScript进行系统开发。在最大的限度上设计出一个稳定并且容易扩展的网络系统,和一个简单而且方便操作的网页界面。PHP是一种执行于服务器端的,嵌入HTML文档的脚本语言,语言风格与C语言相类似,如今被许多的网站编程职员普遍的使用。在WEB服务器端中PHP脚本的运行方法:当WEB服务器收到一个WEB页面请求的时候如果请求的是HTML文件,WEB服务器就直接给浏览器提供文件的显示功能;如果请求的文件是以“.php”为扩展名的,则WEB服务器先把文件传给PHP引擎执行,分析两个PHP分界符号之间的PHP程序,然后再将PHP程序按照程序运行的时候各类差异的条件转换为相呼应的HTML代码返回给客户端的浏览器。PHP奇特的语法包含了C、Java、Perl以及PHP自创的语法,执行动态网页比CGI和Perl更加快速。1)网页整体布局。网页一共分为五个部分,分别为:header1、header2、header3、 menu、cytoscapeweb。2)连接数据库。该课题的成败在于是否可以顺利连接相对应的数据库。3) microRNA、干细胞、靶基因之间的组合设置,共有八种组合关系。4)关于microRNA和靶基因配对的图像显示。将想对应的microRNA和靶基因放入同一个数组中,其中microRNA为$geneNode[$idl],靶基因为$geneNode[$id2]。1.登陆GenClip2.0 (http://ci. smu. edu. cn/GenCLip/analysis. php),获得包含关键词为干细胞的的基因498个。2.将获得的基因复制到Exce12007中进行筛选,选择以“MTR”开头的基因,63个。3.将以“MIR”开头的基因重新输入GenClip2.0中,分别选择关键词,得到286篇相关文献。4.对相关文献摘要进行详细阅读,收集文献的题目、PMID以及文献涉及的干细胞类型、物种类型、靶基因、microRNA和靶基因之间的相互关系。5.去掉没有靶基因和干细胞类型的数据,最终获得356条记录。从上述所得数据可以得到:1.涉及文章118篇;2.记录中共涉及4种动物模型,分别为人类、小鼠、大鼠、转基因小鼠;3. microRNA中共收集58种,其中前三位分别为MIR145(共有55条记录)、MIR21(共有31条记录)、MIR34A(共有16条记录);4.靶基因中共收集153种,其中前三位分别为Oct4(共有19条记录)、Nanog(共有19条记录)、Sox2(共有17条记录);5.干细胞类型中共收集53种,其中前三位分别为mesenchymal stem cells (共有66条记录)、 embryonic stem cells(共有38条记录)、breast cancer stemcells(共有27条记录)。6.干细胞中microRNA和靶基因相互作用的系统提供了三种检索词选择,分别为干细胞类型、microRNA、靶基因等,可以形成八种不同的组合方式。7.结果显示了该检索词搭配条件下所检索到的数量,以表格的方式显示该检索结果的序号、实验动物、干细胞类型、microRN A、靶基因、作用以及来源文献,其中microRNA和靶基因可以链接到NCBI的GENE中相对应的基因介绍网页,来源文献可以链接到NCBI的PubMed中所对应的网页,让使用者能够快速、有效地了解所检索信息的相关信息。同时,在网页下方形成一个关系图,直观地展示出检索得到的microRNA和靶基因之间的相互关系,所形成的关系图可以进行放大缩小等常规操作。四、结论干细胞中microRNA和靶基因相互作用的数据库的开发最大程度上设计出一个稳定并且容易扩展的网络系统,同时是一个简单并且容易操作的网页界面。结果显示了该检索词搭配条件下所检索到的数量,以表格的方式显示该检索结果的序号、实验动物、干细胞类型、microRNA、靶基因、作用以及来源文献,其中microRNA和靶基因可以链接到NCBI的GENE中相对应的基因介绍网页,来源文献可以链接到NCBI的PubMed中所对应的网页,让使用者能够快速、有效地了解所检索信息的相关信息。同时,在网页下方形成一个关系图,直观地展示出检索得到的microRNA和靶基因之间的相互关系,所形成的关系图可以进行放大缩小等常规操作。解决了由于实验原始数据众多,杂乱无章,无法快速获得所需干细胞类型中microRNA与靶基因的相互作用关系的问题,给使用者的后续实验提供参考,降低实验成本。然而,该系统还存在一些不足,收集文献共118篇,在数量上不能很好地突出该实验的优势。没有收集文献中所涉及的实验材料和方法,对于实验者后续实验的指导作用明显减弱,不能高效地进行更新,不能显示实验材料和方法,网页页面不够精美。
其他文献
布氏菌病(Brucellosis,简称布病)是感染布鲁菌后而引起的能够在人和动物中传播的一类人兽共患病。可通过口腔粘膜、鼻腔、眼结膜、生殖道、甚至未损伤的皮肤而感染。家畜感染后
随着“三网融合”的不断推进,面向互联网电视的多媒体内容服务产业得到了迅猛的发展。相比于传统的数字有线电视,互联网电视的突出优势在于融合了互联网的交互性和开放性,使用户
针对毫米波干涉逆合成孔径雷达(InterferometricInverseSyntheticApertureRadar,InISAR)的应用需求,对运动目标成像探测、速度估计、干涉测角定位等技术进行了深入的研究。  
杨柳科杨属的胡杨(Populus euphratica Oliv)具有极强的耐受干旱和盐渍的能力。关于它耐受盐胁迫的生理特征有大量报道,而对其抗盐的分子机制鲜有报道。本文通过对胡杨PESOSl(
结核病是由结核分枝杆菌引起的一种慢性传染病,又被称为痨病或“白色瘟疫”。我国是全球范围内结核病的高负担国家之一,每年新增结核病患者人数和结核病导致的死亡人数居高不下。自上世纪20年代以来,卡介苗(bacillus Calmette-Guerin,BCG)一直是预防人类肺结核唯一可用的疫苗。虽然BCG对婴幼儿结核性脑膜炎和播散型结核病有明显的预防效果,但在婴幼儿时期接种并不能预防青少年及成年人结核病
学位
灵长类动物生长发育规律的探讨以及性别二态研究是人们一直关注的课题。本文研究的目的在于通过对太行山猕猴活体及骨骼标本的研究,揭示太行山猕猴生长发育规律并探讨部分骨骼
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
随着半导体工艺的发展,芯片设计变得越来越复杂,验证也变得越来越困难,传统的验证方法学已满足不了当今复杂设计的验证需求,VMM(verification methodology manual)作为一种高级的
2008年,搭载了干涉型成像光谱仪(HSI)的环境与灾害监测预报小卫星HJ-1A成功发射。该星下传的高光谱数据具有谱段多、下行码速率高以及成像处理算法复杂等特点,这无疑对遥感卫星