论文部分内容阅读
不孕不育是全世界关注的研究课题。目前,不孕不育的发病率有逐年上升的趋势。据报道,每100对已婚夫妇中,就有10对夫妇存在不孕不育问题,其中由男性导致的不育占到了大约一半。
在由男性导致的不育中,男性精子活力低是主要的因素之一,临床称之为弱精症。弱精症病因众多,包括感染、精液液化异常、免疫因素、内分泌因素、Kartageners综合征、染色体异常、精索静脉曲张以及微量元素缺乏和不良生活习惯等因素。临床对弱精症的确诊,需要连续三次取精液,每次间隔3-7天,每次精液常规检查结果都符合WHO弱精症的诊断标准,才可确诊为弱精症。因此患者依从性差、费时、费力,不经济。而且临床还有因为不明的弱精症,称为特发性弱精症,即患者精液常规各项指标均在正常范围,精子数量及运动都属正常,但因精子受精力低而不育。
由于弱精症病因众多,要在临床上逐一排查弱精症的致病因素几无可能。正因为如此,弱精症病因不明,发病机制不明确,故无法采取有针对性的治疗措施,治疗方法多为经验式,治疗效果也不令人满意,最终只能选择人工辅助生殖。人工辅助生殖技术的应用,实现了部分不能生育人群的传宗接代的愿望,但同时也对人类社会、伦理和家庭带来了巨大的冲击。因此,深入阐述弱精症致病的分子机制;筛选弱精症特异的分子靶标,为临床弱精症的快速、明确诊断提供理论依据,为后续开展有针对性的治疗,提高治疗效果奠定基础,是具有重大的社会和科学意义的研究课题。
对弱精症的分子机制人们已经进行了大量的研究,揭示出了许多与弱精症密切相关的基因或蛋白质。但随着基因组研究的不断深入,类似功能的基因或蛋白质必将会发现得越来越多。显然传统的研究策略,设计一个实验,阐述1至2个基因的功能,效率比较差。而且这种分散的研究,不利于比较各基因间的相互联系和相互作用,不利于弱精症相关基因调控网络的阐明。
因此,采用一种高通量的研究方法是大势所趋。
基因芯片技术是在一个有限的支持物上,同时固定上成千上万的基因探针,通过一次杂交实验,实现平行、快速、高通量的检测分析,是生命科学研究的利器之一。应用基因芯片技术,研究者进行了大量的基因表达谱研究(oligo表达谱芯片)、基因DNA拷贝数变化的研究(aCGH芯片),基因突变研究(SNP芯片)等等。
高通量基因芯片技术的应用,产生了海量的数据,但数据并不等于信息和知识,因此迫切需要一种新的技术和手段去深入挖掘和阐述隐藏在这些数据背后的生物信息和知识,从而实现资源共享,节约大量的人力、物力和财力。
生物信息学技术就是综合运用生物学、信息科学的各种知识和工具,对复杂的生物数据进行获取、处理、存储、分发、分析和解释,从而得到我们能够理解和接受的各种知识。生物信息学技术已经在生命科学、药学等相关领域得到了广泛应用,极大地促进了这些学科的发展。
在生物数据爆发式增长的今天,理解大量生物学数据所包括的生物学意义已成为后基因组时代极其重要的课题。生物学数据的巨大积累,辅之以正确有效的工具,将导致重大生物学规律的发现。因此,本课题综合利用基因芯片技术和生物信息学技术,筛选弱精症的分子靶标,有可能在已有的研究结论上,去粗取精,去伪存真,分析真正与弱精症相关的、具有区分性的分子靶标,为下一步深入发现和阐明弱精症的分子机制,为弱精症的确切诊断和有针对性的治疗提供理论基础。
选取在南方医院生殖中心因男性弱精症导致不孕不育而就诊的丈夫的精液样本作为实验组,选取因女性因素导致不孕不育就诊的健康丈夫的精液作为正常对照组,年龄24-48岁。50%Percoll一层法离心后收集精子,加入RNAstore保存液-20℃冰箱保存备用。分别随机选取对照组和实验组精子样本各12例,每4例合并为一份,用QIAGEN RNeasy mini kit提取实验组和对照组精子样本的总RNA。1.2%甲醛变性凝胶电泳和Agilent 2100 BioAnalyzer微流路凝胶电泳检测精子总RNA的质量。之后应用T7 Promotor primer一步法合成cDNA第一链和第二链,aaUTP标记cRNA,纯化后分别用Cy3和Cy5对实验组和对照组样本进行荧光标记。荧光标记样品纯化后测定荧光分子浓度及掺入率,调整浓度后进行cRNA样品片段化反应并与Agilent human genome 4×44K microarrays杂交。杂交数据上传至GeneSpring GX10工具包中进行差异基因筛选、Pathway分析和GO分析等。
进一步,应用BRB-ArrayTools和基于不同算法开发的GSEA基因表达谱数据分析软件分析弱精症芯片杂交数据,BRB-ArrayTools筛选出的差异表达基因与GeneSpring10的分析结果相比较,得到在两种方法中共同的弱精症差异表达基因。GSEA分析得到的富集功能基因亚集与其他两种方法分析得到的差异基因富集信号通路相比较,得到更显著和更有生物学意义的信号转导通路。
对分析得到的弱精症相关基因,分别应用GATHER、PANTHER、DAVID、STRING、GO等多种生物信息学工具对这些基因的分子功能、信号通路、编码蛋白质间的相互作用等方面进行了深入分析。并结合FACTA文本挖掘工具,对这些基因与弱精症间的相关性报道进行了检索。
最后,考虑到临床弱精症常合并畸精症,弱精症和畸精症中的差异表达基因间可能会有重叠。因此,将弱精症相关基因上传至NextBio,与NextBio中已有的畸精症、NOA、精子发生、早期胚胎发育等疾病和生殖相关临床样本的实验数据和结果进行比较分析,得到真正具有临床区分性的、与弱精症密切相关的基因。
结果按照我们对弱精症临床样本的准入标准,共收集到成年男性精子活力正常的对照组临床样本120例,弱精症实验组临床样本160例。提取的精子总RNA经变性甲醛凝胶电泳、Agilent 2100 BioAnalyzer微流路凝胶电泳检测后发现,精子总RNA与正常体细胞的总RNA,在电泳图形、RNA的组成、比例等方面都不相同;精子总RNA的质量检定,依据正常双倍体体细胞的判定标准被判定为不合格,但经文献检索和后期的芯片杂交实验证明,精子作为终末分化的单倍体细胞,总RNA的组成特点有异于一般的双倍体细胞,在精子总RNA中没有占优势的核糖体RNA的表达,精子的RNA是由许许多多大小从几十bp到几千bp不等RNA片段组成,可能是mRNA、rRNA、tRNA,也有可能是小分子的RNA。精子的RNA总量不多,但数目不少,具有丰富的RNA表达。
Agilent human genome 4×44K microarrays杂交数据经GeneSpring10分析后发现,在含有41000个探针的芯片中,当p<0.05时,筛选到1265个与弱精症相关的差异表达基因,其中307个表达上调,958个表达下调;当p<0.01时,筛选到229个与弱精症相关的差异表达基因,其中46个表达上调,183个表达下调。BRB-ArrayTools的分析结果表明,无论统计显著性标准是p<0.05还是p<0.01,当FDR<10%时,与弱精症相关的差异表达基因都只有261个。对比两种表达谱数据分析软件的差异基因分析结果,与弱精症密切相关的共同差异表达基因只有71个,其中10个基因共同表达上调,61个基因共同表达下调。这71个共同差异表达基因,即是与弱精症发生、发展密切相关的基因,我们把这一组71个共同差异基因定义为弱精症的分子标签(signatures)。
下一步应用不同的基因芯片数据分析软件、不同的生物信息学分析工具,对上述71个弱精症分子标签基因的分子功能、信号通路、编码蛋白质间的相互作用、与弱精症发生的相关性等进行深入分析和文献挖掘,得到的结论是高度一致的,即:在弱精症精子中,精子的基本生物学过程,包括细胞的基本代谢过程、蛋白质代谢、运动结构组成等,都是表达下调的。弱精症分子标签中的各个基因在表达的时序性上、功能的相互联系上都比较散在,没有相对富集的信号通路,这些基因编码的蛋白质问也没有复杂而强烈的相互作用和联系。
进一步,应用GSEA软件分析在弱精症中是否有富集表达的功能基因亚集,以期寻找出在弱精症中可能存在的信号转导通路。但GSEA分析结果显示,在弱精症样本中,仅有UBIQUITIN MEDIATED PROTEOLYSIS功能基因亚集在弱精症组中显著性富集且下调表达,这与我们的分析结论是一致的。
所有这些分析结论提示我们,这71个弱精症分子标签基因分散在不同的细胞功能、不同的细胞信号转导通路中,彼此间没有功能上直接或间接的相互联系。因此,它们都有可能成为弱精症诊断候选的分子biomarker。
为了进一步验证这71个弱精症分子标签基因在弱精症临床样本中表达的特异性,我们应用了NextBio工具,对这71个分子标签基因在NextBio的Biogroups、Diseases、Tissues项下,与其他研究者上传的相关研究数据和结果进行比较分析。结果发现,71个弱精症分子标签基因编码62个蛋白质,从这62个编码基因中排除与精子发生、胚胎早期发育、NOA和畸精症相关的基因后,得到了17个候选的弱精症分子诊断靶标。在这17个候选诊断靶标中,SEMG1基因/蛋白质是与弱精症密切相关的、具有良好区分性、特异性和临床实用性的,极富潜力的临床诊断弱精症的候选分子靶标。