癌症相关的非编码RNA及其介导的生物标记物的预测

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:a429629261
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物体内,转录形成的RNA依据其是否直接参与指导合成蛋白质(或多肽)可被简单地分成两类:蛋白编码RNA(mRNA)和非编码RNA(ncRNA)。起初人们普遍认为大多数ncRNA是“垃圾RNA”。随着对ncRNA作用机制和功能的深入研究,发现在很多重要的生命活动中均有ncRNA参与,如DNA复制,RNA剪接,蛋白质翻译,基因组防卫等。而且通过对人类基因组以及疾病机制的研究,人们发现不仅基因与人类复杂疾病的发生和发展密切相关,ncRNA的表达失调和异常也会导致各种复杂疾病的产生。因此,预测ncRNA与复杂疾病之间的关系以及识别复杂疾病的生物标记物,对于进一步了解ncRNA的作用功能以及疾病的预防和治疗有着重要意义。miRNA是真核生物中一类重要的内源性调控ncRNA。成熟的miRNA以碱基互补(完全或不完全)配对的方式与目标mRNA的3’端的非翻译区(Untranslted region,UTR)结合,抑制该靶标的翻译从而使基因的表达沉默。研究表明,在胚胎早期发育、病毒防御、细胞增殖、造血过程、细胞凋亡等一系列生命进程中均有miRNA参与,并且miRNA的异常调控是导致肿瘤等复杂疾病产生的重要原因,所以,识别与复杂疾病相关的miRNA是了解复杂疾病产生原因的一个重要方向,有助于预防、诊断和治疗复杂疾病。然而以生物学实验识别、验证与疾病有关的miRNA面临诸多困难,比如miRNA短序列溶解温度的差异性、同家族miRNA序列的相似性均会导致实验结果产生较多的偏差甚至错误。此外,面对海量的miRNA数据,通过生物学实验识别miRNA与疾病的关系将会耗费较大的人力和物力。因此,鉴于上述所面临的诸多挑战,本文利用miRNA功能相似性以及癌症表型相似性,借助实验证实的miRNA和癌症之间的关系,预测miRNA和癌症之间的关系。鉴于miRNA主要是通过与靶基因的3’端UTR区域进行互补配对而发挥作用的,本文使用两个目前比较通用和可靠的靶标预测工具TargetScan、miRanda对miRNA的靶基因进行预测,然后根据两个miRNA靶基因集合的重合度刻画miRNA的相似性。同时,借助医学主题词表,并以语义相似性构建癌症的相似性矩阵。最后,结合miRNA和癌症的已知关系,得到对应的邻接矩阵,并基于癌症相似性网络、miRNA功能相似性网络构建回归预测模型,从而预测与134种癌症相关的miRNA。主要研究结果如下:1、通过对结肠癌、胃癌、食道癌以及肝癌的实例研究,发现一致性得分前50的miRNA中,分别有45,41,39和41个miRNAs被实验证实与对应癌症有已知关系,并且4种癌症中未被证实的5、9、11以及9个miRNAs被认为是癌症相关的潜在miRNA。结果表明,构建的预测模型不仅能够有效识别癌症相关的miRNA,而且能够预测与癌症相关的潜在miRNA。2、通过对度较大的miRNA进行功能分析(与miRNA有潜在关系的癌症数量称之为度),发现一些度较大且与癌症有重要关系的miRNA,如,mir-664a和mir-4789。研究表明,mir-664a与34种癌症有已知关系,是癌症重要的调控因子。此外,对mir-4789靶基因进行KEGG通路富集分析,发现mir-4789靶基因在癌症通路中显著富集。以上结果表明,度越大的miRNA与多种癌症相关的可能性越大。研究表明miRNA和lncRNA的表达失调都是导致疾病产生的一个重要原因,并且lncRNA是ceRNA机制的重要参与者,能够以竞争者的身份误导miRNA远离其靶标,降低miRNA对其靶标的调控影响。当前研究主要关注单分子生物标记物的识别,而复杂疾病的产生不仅仅是由单个分子的功能障碍引起的,而且往往是由相关调控网络失调导致的。因此,本文基于当前ncRNA及疾病机制的相关研究,着眼于预测癌症相关miRNA-lncRNA互作关系的生物标记物。本文采用155653对实验证实和预测的miRNA-lncRNA相互作用关系作为基础关系,并利用1046miRNAs和12727lncRNAs表达谱数据构建了患者个体特异的miRNA-lncRNA调控网络(Indicidual-specific miRNA-lncRNA network,ISMLN)。然后利用所有癌症患者个体的ISMLN得到基础的 miRNA-lncRNA 网络(Basic miRNA-lncRNA network,BMLN),通过分析 155653对miRNA-lncRNA互作关系在基础miRNA-lncRNA网络中是否差异变化,根据重要性得分(Significance Score),得到了候选miRNA-lncRNA关系对。为了进一步筛选潜在的miRNA-lncRNA边生物标记物,利用候选的miRNA-lncRNA互作关系作为特征,并以其在癌旁样本和肿瘤样本中皮尔逊相关系数的差值作为特征值,利用随机森林(Random Forests,RF)分类算法,区分癌旁样本和肿瘤样本,然后根据这些候选miRNA-lncRNA互作关系的特征重要性,筛选潜在的miRNA-lncRNA边生物标记物。本文重点识别了乳腺癌的miRNA-lncRNA生物标记物,主要研究结果如下:1、将边生物标记物(miRNA-lncRNA)和点生物标记物(miRNA或lncRNA)的分类结果进行比较,发现当分别取两类生物标记物的前5个特征对癌旁样本和肿瘤样本进行分类时,miRNA点生物标记物平均准确率达到96.26%,最高准确率为98.32%;lncRNA点生物标记物平均准确率达到98.09%,最高准确率为99.42%;miRNA-lncRNA边生物标记物平均准确率达到99.23%,最高准确率为99.96%。由此可见,此时两类生物标记物的预测准确率相差无几,边生物标记物稍有优势。2、进一步选取了点和边生物标记物的后5个作为特征进行分类,发现miRNA点生物标记物的准确率为40.16%,lncRNA点生物标记物的准确率为54.05%,而miRNA-lncRNA边生物标记物的准确率仍能高达91.26%。由此可见,筛选的miRNA-lncRNA边生物标记物相对于点生物标记物包含更多的生物学信息,具有更高的稳定性和准确率。3、通过分析潜在生物标记物中miRNA和lncRNA在癌旁样本和肿瘤样本中表达水平的变化情况,发现本文提出的方法能够识别非差异表达的生物标记物。此外,该方法还能够识别癌症特异的生物标记物。
其他文献
随着国内商用车技术的不断进步,商用车出口市场不断扩大,由于商用车动力系统功率的不断提升和非洲地区高温环境的叠加,商用车热平衡已成为车辆开发的难题之一,本文提出采用串联冷却系统方式,解决了商用车有限动力舱和无限散热能力需求的矛盾,实现了55℃热平衡,满足了热带高温地区对大功率车型的需求。
在小学英语教学中,除了应试成绩之外,更应注重培养学生对学习的积极情绪,并时刻关注他们的情感发展。在教学方面,教师需要转变思路,创新教学方式,丰富教学方法,激发学生的学习动力,提高课堂参与度,从而提升小学英语的课堂质量。英语教学的目标不应只注重考试,应该结合英语语言学习的特点,更加关注学生英语综合能力的提升。而在此基础上,教师还应该凝聚情感教育理论,在教学的同时注意学生情感情绪的健康发展。
以氯丁酰氯(CBC)为小分子试剂,通过傅-克酰基化反应在双酚A型聚砜主链引入可交换氯,制备了氯乙酰基化聚砜(CBPS),然后以羟乙基磺酸钠(HES)为试剂,与氯甲基通过亲核取代反应制备了一种具备较长柔性侧链的一种侧链脂肪磺酸型磺化聚砜(PS-ES),采用红外光谱和核磁氢谱标表征了它们的化学结构,并采用溶液浇注的方法制备了相应的聚砜阳离子交换膜(PSCEM),探索了PSCEM性能和温度之间的关系。结
学位
以球磨法制备La2O3掺杂Ni,并以此为催化剂,以板状刚玉、SiC粉、球状沥青、α-Al2O3微粉、SiO2微粉、Al-Si合金粉和铝酸钙水泥为原料,制备了Al2O3-SiC-C试样,研究了催化剂和热处理温度(500、700、900、1 100和1 450 ℃保温3 h)对Al2O3-SiC-C试样显微结构和性能的影响。结果表明,球磨后Ni的XRD衍射峰强度明显降低,角度产生偏移,表明La固溶到N
利用液体以及固体NMR技术研究了丁腈弹性纳米粒子(NBR-ENP)的结构和运动性,得到了弹性纳米粒子辐照交联的反应机理以及梯度交联的结构特征等信息。NBR-ENP以及相应的未辐照交联的丁腈橡胶(NBR)在适量的氯仿溶剂中达到平衡后均分成上层溶液和下层凝胶,从它们的液体1H谱可得到双键含量变化的信息。丁腈胶乳粒子经辐照后1,4-双键含量降低,且具有反应程度不均匀的特点。并通过13C CP/MA
会议
目的观察"动留针术"治疗中风后上臂屈肌痉挛的临床疗效。方法 97例上臂屈肌痉挛患者在西医及康复治疗的基础上随机分为动留针术组及巴氯芬组。动留针术组选穴肩前、青灵、尺泽,行苍龟探穴手法得气后予伸展运动法。巴氯芬组口服巴氯芬片,每次15 mg,每日3次。观察两组患者在治疗14、28 d的改良Ashworth评估表、日常生活能力评定表、上肢FMA简化运动功能评分量表。结果治疗后两组改良Ashworth评
目的:对基层卫生院消化性溃疡内科的治疗方法和治疗效果进行分析分析和探讨。方法:我院将收治的82例消化性溃疡患者作为研究对象进行分析,患者诊治时间为2016年5月-2017年5月,将这些患者依据治疗方法的不同随机平均分成两组,实验组和对照组,每组患者41人。对对照组采用常规治疗方式,对实验组患者在常规治疗的基础上采用针对性治疗,然后对两组患者治疗效果进行比较。结果:实验组中,患者治疗有效率为97%,
基于非期望产出视角测度黄河流域城市生态效率,探讨2003—2017年黄河流域城市生态效率时空演化特征及资源禀赋的门槛效应。结果表明:(1)黄河流域城市生态效率呈稳步上升态势,但全域和资源型城市表现出一定梯度效应,有两极分化现象;(2)各城市生态效率总体呈东高西低、南高北低格局,并存在显著空间溢出效应,不同类型城市演化存在显著的时空惯性。(3)资源禀赋存在显著门槛效应,资源型城市生产性服务业集聚与生
长三角一体化是我国当前重要的国家战略之一,旅游业发展在助推长三角产业高质量一体化发展中扮演着重要角色。综合运用SBM-Undesirable模型、核密度估计、空间分析等方法探索长三角城市群26个核心城市2007-2017年旅游生态效率时空演化特征,并运用面板Tobit回归模型探讨其影响因素。结果表明:①长三角城市群内旅游生态效率存在着显著不均衡性,研究期内旅游生态高效率城市有所减少,较高效率城市数