癌症关联的长非编码RNA模块挖掘方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jili1027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量研究表明,在很多生物过程中,长非编码RNA(lncRNA)有着重要的功能,它们调控生物的生理过程,影响着细胞内稳态的各个方面,而这些lncRNA的变异或功能失调有可能导致一些复杂疾病的发生。lncRNA由于其在多种生物学过程中的关键作用,正成为生物学和医学领域的研究热点,在多种肿瘤疾病中具有潜在作用,有望成为新生物标志物和药物靶标。利用计算生物信息学方法预测潜在的lncRNA-疾病关联,对于探索疾病的发病机制,以及疾病的诊断、预后和预防都具有重要的意义。全基因组关联研究(GWAS)对于研究复杂疾病和性状遗传方面有着突出贡献,该研究已经鉴定出数千个与疾病相关的单核苷酸多态性(SNP),其中90%以上位于蛋白质编码基因的外显子之外,理解它们的功能意义仍是一个挑战。表达数量性状位点(eQTL)分析是沟通基因改变与疾病的桥梁,它把基因表达视作一种数量性状,研究遗传变异与基因表达的相关性,从而将这些SNP与基因表达联系起来。在以往的研究中,通过SNP信息结合网络挖掘疾病关联模块大多都是在研究编码基因,但是,SNP发生在非编码区域的情况也特别多,特别是在lncRNA上。因此,我们通过挖掘非编码区域的SNP信息来进一步分析lncRNA上的SNP信息对于疾病的影响。本文集成了TCGA(癌症基因组图谱)数据库的突变数据、表达数据以及临床数据,通过eQTL分析在SNP和基因表达之间建立连接,从而将研究对象从SNP水平迁移到基因水平。通过eQTL分析和差异表达分析筛选癌症和候选基因,再结合由GTEx表达数据构建的基因共表达网络,基于网络模型挖掘癌症关联的lncRNA模块,为癌症诊断和治疗提供参考和依据。本文通过GO功能注释和KEGG通路富集分析,探索挖掘出的癌症关联的lncRNA模块可能行使的生物学功能,并通过数据库和文献验证模块中lncRNA和癌症的相关性。将该方法应用于乳腺癌,结果表明,挖掘出的lncRNA模块中包含与乳腺癌高度关联的信息,证明了本文方法的有效性。在挖掘出的25个lncRNA中,有2个lncRNA与乳腺癌的关联已被生物实验所验证,分别为CCAT2,HOXC-AS3,其余lncRNA需要生物学相关人员进行生物实验进一步分析验证。通过对乳腺癌的实验结果进行分析,表明挖掘lncRNA中的SNP信息可以为复杂疾病的研究提供一种新的解决思路。采用计算方法研究lncRNA与癌症的关系可以缩小lncRNA的研究范围,降低生物实验人员的研究成本,这不仅可以帮助我们加深对复杂疾病在分子层面发病机制的理解,还可以利用lncRNA作为疾病诊断和预后的生物标志物以及癌症治疗的潜在靶标,对于癌症的诊断、预后和精准医疗具有非常重要的意义。
其他文献
信号的波达方向(Direction of Arrival,DOA)估计作为阵列信号处理领域的研究热点问题,其基本任务是对空间中的某一区域或多个区域内的目标信号到达阵列天线的方位角进行估计。DOA估计在无线电通信、导航、雷达和医学等领域有着极为重要的应用,随着近些年来稀疏恢复理论与算法的发展与火热,越来越多的学者将其运用到DOA估计问题。相比于基于特征空间的传统估计方法,DOA稀疏恢复估计方法具有更
马齿苋(Portulaca oleracea L.)用于治疗糖尿病早有记载。现代药理学和临床研究表明,马齿苋的降糖作用与GLP-1相似,都具有促进胰岛素分泌、改善胰岛素抵抗等。化学成分研究表明,马齿苋中主要含有多糖、多酚及生物碱三大类组分,其中生物碱粗提物的降糖活性优于多糖和多酚组分的粗提物。马齿苋中生物碱类成分显著的降糖活性已逐渐引起国内外学者的重视,但是目前都是以马齿苋生物碱的粗提物进行药效层
肝细胞癌(HCC)发病率占恶性肿瘤的第六位,是全球第四位肿瘤致死病因,流行病学调查结果显示,我国每年约有46.6万新发病例和42.2万死亡人数,约占全球HCC总发病率和死亡率的50%,患者五年生存率仅有10.1%。病毒感染是HCC发病的主要风险因素之一,我国70~90%的HCC与乙型肝炎病毒感染相关。HCC发生和进展的分子机制尚不明确。醛糖还原酶(AKR1B1)在多种恶性肿瘤中表达异常,如结肠癌、
水稻作为我国最主要的粮食之一,在中国农业生产中占据重要的地位,每年保障其产量是目前重要的工作之一。水稻病害是影响水稻产量的主要因素之一,所以快速、准确的识别与检测水稻病害并进行有效的防治是非常重要的。人类现知的水稻病害种类非常多,但目前大多数学者的研究对象只为某一种病害或几种病害,且传统的图像技术和机器学习对图像特定特征依赖性强,虽然在水稻害识别方面有了不错的成效,但获得的识别分类模型具有一定的局
离子型稀土是我国特有的珍贵重稀土资源,江西赣南地区具有丰富的离子型稀土资源,素有“稀土王国”的称号。离子型稀土矿多年的无序开采带来了严重的生态环境问题,如大面积的表土破坏、土壤肥力下降、土壤酸化、土壤浸矿剂残留等。传统的土壤物理、化学改良方式往往具有成本高、难以推广的劣势。而采用生物改良剂结合功能性微生物协同修复的方式为离子型稀土尾矿退化土壤的生态修复提供了新的思路。本研究以江西省赣州市信丰县某离
近年来宽禁带深紫外光电探测器因其在众多应用领域备受需求成为研究热点。但其中材料薄膜的生长,器件的制备成本和性能以及制备过程中造成的重金属和气体污染等问题仍然值得思考。综合以上问题在本文中设计了一种基于碳点材料的深紫外光电探测器并对其性能进行了研究。该碳点作为一种碳基的天然宽禁带材料在深紫外区域拥有优越的吸收特性,同时碳点材料的制备过程采用蒸馏水作为电解液的绿色自然的电化学方法,器件的制备过程简便快
学位
相变存储器(PCM)因其低功耗、存储速度高、寿命长、低成本、非易失性等优点,将成为未来存储器的主流产品,然而直接决定PCM性能的是其作为存储介质的相变材料。众所周知,Ge2Sb2Te5(GST)为最常见的相变材料之一,但其存储器件表现出的热稳定性较差,功耗较高,可靠性较低等缺点,需要有待改善。为提高其相变材料的性能,用结晶温度、晶态电阻相对较高的ZnSb来代替GST,但在研究过程中,发现ZnSb在
由于高分辨距离像(HRRP)易于获取和存储,基于高分辨距离像的目标识别研究成为雷达目标识别领域的热点。本文围绕基于高分辨距离像的目标识别展开研究,主要贡献在于提出了可学习先验卷积变分自编码机和解耦表征卷积变分自编码机。二者在原始变分自编码机的基础上融入类别标签监督信息,以此更加有效的提取高分辨距离像特征。本论文的内容主要包括以下部分:1.研究了高分辨距离像目标识别的基本框架。具体对高分辨距离像的敏
印制电路板(Printed Circuit Board,PCB)作为各类电子信息产品的重要部件之一,其主要功能是支撑和互连电路元器件。而且,消费者对电子产品在智能化、轻薄化、小型化以及多功能化等方面的需求增长驱动着印制电路板不断向着高精度、高密度和高可靠性方向发展。通孔电镀铜是连接多层电路板的层与层之间的“桥梁”之一,并对下一代先进印制电路板制作有着重要指导意义。然而,直接采用直流电源进行通孔电镀