基于集成学习的RNA转录后修饰位点的预测

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:cse_gzzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表观转录组学是近年来生物信息领域关注的热点,其中RNA的转录后修饰起着不可忽视的生物学作用,如影响RNA的剪接、调控翻译速率等。本文主要运用集成学习和深度学习算法,对5-甲基胞苷(m5C)位点和N7-甲基鸟苷(m7G)位点的识别展开研究。具体的研究内容如下:(1)m5C是一种重要的转录后修饰,广泛存在于多种类型的RNA中。许多研究表明,m5C在RNA结构的稳定性与代谢过程等许多生物学功能中起着至关重要的作用。计算机辅助方法是一种有效的从高通量RNA序列中识别m5C位点的方法,并有助于解释这类重要修饰的作用机制。本文针对小鼠和拟南芥的m5C位点预测精度较低的问题,提出了一个基于序列信息的特征融合策略并结合堆叠集成学习的方法,建立了高效的预测模型Staem5。Staem5采用五种传统的机器学习算法以及四种特征提取方法,并利用随机森林进行集成。为了避免特征冗余,本文采用F-score特征选择策略对候选特征集合进行优化。此外,我们在10折交叉验证和独立测试上与现有工具相比较,两组结果均显示了Staem5的优越性。为了便于读者使用和比较,相关模型和代码提供在https://github.com/Cxd-626/Staem5.git.(2)m7G是一种广泛存在于转运RNA、核糖体RNA和真核生物m RNA的帽子区域,在基因表达调控和细胞存活中发挥了重要的功能。因此,确定m7G在转录组中的准确位置是了解基因表达功能的关键。本文利用位置-特异性错配特征、g-gap和g-bigap、one-hot编码、词嵌入矩阵word2vec四种不同的特征提取方法,并结合孪生神经网络算法构建模型。通过性能比较,本文最终基于one-hot编码构建了预测模型Sia-m7G,用以识别m7G位点。为了体现孪生神经网络算法对识别m7G位点的优越性,通过50次10折交叉验证将其与五种机器学习分类算法进行了比较。此外,Sia-m7G还与其它的六个m7G模型进行比较,Sia-m7G在灵敏度、特异性和准确率等指标都达到了最高值。
其他文献
由二氧化碳排放所引起的全球变暖问题,已严重影响人类社会的可持续发展,我国于2020年9月明确提出2030年“碳达峰”和2060年“碳中和”目标,开发新能源,节能减排是实现双碳目标的重要手段。生物质能作为一种可再生资源,具有传统化石能源无法比拟的优势,采用生物质能制氢经济可行,绿色环保。本文选择生物油水相组分乙酸作为模型化合物,采用液相放电等离子体技术制取氢气,主要研究内容包括液相针孔放电特性,乙酸
学位
微生物燃料电池(Microbial fuel cell,MFC)是利用电化学活性微生物的生物催化作用,将储存在有机物中的化学能直接转化为电能的装置。MFC产电与废水净化技术耦合具有能源回收、废水净化与资源化、污泥减量等优点。食品加工、纺织、皮革、石油化工、海水养殖等行业排放的废水通常为高盐含氮废水。高盐可提高MFC基质离子强度,从而提高电导率和质子转移能力,降低MFC内阻提高功率输出。但当废水中盐
学位
污水流行病学通过测定污水处理厂进水样品中所选毒品或其代谢物的浓度,应用相应的数学模型反推计算出毒品人均滥用量和流行率,从而成为调查毒品滥用的新方法。污水流行病学的调查结果受到多种不确定性因素的影响,其中污水处理厂服务人口数量产生的不确定性最大。因此,准确估算服务人口数量是降低毒品人均滥用量和流行率不确定性的关键。本研究基于腾讯位置大数据构建了实时估算区域人口数量的预测模型;然后在时空精度上对人口预
学位
微生物燃料电池(Microbial fuel cell,MFC)和锌-空气电池是具有广泛应用前景的电化学储能和转换技术。微生物燃料电池能将污水中蕴含的化学能转化为电能,在污水净化的同时产电,符合绿色、可持续的能源需求;锌-空气电池是以空气中的氧气为正极活性物质,金属锌为负极活性物质的一种新型化学电源,具有原料资源储量丰富、能量密度高、理论比容量大、安全无污染等优点,在新能源汽车等领域具有良好的应用
学位
脑卒中是最常见的脑血管疾病之一,包括出血性和缺血性两种类型。从现代医学角度,卒中是由于脑血管损伤或栓塞引发的血液循环障碍;从中医学角度分析本病病机主要是由于气血逆乱,上犯于脑,从而导致血溢脉外或脑络痹阻。“瘀”是贯穿于脑卒中全程的病理因素,活血化瘀法也是长久以来脑卒中的核心治法。水蛭作为传统的虫类药物,具有较好的破血化瘀之效。现代药理学研究证实,水蛭中含有的抗凝组分在缺血性卒中血栓溶解、出血性卒中
期刊
目的:观察地夸磷索钠联合强脉冲光(IPL)对屈光术后睑板腺功能障碍(MGD)性干眼的治疗效果。方法:选取2021-03/12在本院进行激光角膜屈光手术后6mo内确诊的MGD性干眼患者64例128眼。随机分为对照组和试验组,对照组患者33例66眼接受玻璃酸钠联合IPL治疗,试验组患者31例62眼接受地夸磷索钠联合IPL治疗。两组患者每次IPL治疗前均进行眼部症状评分,检查非接触式泪膜破裂时间(NIB
期刊
农业生产的快速发展使得农药在水体中的残留问题频发,这不仅对水体生态环境造成严重污染,也对水生生物和人类健康产生严重危害。光化学降解被认为是地表水中许多农药污染物的重要去除机制,受到了人们的关注。本论文选取典型的杀虫剂倍硫磷(FN)和杀菌剂嘧霉胺(PYR)作为目标污染物,探究了两种农药在水体中的光化学行为。这对了解农药在水体中的环境命运,预测其对环境的潜在危害有着重要意义。使用氙灯模拟太阳光,研究了
学位
溴酚类化合物(Bromophenols,Br Ps)作为合成溴代阻燃剂的工业生产原材料,在水体、土壤、沉积物等环境样本及海洋生物体内有检出。溴酚具有生物毒性,其环境化学行为引起了全球的极大关注。然而,目前国内关于海产品溴酚含量的研究还很匮乏,因此有必要对国内各海域溴酚的含量进行检测,以评估其污染状况及对人类的危害程度。本文用超高效液相色谱与质谱联用(UPLC-MS)的分析方法检测环渤海等海域海产品
学位
立足2022年版义务教育生物学课标,以跨学科思想指导学生理解裸子植物能够适应严寒、干燥、贫瘠环境的形态结构特征,在探究实践过程中全面发展学生的生物学核心素养,塑造逆境成才的人才观。
期刊
溢油事故中的浮油会随着波浪的作用扩散至入海口、河湾等盐度波动的海域。盐度变化可能极大程度的影响溢油对鱼类生物产生的毒性效应。但目前,针对盐度变化下溢油污染对鱼类生物产生的毒性效应的研究仍十分少见。因此,本文选取典型油品——阿曼原油作为受试油品,以新兴海洋模式鱼种——海水青鳉(Oryzias melastigma)作为受试生物,开展18 d亚急性毒性暴露实验,通过对致死、孵化、亚致死毒性终点、抗氧化
学位