基于机器学习的稻瘟菌侵染水稻多组学数据整合算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:jifeng11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水稻是世界范围内最重要的粮食作物之一,它的产量和质量极大地影响人们的生活。但是水稻易受到稻瘟菌侵染导致稻瘟病,使得水稻大幅减产。由此可见,找到针对稻瘟病的长久且广谱的防治方法十分重要。研究发现,植物真菌病原体的小RNA(small RNA,sRNA)可以跨界调节寄主植物以促进其感染。因此,通过整合稻瘟菌与水稻多组学数据,探索在侵染水稻过程中起重要跨界调控作用的稻瘟菌关键致病sRNA,对于稻瘟病的防治十分关键。然而,现有的关于如何整合稻瘟菌与水稻数据并挖掘稻瘟菌关键致病因子的研究并不多见。本文整合稻瘟菌侵染水稻多组学数据建立稻瘟菌水稻多组学网络(Magnaporthe oryzae-rice Multi-omics Network,MRMO network)。在此网络上分别应用本文提出的NR-MRMO和NL-MRMO方法挖掘稻瘟菌关键致病因子。首先从生物数据库中获取稻瘟菌转录组、蛋白组数据,水稻基因组、蛋白组数据,根据靶基因预测与蛋白互作网络建立等过程,构建MRMO网络。然后在该网络上分别应用NR-MRMO和NL-MRMO方法,两个方法具体内容如下:(1)NR-MRMO是针对MRMO网络建立的结合node2vec图嵌入算法和重启随机游走算法(Random Walk with Restart)的数据分析模型。首先应用node2vec得到MRMO网络中结点的低维向量表示,其次根据嵌入结果计算MRMO网络中边的余弦值作为权值。最后将带权MRMO网络投入到重启游走算法得到稻瘟菌sRNA与水稻基因间的关系。(2)NL-MRMO同样是针对MRMO网络建立的结合node2vec算法和Light GBM算法的数据分析模型。首先根据node2vec得到的MRMO网络中结点的低维向量表示,计算MRMO网络中边的关系向量表示。然后将这些向量作为Light GBM算法的输入,得到稻瘟菌sRNA与水稻基因间的关系。两个模型均得到了稻瘟菌sRNA与水稻基因间的关系,分别筛选出稻瘟菌关键致病sRNA34个和21个,其中重叠的sRNA有10个。对稻瘟菌sRNA对应的基因做GO/KEGG富集分析,确定稻瘟菌sRNA跨界调控水稻基因的DNA分解代谢过程等生物过程,与稻瘟病致病过程相关。绘制关键致病sRNA与水稻基因关系图,展示sRNA与基因间多对多的调控关系。本文首先提出稻瘟菌水稻多组学网络整合方法。然后基于此整合网络运用新颖的NR-MRMO和NL-MRMO方法挖掘稻瘟菌跨界调控的致病sRNA共45个。敲除这些稻瘟菌关键致病sRNA,能够有效地减少甚至消除稻瘟病的危害。本文提出的多组学整合方法,为植物-真菌的多组学整合分析提供了新思路。本研究揭示了sRNA在稻瘟病侵染水稻过程中的调控作用,有助于研究者更好地了解稻瘟病菌与其寄主水稻之间的相互作用机制。此外,本研究从生物数据分析角度寻找稻瘟病致病因子,比现在常用的化学防治等方法对环境更加友好、成本更低,且为植物-真菌病害的防治提供了新的参考方案。
其他文献
研究旨在评价不同品种(系)饲用高粱在甘肃临夏半干旱区的生产性能与饲用价值,引进7个不同饲用高粱品种(系),对各品种(系)在当地的生产性能和饲用价值开展研究分析,采用隶属函数法对7个高粱品种进行生产性能和营养品质的综合评价。结果显示:供试品种的株高和节间数均以NX-4264最高,茎粗以陇甜粱2号最粗,有效分蘖数和全株叶片数以海牛最高,主茎叶片数以大卡最高,单株鲜重、单株叶鲜重和单株茎鲜重均以陇甜粱1
期刊
学位
研究目的颅内动脉瘤是一类较为常见的疾病,然而一旦破裂会导致严重后果。目前,对于较大的颅内动脉瘤的破裂风险和治疗策略已有较多公认的研究。但对于小动脉瘤(<7mm)破裂相关因素的研究和治疗策略的研究仍存在争议。研究方法我们通过回顾性研究,筛选了自2016年1月至2019年12月共555例颅内动脉瘤患者,记录并分析了入院时一般临床特征,动脉瘤大小、部位、形状,术后并发症、预后情况等。研究结果入院时平均动
学位
近年来,随着各种知识图谱技术的发展,知识图谱的规模在不断扩大,各领域也纷纷开始根据自身需求去构建新的知识图谱。如今,知识图谱被广泛应用于检索,问答和推理等任务,支撑着许多行业的应用。然而,单一的知识图谱已经不能满足实际的应用需求,而各个知识图谱间又存在信息冗余,异构等问题,因此知识融合成为人们关注的话题。实体对齐是知识图谱融合的重要组成部分,目的是寻找不同知识图谱间指向真实世界同一实体的节点。随着
学位
随着移动信息技术和移动设备的不断普及,移动应用程序(Mobile Application,App)已经渐渐覆盖了人们的日常生活,包括学习、娱乐和社交等活动。尤其是在新型冠状病毒COVID-19爆发后,人们的许多线下活动也转移到了App或者其他在线工具来进行学习、交流和工作。这些App在为人们提供诸多便利的同时,也渐渐改变着人们的日常生活方式。然而,并不是所有用户都能够便捷的使用App,那些存在视力
学位
急性淋巴细胞白血病是一种由淋巴样前体细胞恶性增殖所致的血液系统恶性肿瘤。近年来经过标准化疗,新发的成人急性淋巴细胞白血病缓解率较前有了极大提高,但是在复发难治的急性淋巴细胞白血病中治疗效果不佳。因此针对难治复发的白血病,近年来涌现了多种新型治疗药物和治疗手段,嵌合抗原受体T细胞(CAR-T)治疗即为当前最热的研究领域之一,该疗法在难治复发急性淋巴细胞白血病中完全缓解率可达90%,改善了患者的预后生
学位
医学影像在临床诊断中发挥着十分重要的作用,不同的影像传递的医学信息不同:电子计算机断层扫描(Computed Tomography,CT)对高密度区域更敏感;磁共振成像(Magnetic Resonance Imaging,MRI)对软组织结构显示更加清晰。由于单模态医学图像自身蕴含的信息有限且无法满足日益复杂的医学诊断需求,医生需要同时对多种模态数据进行详细分析,这增加了疾病的识别成本,同时加重
学位
<正>随着社会环境和用眼习惯的改变,智能手机、电子产品的普及和使用,视觉使用远超负荷。时间长了,人们普遍感到眼皮沉重、酸胀、干涩、疼痛、眼异物感和烧灼感、流泪、眼眶疼痛等眼部不适;严重者甚至会出现头痛、头晕、记忆力减退、视物模糊、视物重影、恶心、呕吐等症状。这就是典型的视疲劳和干眼症,它们常常结伴而行,视疲劳时会出现眼干涩,干眼时会出现视疲劳。它们极大地影响了人们的工作和生活,为人们带来漫长的痛苦
期刊
研究目的:本研究通过检测hepcidin在NEC患儿外周血中的水平,及其病变肠道炎症因子的表达,并用动物模型验证,分析hepcidin在NEC发生发展中的作用,探讨hepcidin与疾病发生发展之间的关系,为进一步分析hepcidin在NEC发生发展中的作用奠定基础,为探索NEC防治的分子靶标提供新思路。研究方法:本研究采用前瞻性研究结合动物实验,经医院伦理委员会批准并获得患者知情同意后,将32例
学位
长期以来,贝叶斯网络(Bayesian Network,BN)是一种被用于在不确定性条件下进行知识表示与推理的流行媒介。贝叶斯网络分类器(Bayesian Network Classifier,BNC)是BN的一种特殊形式,它主要用于解决机器学习领域中的分类问题。在众多BNC中,平均的一阶依赖估计器(Averaged One-dependence Estimators,AODE)不需要进行参数调整
学位