基于标签传播的疾病相关miRNA预测方法研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:bobosiji123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Micro RNAs(mi RNAs)是一类具有调控功能的小分子非编码RNA,它在调节各种细胞过程中发挥着重要作用。研究表明,mi RNA的异常表达与人类恶性肿瘤的发生息息相关,因此研究mi RNA与疾病之间的相关性为探索疾病的潜在发病机制提供了参考。近年来,研究人员建立了大量具有高度可信度的公开数据库,为实验验证提供了mi RNA-疾病关联信息以及相关的生物学信息。为了预测潜在的mi RNA-疾病关联,研究人员利用这些数据设计出高效而精确的计算方法,弥补了生物实验方法研究成本高、研究周期长的不足,为疾病研究提供了新的思路,同时为疾病诊疗提供新的理论依据。目前已有的计算方法虽然有效,但仍存在相似性度量不够丰富、mi RNA-疾病已知关联稀疏、模型预测准确性不高等一些亟待解决的问题。针对这些问题,本文基于标签传播算法提出了三种预测模型:(1)构建了基于矩阵增强和标签传播的预测模型(Predicting mi RNAdisease Association Based on Matrix Enhancement and Label Propagation,MELPMDA),通过改善mi RNA功能相似性、疾病语义相似性以及mi RNA-疾病关联网络的稀疏问题,提升了标签传播算法在mi RNA-疾病关联预测任务中的表现。针对mi RNA-疾病关联信息不足的问题,MELPMDA为mi RNA和疾病建立了基于强关联、弱关联和负关联三种情况的相似度奖励矩阵,提出了一种根据序列分布情况自调节的提取有效相似信息的方法,并用这些相似性信息填充关联网络,从而降低关联网络的稀疏性。标签传播算法作为最终的预测算法,进一步发现潜在关联。在五折交叉验证实验中,MELPMDA模型取得了0.9500的AUC值,在肝细胞癌、乳腺肿瘤的案例分析中,分别从50个候选mi RNA中找到了实验验证的45、46个相关mi RNA,证明了MELPMDA模型稳定良好的预测能力。(2)实现了基于平衡标签传播算法的预测模型(Predicting mi RNA-disease Association Based on Balanced Label Propagation,BLPMDA),改善了传统的标签传播算法由于关联网络局部密度差异而导致的预测结果失衡的问题。BLPMDA为已知关联赋予了相比于未知关联更大的可信度,并利用所有已知和未知的关联构建一个可信度相似网络,用于改善现有数据集的稀疏问题。同时,根据每条相似性序列的分布特点提取出的有效相似度信息,用于填充mi RNA-疾病关联网络。平衡标签传播算法将已知标签加权处理后传播到未标记的节点,从而完成预测。在五折交叉验证和留一交叉验证实验中,BLPMDA分别取得了0.9527和0.9685的AUC值。在肝细胞癌和肺肿瘤的案例分析中,BLPMDA预测出的50个候选mi RNA分别有45和44个被现有数据集验证。(3)构建了基于加权表决的预测模型(Predicting mi RNA-Disease Association Based on Weighted Voting,WVMDA),实现更为稳定和高效的关联预测。WVMDA本质上是一种标签传播算法,它将关联预测问题转化为投票问题,所有的已知关联被视为拥有不同表决权的投票者,所有的未知关联被视为候选者。为了保证投票结果的公正且有效,BLPMDA设置了基础投票权、团队投票权和相似性投票权,用于控制加权表决的权重。在五折交叉验证和留一交叉验证中,WVMDA分别得到了0.9537和0.9754的AUC值。在关于前列腺肿瘤案例分析中,WVMDA预测出的30个候选mi RNA有28个被实验验证。在有关乳腺肿瘤的案例分析中,30个候选mi RNA都在HMDD、db DEMC、mi R2Disease数据库中得到了验证。综上,本文深入研究了mi RNA-疾病关联预测任务,并基于标签传播算法设计了三个关联预测模型,有效提升了模型预测的准确率和稳定性,在预防、诊断、治疗人类恶性肿瘤方面有一定的理论意义和实际应用价值。
其他文献
支持性言语反馈是会话中一种常见的现象,是听话人为了鼓励、支持和帮助说话人,对说话人做出的积极言语回应行为。课堂教学中也存在着大量的师生对话,侧重师生间的交际互动,因此为支持和鼓励学生继续作答,教师会在学生回答问题期间进行支持性言语反馈。但前人研究多从静态的视角出发,鲜有学者从互动的视角研究这种语言现象。本研究以互动语言学和输出假说作为理论基础,对教师在英语课堂中使用的支持性言语反馈进行分析,在课堂
学位
<正> 环氧树脂是一类重要的合成树脂,世界年产量在20万吨左右。国内年产近万吨,主要由无锡、上海,岳阳三地生产。 环氧树脂的应用领域十分广泛,这不单是因为环氧树脂具有优异的物理、化学性能,而且还因为环氧树脂应用时的工艺适应性强。可以根据各种不同情况,不同的施工条件和特定的性能要求,来选择不同型号的树脂,不同类别的固化剂、增塑剂、填料、稀释剂、溶剂、促进剂和改性剂,组成各种
期刊
由于语法的正确应用在英语听说读写的学习中起到不可忽视的重要作用,语法教学在中国英语教学中始终占有重要地位,是英语教学系统中非常关键的环节,也是外语教学研究的热门话题之一。如何使用合理的语法教学方式来保证语法教学的有效性成了很多专家学者的研究重点,大多数研究重心放在通过研究学生学习结果来探究合理的语法教学方式,以至于研究合理语法教学方式的实效性时,仍需从学习过程的角度加以探究。本研究以加工层次理论为
学位
学生英语写作和英语写作教授一直是教育界的重点、难点问题。写作作为一项英语学习的必备输出技能,与阅读这种输入性技能相比,需要学生具备一定的综合语言运用能力。然而,目前学生排斥英语写作、英语写作成绩提高缓慢成为了初中英语写作教学的难题,尤其是初三学生,面临升学压力,时间紧张,仅靠教师批阅作文很难得到大量英语写作的实质性收获。因此,同伴反馈走入写作课堂,但由于反馈主体是学生,一直存有争议之声。动态评估理
学位
文风颇显成熟的孙频就像“80后”作家中的异类,有论者称她为“80后作家中的独行者”,其文字让人很难把她跟一个“80后”的女性作家联系起来,看过她作品的人都会猜测她应该是位中年作家。因为她的写作一改之前“80后”作家们或青春或叛逆的文风,显示出一种沉重和老成。作为起步较晚的“80后”作家,孙频也被一些研究者称为“纯文学作家”、“严肃文学创作者”,更有研究者将其作品归为“新伤痕文学”之列。她不爱青春的
学位
为了解项目式学习在中学物理阶段的研究现状及发展趋势,本文对中国知网(CNKI)数据库期刊收录刊发的论文进行年度发文、被引量、主题分布等加以统计、分析,进而发现基于项目式学习的中学物理教学研究仍处于起步阶段,距离大范围推广、实施项目式学习还有很长的路要走.
期刊
苏轼被翁方纲誉为“宋代诗人之冠冕”,是继唐代李杜之后又一位诗歌大家。苏诗接受始于宋代,后代诗家对苏诗的认识与接受有所起伏,至清乾嘉时期迎来又一个高峰期。本文在文献整理的基础上,总结归纳乾嘉诗话中关于苏轼诗歌、苏轼诗歌历史地位以及苏轼形象三方面的接受情况,并进一步探讨苏诗接受在乾嘉时期迎来鼎盛时刻的原因。具体内容如下:第一章主要围绕乾嘉诗话中对苏轼诗歌艺术技巧的讨论展开,分别对苏轼诗歌的表现手法、创
学位
知识图谱(KG,Knowledge Graph)是人工智能研究和智能信息服务的核心技术,是真实世界信息的结构化表示。在一个知识图谱中,节点表示实体,边是连接两个实体的关系。由于知识图谱能够对结构化、复杂的数据进行建模,因此它被广泛应用于化学、生物、金融、医疗等诸多领域。尽管现有的大规模知识图谱已经含有丰富的知识,但是还是会出现不完整的情况,这个问题引发了链接预测(Link Prediction)的
学位
1目的:非特异性下腰痛(nonspecific low back pain,NLBP)在下腰痛受试者中约占90%,严重妨碍了受试者人群的日常生活和工作。NLBP受试者通常与腰椎稳定性和三维呼吸能力弱有关,且腰椎稳定性和三维呼吸训练均能改善NLBP症状,但腰椎稳定性结合三维呼吸训练对NLBP疗效研究鲜有报道。本文旨在研究三维呼吸结合腰椎稳定训练对NLBP的疗效,探讨较好的NLBP干预模式。2方法:招
学位
入侵检测技术是通过网络流量的协议识别和特征分析等技术手段,统计分析异常行为模式,检测计算机网络中违反安全策略的行为。入侵检测是主动性安全防护技术,能够在网络系统受到攻击威胁之前对其进行响应拦截,为网络安全管理提供了重要的技术支撑和保障。互联网中的流量数据具有时序性、高速传输、数据量大的特点,机器学习和深度学习算法能有效的解析网络流量数据并对互联网中用户行为和异常行为做出判断和预测,能提升入侵检测系
学位