基因表型异质网带重启算子的随机游走算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:lngzi2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异质信息网的节点和边中包含更加丰富的语义信息,基于异质网的数据挖掘可以发现传统数据挖掘方法不易发现的关联和隐藏的关系,因而近年来受到研究者的重视。本论文利用蛋白质相互作用数据、疾病-基因关系数据、表型相似数据构造异质信息网,研究带重启算子的随机游走算法等数据分析方法,对疾病的候选致病基因进行排序,从而实现致病基因的准确定位。论文首先详细分析了经典的RWRH模型,包括其数据集,状态转移矩阵的构造以及利用随机游走算法得到基因排序结果的全过程。RWRH模型在探索蛋白质功能、药物靶点关系以及RNA疾病关系等领域被广泛应用。对于预测疾病的致病基因的研究,已经提出的方法大多是在构造异质网的数据源或者构造方式上进行改变或改进,但其本质都是基于RWRH模型的方法。基于RWRH模型,论文提出带扩展重启算子和扩展种子向量的RWRHESER模型,对初始种子向量p0按广度优先搜索(k次)形成扩展种子向量集PE,并相应地对重启算子也进行了扩展,在随机游走迭代算法中添加扩展重启算子Pe(k)。本文所提出的RWRHESER模型有效地避免了初始种子节点选择对算法性能的影响,在候选基因的排序过程中加强了异质网中致病基因节点和疾病表型节点的相邻结构数据对排序结果的影响。在预测疾病致病基因问题上,LapRWRH算法是基于RWRH模型的性能提升较大的方法之一,论文将RWRHESER模型应用于LapRWRH算法提出LapRWRH-ESER算法。利用HPRD数据库的开源蛋白质互作网络、MimMiner的表型相似性网络及OMIM数据库的基因表型关系网络构造异质信息网,对所提出的RWRHESER模型及LapRWRH-ESER算法与经典RWRH模型及LapRWRH算法进行了性能对比分析,使用留一交叉验证法比较,实验结果表明RWRHERSR模型和LapRWRH-ESER算法拥有更多的疾病基因成功预测数目。
其他文献
<正>"远学北极鸿雁,近学肇源新站。"这句话在中国邮政集团公司大庆市分公司可谓耳熟能详。很显然,这是对肇源县新站邮政营业所各项工作的极大认可。多年来,新站所出色地承担
目的 分析不同剂量米诺环素治疗皮肤性病的临床疗效。方法 选取2014年1月—2016年12月来我院就诊的99例皮肤性病患者,随机分为三组,每组33例。A组患者服用50 mg米诺环素,B组
【目的】为了实现废弃物循环利用。【方法】利用粉煤灰、菇渣、蛭石等工业、农业废弃物为主要试材,采用三因素三水平的正交试验方法,进行黄瓜和娃娃菜育苗试验。测定各配方基
目的:了解三峡库区不同人群的人口学特点,不同人群的血吸虫病防治知识知晓率、血防态度及行为的基本状况。比较示范点和对照点血防知识及格率的差异,为干预方法的制定提供基
利用数值模拟方法研究了半球头弹体与平纹织物的撞击作用,分析了不同摩擦系数和边界条件时平纹织物的弹道吸能特性。数值模拟结果表明,织物纱线间的摩擦效应对其弹道吸能特性
目的:分析近5年我院108例确诊为结核性腹膜炎患者的主要临床特点,探讨其诊疗方法。方法:对新疆医科大学第一附属医院消化科从2004年1月至2008年12月收治并确诊的108例结核性
从已有的研究成果来看,城市乞讨问题的多学科研究尚处于起步阶段。这些研究相对还比较零散,缺乏创新和可操作性。同时,很多研究者对城市乞讨问题进行了深入的调查和实证分析,
<正> 新疆解放以来,维护祖国统一、维护民族团结与分裂祖国统一、破坏民族团结的斗争从来就没有停止过。最近几年来,由于国际“大气候”与国内“小气候),的影响,这种斗争就变
污水的资源化利用应该是我国水资源短缺地区首先考虑的问题。再生水并不是把所有的污水处理得越干净越好,应该遵循分质回用的原则,这样处理成本较低,能够被社会和用户接受。
<正>在过去35年中,艾滋病(Acquired immune deficiency syndrome,AIDS)给人类社会带来的挑战和震撼,远不仅仅限于公共健康和疾病控制领域。事实上,自1981年6月5日美国疾病控