基于生物分子网络分析的疾病基因预测算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：longxue1211

【摘要】

：

疾病影响着人类的正常工作及生活,复杂疾病,以癌症为代表,更是严重威胁着人类的生命安全。对疾病生物标记的研究有助于揭开潜在疾病的发病机制,并引导个性化的治疗。因此,疾

【作者】

：

虞佳

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2014年期

【关键词】

：

PPI网络疾病网络拓扑特性扩散核生物标记

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

疾病影响着人类的正常工作及生活,复杂疾病,以癌症为代表,更是严重威胁着人类的生命安全。对疾病生物标记的研究有助于揭开潜在疾病的发病机制,并引导个性化的治疗。因此,疾病生物标记的研究受到越来越多的关注,成为了生物信息学研究中一个极其重要的分支。近些年来,随着高通量测序技术的发展,各种不同的生物数据大量涌现,疾病生物标记的研究进入了一个新阶段。已知疾病基因,作为已经在临床上被证实跟疾病相关的基因,可以作为一种先验知识来指导研究。然而目前的大多数研究方法,只是把已知疾病基因作为对研究结果的验证数据,而没有作为先验知识去引导疾病生物标记的识别,本文研究中引入了这一数据作为先验知识。另外,大量生物数据的积累也推动了对各种计算方法的研究。在生物假说“同一疾病的蛋白质互相之间交互多”的基础上,研究者们通过在网络模型中计算各基因与已知疾病基因的距离,来预测疾病生物标记。这些距离度量方法包括基于最短路径、基于随机游走、扩散核等。扩散核能根据疾病网络的全局拓扑特性度量节点之间的距离,具有比较好的效果。本文研究中采用了扩散核(diffusion kernel)思想。本文提出了一种以已知疾病基因集合引导的疾病网络的构建方法,并从构建的疾病网络中预测疾病相关基因。本文具体的研究思路如下:首先,从三个公共数据库中收集针对某种癌症的已知疾病基因,对每种癌症得到一个疾病基因集合。针对本文研究的六种癌症(肺癌,前列腺癌,乳腺癌,膀胱癌,大肠直肠癌,子宫内膜癌),共获得了六个基因集合。然后,采用扩散核思想在每一个疾病基因集合基础上构建一个疾病分子网络。扩散核在本文中被用来度量基因之间的相似性,旨在找出与已知疾病基因相似性高的基因,用于构建网络。最后,采用马尔科夫聚类算法(MCL)在疾病网络上进行聚类,并设计了一种按聚类模块为单位的新颖的得分算法对疾病网络中除已知疾病基因以外的基因打分,从中筛选癌症相关基因并进行了一系列验证。另外,为了说明以疾病基因集合为疾病网络的初始节点集合的合理性,我们在PPI的最大连通图上比较了疾病基因与非疾病基因的拓扑特性差异。实验结果表明,本文的研究方法能比较有效地构建疾病分子网络,预测与特定癌症相关程度高的基因。从与经典的带重启的随机游走的预测方法的结果对比来看,本文方法预测的致病基因在已知疾病基因数据库中展现了更显著的富集性,对癌症样本和正常样本的分类效果也更好。本文的算法将从某种程度上揭示癌症的发病机理,并为深入了解癌症的机制提供支持。

其他文献

一种Android平台反钓鱼攻击解决方案

进入二十一世纪以来,移动终端作为一个新兴设备发展非常迅速,尤其是智能终端的问世,极大的方便了人们的日常生活,3G与4G网络的逐渐普及,网络带宽的增加,以iPhone的发布开始,A

学位

Android钓鱼攻击重打包反钓鱼

医学影像处理算法开发平台的设计与实现

本文介绍了一个通用的、可扩展的医学影像处理算法开发平台，该平台不但提供了灵活的算法开发接口，友好的影像操作界面，也为计算机辅助检测/诊断(CAD)系统高效、快速地开发提供了

学位

医学影像处理工作流管理开发平台算法库计算机辅助诊断

基于独立智能外设的彩铃平台中语音定制功能的设计与实现

近几年，以彩铃(Coloring Ring Back Tone，CRBT)为代表的电信增值业务发展迅速。中国移动在2003年成功推出彩铃业务，迅速得到用户的喜爱和使用，随后各大运营商纷纷跟进，使得彩铃在

学位

语音识别语音定制彩铃独立智能外设移动智能网

基于加权信任列表路径搜索的交叉认证的研究与设计

本文研究分析了交叉认证技术中的信任模型、路径构造与路径验证，提出了一种针对域内为层次结构、域间为网状结构的混合模型下的交叉认证设计，它通过出示默认证书链，并使用加权信

学位

PKICA交叉认证证书链加权信任列表VPNIKE

广义同余神经网络研究

在过去的二十年,神经网络理论研究取得了很大的进展,在各领域的应用也取得了丰硕的成果。作为神经网络的经典模型,BP网络也得到了快速的发展,同时,也存在着收敛速度缓慢、难

学位

神经网络广义同余激励函数学习算法收敛分析邮件过滤

民航主题搜索引擎的索引技术研究

搜索引擎是传统的信息检索(InformationRetrival)技术与Web结合的产物，是一个集多种技术于一体的综合性系统。倒排索引是其中的一项重要技术，本文正是围绕倒排索引的核心技术展

学位

民航信息系统主题搜索引擎信息检索倒排索引中文全文索引

压缩全文自索引算法的研究

在信息检索领域,基于数据库的条目型检索系统和基于倒排表的检索系统能解决一部分需求,但在字符串精确匹配、生物序列分析、任意模式检索等领域,无法通过数据库系统和倒排表

学位

后缀数组压缩全文自索引压缩后缀数组(CSA)FM-index数据感知

数据挖掘技术在提高Web用户访问速度上的应用研究

WWW 是一个开放的全球性的资源,而数据挖掘技术是从大量的数据中提取出隐藏在数据之后的有用的信息。因此,采用数据挖掘技术从WWW 智能地、自动地提取出有价值的知识,提高WWW

学位

WWW数据挖掘关联规则

基于J2ME的手机应用的研究和实现

信息社会中手机及其它无线设备越来越多地走进普通老百姓的工作和生活中。随着信息网络化的不断发展，手机及其它无线设备上网也势在必行。J2ME技术是当前业界流行的无线应用开

学位

J2MEGPRSMIDP消息协议

大规模网络数据流异常检测系统的研究与实现

Internet的迅速发展给人们带来巨大方便的同时,也使我们面临着各种安全事件的威胁。随着各种攻击技术的不断发展,针对网络资源的攻击越来越多,如拒绝服务攻击、蠕虫等。因此

学位

网络安全入侵检测应急响应数据流挖掘频繁模式挖掘关联规则

基于生物分子网络分析的疾病基因预测算法

与本文相关的学术论文