大规模生物网络识别共同子网络的半监督图聚类算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yellue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的日益进步带动着生物信息技术快速发展,生物信息领域正经历着一场数据革命。生物数据的快速增长使得生物学家很难快速而准确地利用有效数据,因此如何快速地在大规模数据中识别出有效的信息成为突破数据瓶颈的关键技术。然而在后基因组生物学中,大量的生物数据都或多或少存在着相互作用关系,而这些作用关系可以通过关联网络的形式表现出来。因此如何在保持生物含义的基础上充分挖掘现有大规模生物网络信息显得尤为重要。针对生物信息领域多个生物网络融合划分的问题,目前国内外专家学者研究的比较少。有别于一般的网络,大规模生物网络集合中的若干生物网络之间存在着相互关联关系,因此在进行网络融合划分的过程中不可以割裂网络之间的关联关系。另一方面,由于现有的生物网络的数据规模较大,因此如何有效地在保持大规模生物网络中各个网络之间的关联关系的基础上对生物网络进行有效地降维成为至关重要的难点。本文针对生物网络数据规模巨大和网络间关联关系复杂等特点,设计了一种基于半监督稀疏自编码器的多网络融合聚类框架模型。多网络融合聚类框架是一个以稀疏自编码器(SAE)和半监督稀疏自编码器(semi SAE)为单元而构成的DNN结构迭代模型。其中DNN结构框架的第一层为稀疏自编码器,主要用于约束条件的提取,而从第二层开始则为半监督稀疏自编码器,其输入数据主要包括稀疏矩阵和约束条件等。在整个迭代框架中网络数据的维度在不断的降低,并且通过传递的约束条件的限制使多个生物网络在不断的趋于靠拢,从而在尽可能保持网络间关联关系的基础上降低网络数据的维度。多网络融合框架的核心为半监督稀疏自编码器,其主要功能为学习输入网络的新低纬度的表示并提取约束条件作为下一层的输入。对于输入的约束条件,semi SAE通过将约束条件作用于损失函数上来不断的修正重构的数据,从而得到一个融合上一层其他网络的先验知识的新的低纬度数据表示。对于最终得到的多个新的融合先验知识的低纬度的网络,采用Clusterer Ensemble方式得到最终的融合网络并采用K-Means算法进行聚类,从而得到最终的多网络融合划分的结果。为了验证本文所提出的多网络融合聚类框架和半监督稀疏自编码器,采用拟南芥在九种不同环境压力下所表现出来的性状表达数据来构建九种基因组转录表达网络来对算法进行验证。并采用矩阵相似度、轮廓系数、GO和KEGG Pathway富集分析来分别对于网络融合过程和最终的聚类结果进行评价。本文的实验结果证明了多网络融合聚类框架算法以及半监督稀疏自编码器在融入先验约束条件的基础上学习网络特征以及对网络进行降维的优越性。
其他文献
以金盏花杂交种为试材,研究垄作沟灌和平作漫灌不同灌水量条件下,金盏花各生育时期土壤水分变化、产量和色素含量变化,以期得到金盏花垄作沟灌的最佳灌水定额、增产节水效应
胶州湾及其邻区在青岛市经济和社会发展中日趋重要。本文在了解区域大地构造背景的基础上,运用层次分析法对影响研究区构造稳定性、地面稳定性以及岩土介质稳定性的各类因素
生物体具有环境适应性的分子机理是细胞感受环境胁迫(逆境),通过一系列信号传导机制将信号传递到胞内,使细胞在基因水平、蛋白水平和代谢水平响应,从而在环境胁迫中更好地生
本文对信息透明度与经营绩效之间的关系进行了研究。实证结果表明,在其他相关变量设定的情况下,信息透明度与经营绩效之间存在显著的相关关系。
目的: 近年来急性白血病(AL)的治疗,主要是化疗、骨髓或外周血造血干细胞移植,可使其5年生存率明显提高,但化疗后获得完全缓解的病人仍有体内残留白血病灶引起AL复发,因而清
目的通过观测额尔敦-乌日勒预处理对心肌缺血再灌注损伤(MIRI)大鼠心肌梗死面积的影响,明确额尔敦-乌日勒对MIRI的保护作用;在此基础上,检测大鼠血清及心肌组织中炎性因子的
惊闻恩师刘绍武先生于2004年12月2日在海口谢世,心中十分悲痛.当我在三部六病网站浏览先生的生平时,不禁潸然泪下,许多往事再现在脑海中.
文化建设是我国社会主义建设的重要组成部分,其中群众文化建设更是文化工作的重中之重。本文从加强职工群众文化生活的重要性出发,为工人文化宫如何加强群众文化生活建设提出
目的:本课题旨在通过逆转录病毒载体将iNOS基因转染免疫活性细胞CD3AK(anti-CD3 monoclonal antibody activated killer cell,CD3AK),构建免疫细胞性一氧化氮供体CD3AK/iNOS(
<正>在体育教学中,使用辅助器材开展教学较为常见,方式也灵活多样,一种辅助器材可以在不同运动项目教学中使用,同一运动项目教学也可以使用多种辅助器材。蹲踞式起跑技术的好