面向异构网络的lncRNA与疾病关联预测方法的研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:wuxinghui_1975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长非编码RNAs(lncRNAs)的异常表达通常与人类各种疾病相关,因此预测与疾病相关的lncRNAs有益于阐明复杂的疾病发病机理,为疾病的诊断和预防提供依据。然而,利用生物学实验筛选疾病的候选lncRNAs存在实验环境要求高和时间成本高等诸多不利因素。计算机科学技术与生物信息学相结合的方式来预测lncRNA-疾病关联可以降低实验成本。因此,研究lncRNA与疾病之间的关联关系是一个有意义的课题,存在着极高的应用潜力。在lncRNA和疾病相关的多源数据中,为关联预测任务提取出丰富的语义信息是一项关键但具有挑战性的任务。对lncRNA-疾病对的多级节点对属性和节点邻居拓扑关系进行建模时同样存在着挑战。为了应对这些挑战,本文从一对lncRNA-疾病节点对属性层面、节点邻居拓扑层面、属性和拓扑注意力机制三个角度分别建立了关联预测方法。本文基于深度学习方法展开lncRNA与疾病关联预测研究任务,主要的工作和贡献体现在下述的三个方面:第一,针对于节点之间的多种连接关系的研究,本课题基于深层和浅层卷积神经网络构建了lncRNA-疾病关联预测模型DSCNLDP。结合一个lncRNA-疾病对与各个lncRNA、疾病和miRNA存在关联、相似或者互作关系的多个生物学前提,本文提出一个新颖的、节点对层面的属性嵌入机制,在多源数据中建立节点对的属性矩阵。融合节点对浅层细节特征和深层有代表性特征的多层卷积神经网络来编码lncRNA-疾病节点对的属性表示。最后,融合后的属性表示被送入全连接神经网络以揭示lncRNA与疾病之间的关联关系。为了探讨深层有代表性的属性和浅层细节属性对关联预测的贡献,本文进行了消融实验。此外,本课题设计实验讨论模型的超参数,选择出一组最好的实验参数。DSCNLDP应用在公开的数据集之上,经多个评估指标和在肺癌、前列腺癌和结直肠癌上的案例研究表明本文提出的方法取得了不错的效果。第二,针对于lncRNA和疾病节点邻居拓扑的研究,本课题基于图注意力网络构建lncRNA-疾病关联预测模型GATLDP。本课题基于图注意力网络搭建学习框架GATLDP,以表达异构网络的拓扑结构。首先,在lncRNA相似性网络和疾病相似性网络中,从邻居节点层面出发提出新的嵌入机制。依据嵌入机制,本研究得到一个lncRNA(或疾病)节点与其最相似的多个邻居的拓扑特征嵌入。本文所构建的预测模型将节点的拓扑向量投影到低纬空间,获得更稠密的节点表示。邻居节点层面的自注意力机制被建立,目的是学习每个邻居的重要性。本课题将邻居注意力机制扩展到将多头,稳定注意力的学习过程并从多个层面捕获邻居拓扑信息。通过实验,讨论GATLDP取得模型最好性能时,超参数的最优配置。实验结果表明,GATLDP模型在AUC和AUPR两个方面均取得较好的表现。在三个常见癌症上的案例研究进一步证明了GATLDP的预测性能。第三,针对于节点属性和邻居拓扑对关联预测的研究,本课题建立了带双注意力机制的预测模型GTAN,以推断lncRNA与疾病节点之间的关联倾向。注意力机制在神经网络的学习过程中突出对任务重要的信息,对于关联预测是有效的。首先,带属性注意力机制的编码模块被用来学习节点对的属性表示。属性注意力可以有效的区分该节点对相关的各个属性的差异贡献。带拓扑注意力机制的拓扑编码模块分别学习lncRNA节点和疾病节点的邻居拓扑表示。拓扑注意力学习了多个局部拓扑表示之间相互依赖的上下文信息。两个编码模块分别学习,得到关联得分,最终用一个超参数来衡量两个模块的贡献。GTAN在AUC和AUPR上优于8个最新的对比方法。此外,GTAN在召回率上的提高表明,模型可以在预测结果排名最高的列表中检索到更多真实的lncRNA-疾病关联。关于肺癌、前列腺癌和结肠癌的案例研究进一步证实了GTAN发现潜在lncRNA-疾病关联的能力。
其他文献
有限公司作为我国重要的商业组织形式,在社会主义市场经济中有着举足轻重的作用。股东除名制度是指有限公司基于股东未履行出资义务或者抽逃全部出资等特殊事由,依照法定程序解除其股东资格的制度。该制度在某种意义上讲,能够有效地解除因个别股东而引起的困境,能够达到公司利益的最大化。我国《公司法》司法解释(三)第十七条虽然已经规定了除名制度,但是该规定过于简略,难以满足司法实践的需要。本文通过对股东除名制度的相
学位
为建设法治政府,提升行政执法的水平,国务院办公厅于2018年出台了《关于全面推行行政执法公示制度执法全过程记录制度重大执法决定法制审核制度的指导意见》(以下简称《指导意见》),该《指导意见》标志着我国正式建立起行政执法全过程记录制度。本文从行政执法全过程记录的概念切入,分析了该制度的功能;梳理、概括了该制度的内容,包括从横向角度和纵向角度阐述了行政执法全过程记录的适用范围、主体、并列举了行政执法全
学位
“执行难”问题是困扰我国司法实践多年的一个难题,为彻底破除“执行难”问题,保障法律文书内容的实现,我国开始探索并确立了失信被执行人名单制度,通过联合惩戒等方式约束债务人主动履行义务。但在制度的具体应用中依然暴露出了一些不足之处,主要表现在对于失信被执行人权利保护的不足,由于法律规定的不明确和缺乏统一执行标准等原因导致在执行过程中对被执行人的财产权和隐私权等权利造成了损害。文章具体介绍了我国失信被执
学位
MicroRNA(miRNA)是一类长约22nt的非编码RNA,与许多疾病的产生有着密切的联系。然而,验证miRNA-疾病关联的生物学湿实验成本较高且耗时较久。因此,设计有效的miRNA-疾病预测方法以提供可靠的候选miRNA是很有意义的。先前的预测方法大多只利用了miRNA和疾病相关的相似性和关联数据,而没有考虑到miRNA所属的家族和聚簇信息,然而,相似的疾病通常也很可能与属于相同家族或有同属
学位
数字技术推动着博物馆发展,包括虚实结合、时空复用、观众数据分析和多元化的分众服务等。在此基础上,促进博物馆进行更多变革——虚拟展柜、虚拟展品进一步凸显时空复用的优势,而虚拟策展、众策的尝试,使更多观众得以完成表达,密切博物馆与观众的关系。沿着这一思路,未来数字技术还将孕育出新的博物馆形态:观众通过新的知识体验和知识建构形式,形成科学思维习惯与认同,助力博物馆更好地履行社会责任。
期刊
<正>近年来,我国基础设施建设呈现多样化、大型化趋势,公路工程机械行业先后攻克了多项技术难题,研发出大量高端工程机械设备,取得了突破性成果,在各种极端工况下展示出中国制造的实力与品质。回望来时路,公路工程机械产业发展与改革开放步伐同频共振,经历了从无到有、从有到优、从依靠技术进口到拥有完全自主创新技术的40余年,走出了一条探索创新的民族之路,并在专利、产品、技术及智能制造等方面取得了丰硕成果,“中
期刊
检测、分割与分类都是计算机视觉研究的重要任务。毋庸置疑,目标检测属于其中的检测任务,它广泛的应用在智慧交通、安全监控等领域。尽管目标检测开始崛起,但这是一个复杂的过程,实现这一过程需要面临不少的挑战,而目标检测中最大的挑战是保持速度与精度之间的均衡。在实现平衡的过程中,会遇到各种挑战,如被检测的物体具有不同的角度、不同的大小、形状不一和被遮挡等情况,这一系列的挑战都会影响到检测的效果与速度。在众多
学位
神经架构搜索目的是通过机器自动设计网络架构,有望带来机器学习的新革命。尽管期望很高,但现有神经架构搜索解决方案的有效性和效率尚不明确,解决方案的低效率主要归因于所需计算成本过大,因此导致不能准确地搜索和评估网络架构。由于知识蒸馏技术受到越来越多的关注,能够把大的模型进行压缩,将知识传授给小模型,因此可以将知识蒸馏引入神经架构搜索中,进而实现低成本的研究。如何把教师模型的知识传授给学生模是知识蒸馏的
学位
近年来,将深度学习应用于医疗领域正炙手可热,各国研究人员在许多个与医院合作的辅助诊断任务中取得了堪比医生人工诊断的精度,有些项目甚至能够超越医生,例如在医疗图像相关的检测、分割任务上,而在眼球的视杯视盘分割便是如此。在眼底照片中,眼睛的视杯和视盘这两个生理结构是可以被大致辨别出来的。衡量眼睛是否患有某些疾病便可以根据视杯和视盘的面积比来判断。这个面积比叫做杯盘比(CDR)。健康的眼睛的视杯和视盘有
学位
目的 基于驱动蛋白家族3A基因(Kif3a)和Sonic hedgehog(SHH)信号通路探讨洋甘菊活性组分对脂多糖(LPS)诱导的人支气管上皮细胞(16HBE)的保护作用及机制。方法 用脂多糖诱导人支气管上皮细胞建立哮喘炎症细胞模型。CCK-8法检测不同浓度洋甘菊活性组分对脂多糖诱导人支气管上皮细胞的增殖的抑制作用,筛选出最佳洋甘菊活性组分给药浓度。将细胞分为空白对照组、脂多糖模型组、阳性药物
期刊