基于图注意力网络和变分图自编码器的circRNA-疾病关联预测算法研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:huanghuimin1224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息学的不断发展,处理和分析海量生物数据对于药物开发、疾病诊疗、生物医学研究等多个领域有着积极作用。环状RNA(circRNA)作为一种具有共价闭环结构的新型内源性非编码RNA,可以从多方面调控基因的表达,被验证与人类复杂疾病之间存在潜在关联。目前已有的circRNA-疾病关联预测算法存在缺乏多源数据、没有高效聚合相似性网络特征、特征数据处理过平滑以及特征种类融合不充分等不足之处。为此,本文基于深度学习技术提出了两种新型的circRNA-疾病关联预测方法,其主要工作内容如下:(1)为了解决目前模型缺乏多源数据且没有高效聚合相似性网络特征的问题,本文提出了基于图注意力网络和图卷积网络的circRNA-疾病关联预测方法GATGCN。该模型首先采用中心核对称算法来融合多源数据,并使用注意力网络来聚合相似性网络节点信息以计算潜在特征,在分别得到circRNA和疾病相似性网络的潜在特征后,将其与邻接网络结合以构建异构网络。最后引入图卷积网络模型作用于所构建的异构网络来计算circRNA与疾病之间的关联得分矩阵。通过交叉验证与案例研究等实验验证,结果表明GATGCN算法与已有的方法相比具有更高的AUC值,且在实际应用中的预测结果具有稳定性和可靠性。(2)为了解决已有方法特征数据处理过平滑和特征种类融合不充分的不足之处,本文提出一种基于无偏重启随机游走与变分图自编码器的circRNA-疾病关联预测方法RVGAE。此方法在引入多源数据且充分利用相似性网络计算特征的同时,减少了模型过拟合的风险,并更加有效地将生物特征信息和数据拓扑信息结合使用。本方法在使用中心核对称算法动态融合多源数据之后,通过无偏重启随机游走计算相似性网络的结构特征。同时,将计算得到的结构特征与邻接矩阵拼接以融入关联信息,再通过主成分分析法去除融合过程中产生的数据噪声。最终,将构建的构造关联异构网络和特征异构网络作为变分图自编码器的输入,计算circRNA与疾病之间的关联预测分数矩阵。根据后续的实验结果表明,本方法相较第一种方法具有更高的AUC值。最后,案例研究表明本方法在实际应用场景中的circRNA-疾病关联预测性能较GATGCN也有进一步的提高。
其他文献
目的 探究多囊卵巢综合征(PCOS)患者采取克罗米芬联合尿促性素治疗对其促排卵的临床效果。方法 选取80例PCOS患者,采取随机数字表法分为对照组与试验组,每组40例。对照组采用克罗米芬治疗,试验组采用克罗米芬联合尿促性素治疗。比较两组促排卵效果、排卵率及妊娠率。结果 治疗前,两组患者排卵数、优势卵泡数、优势卵泡平均直径及卵泡成熟日比较,差异无统计学意义(P>0.05)。治疗后,两组患者排卵数、优
期刊
近年来,经济的飞速发展带动了人们生活方式的转变,与此同时,社会交通路网也渐趋复杂,而人们对于出行效率以及公共安全的意识也在不断提升,因此一个准确的交通流量预测不仅对政府在交通管理和安全防范有着不可小觑的作用,而且对大众的出行体验与人身保障有着至关重要的意义。例如,准确的预测出租车需求可以提高车辆调度效率,减少交通拥堵;准确的共享单车预测可以降低运营成本;准确的人群流量预测可以提前预防踩踏事件的发生
学位
建筑能耗在我国一次能源消耗中所占比例逐年递增,对实现双碳目标带来极大挑战,而装配式建筑作为一种新型建筑方式,为推广新型建筑节能技术提供了重要途径。当前相变储能凭借其优越性在建筑节能领域应用广泛,相变材料具有储热能力大、相变温度可选择、相变过程稳定、价格低廉、实验易操作、无腐蚀性等优点。在建筑墙体结构中添加相变材料,可以利用相变材料吸放热性能,增加墙体结构的热惰性及储热能力,降低建筑墙体供暖、制冷负
学位
有机合成染料和有机微污染物(Organic Micro-pollutants,OMPs)作为水体中常见的有机污染物,由于其成分复杂且难降解等原因,排放入水体中对环境造成了极大污染,甚至会导致水生动物的内分泌变化及“三致”的危险。高级氧化技术作为目前在水处理过程中应用最为广泛技术对有机污染物具有较好的处理效果,UV/KMnO4高级氧化体系作为一种新的水处理技术,可以产生羟基自由基(·OH)和活性锰成
学位
流体在流道内流动时,流动的不均匀性促使流体与流道固体壁面之间的动量传递速率增强,从而导致流动阻力的急剧增加。这种表面摩擦阻力最终会造成能源资源的大量消耗,为了有效解决输送过程耗能过量的问题,众多减阻技术应运而生并得到了广泛推广和应用。聚合物添加剂减阻由于其减阻效果显著且容易操作备受青睐,它主要依靠将少量的长链高分子聚合物溶入流体中,改变流体的湍流结构,进而极大降低流动的摩擦阻力来实现减阻。为此,本
学位
近年来,随着人工智能的不断发展,移动机器人在各个领域得到广泛的应用。而估计当前位置是这些机器人的关键任务,称为机器人定位。定位是机器人技术中的一个重要过程,也是移动机器人领域的研究热点。基于概率定位算法主要有卡尔曼滤波定位、马尔可夫定位及粒子滤波定位。其中粒子滤波算法在处理非线性非高斯系统方面具有更高的准确性和鲁棒性,成为目前的主流算法。传统基于粒子滤波的定位算法存在概率系统模型构建和学习的困难和
学位
目的 探讨尿促性素联合克罗米芬治疗排卵障碍性不孕症患者的临床效果。方法 124例排卵障碍性不孕症患者作为研究对象,采用随机数字表法分为对照组与观察组,各67例。对照组予以尿促性素治疗,观察组予以尿促性素联合克罗米芬治疗。比较两组治疗前后各项性激素指标[黄体生成素(LH)、卵泡刺激素(FSH)、雌二醇(E2)、孕酮(P)]水平、妊娠情况及排卵情况。结果 治疗后,两组LH、FSH比较,差异无统计学意义
期刊
随着我国物质生活水平的逐渐提高,我国汽车保有量也逐年增加。尽管汽车给人民的生活和工作带来许多便利,但也带来了许多问题。如:交通事故、交通拥堵、乱停乱放和停车位资源浪费等。因此,为了解决这些问题,需要大力推动智慧停车场管理、辅助驾驶系统和智慧交通系统的发展。基于深度学习的车辆检测技术是计算机视觉中的一个热门研究方向,也是推动上述系统发展过程中基础且十分重要的技术。然而现有的车辆检测模型还存在很多不足
学位
目的 分析个体化护理对维持性血液透析高血压患者自我管理行为及依从性的影响。方法 根据随机数表法将2020年1月至2021年12月在本院救治82例维持性血液透析高血压患者分为观察组和对照组,每组41例。两组均采用常规护理,同时观察组另予以个体化护理。比较两组基线资料、自我管理能力、依从性以及血压水平。结果 两组基线资料对比(P>0.05);护理后观察组自我管理行为的改善情况相比对照组较好(P<0.0
期刊
矿石分选抛废中对计算机辅助技术的运用,可以有效提升精尾矿分类准确率和处理量。近几年,深度学习技术的运用对矿石分选抛废效果提升巨大,但是该技术的落地实现的前提是数量足够而且均衡的训练集,生成对抗网络的应用可能成为这一难题的解法之一。本论文通过对铅锌矿石X射线图像以及生成对抗网络的研究,提出了一种胶囊鉴别器-生成对抗网络,在一定程度上达到了数据增强的效果。以下是主要工作内容:1、制作矿石图像数据集。本
学位