基于自编码器的疾病相关miRNA预测方法研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:liuliea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类的细胞中含有大量的MicroRNA(miRNA),它们属于重要的内源性小分子非编码RNA。近年来,许多研究已经表明miRNA不仅与细胞的增殖、分化、发育、代谢、凋亡等多种重要的生物学过程有关,而且与肝癌、乳腺癌等人类复杂疾病有关。因此,探索潜在的疾病相关miRNA有助于理解不同疾病的分子机制,且能够进一步提高复杂疾病诊断的准确性。虽然早期已经有很多的传统生物方法被用于推断miRNA与疾病之间的关系,但是这些方法几乎都存在设备昂贵和周期较长等弊端,且只有较少的疾病相关miRNA能够被确认。随着miRNA与疾病相关的生物学数据被逐渐挖掘,一些高可信度的公开数据库被逐渐建立。研究者利用这些公开数据库中的信息,通过设计高效精确的计算方法预测潜在的miRNA-疾病关联,弥补了传统生物方法中存在的不足。本文综合利用miRNA和疾病的生物学数据,基于自编码器提出了三种针对疾病相关miRNA预测问题的计算模型。(1)构建了基于自编码器的预测模型(AEMDA)。首先,针对疾病和miRNA相似性信息不足的问题,AEMDA模型分别为疾病和miRNA计算了高斯核相互作用相似性,使其与疾病语义相似性和miRNA功能相似性进行整合,从而降低了相似性矩阵的稀疏性。其次,为了构建高质量的特征,该模型将miRNA相似性数据与疾病相似性数据进行拼接,生成能够表示miRNA-疾病对的原始特征,并将其输入到自编码器中提取miRNA-疾病对的深度特征。最后,随机森林根据深度特征输出对应的miRNA-疾病对关联分数,以判定该miRNA是否与疾病相关。(2)实现了基于自编码器和奇异值分解的预测模型(AESVD)。为了进一步解决相似性数据的稀疏性问题,AESVD模型运用相似网络融合方法分别对疾病相似性和miRNA相似性进行处理。继而,为了使目标特征向量既包含非线性信息又含有线性信息,AESVD模型使用自编码器根据相似性信息提取疾病和miRNA的非线性特征,以及利用奇异值分解根据关联信息提取疾病和miRNA的线性特征,然后将不同类型的特征整合成为miRNA-疾病对的特征向量。最后,为了得到准确的预测结果,该模型将特征向量输入到极限梯度提升算法中生成相应的miRNA-疾病对关联得分,完成疾病相关miRNA的识别。(3)设计了基于图卷积自编码器的预测模型(GCAEMDA)。为了设计信息丰富的miRNA和疾病的嵌入,GCAEMDA模型应用相似核融合方法整合不同类型的相似性数据,并结合miRNA-疾病关联信息构建异质网络,从而提取miRNA和疾病的嵌入。GCAEMDA模型在分别设计基于miRNA和疾病的子网络的基础上,依据miRNA和疾病的嵌入,使用图卷积自编码器计算miRNA与疾病之间的预测得分。最后,GCAEMDA模型采用平均集成的方法使两个子网络中输出的预测分数相结合,生成miRNA与疾病之间的关联得分,以此实现miRNA与疾病之间的相关性判定。交叉验证实验和案例分析实验结果表明,AEMDA、AESVD和GCAEMDA模型均能够有效地预测与疾病相关的miRNA。
其他文献
随着经济社会的快速发展,人们的消费观念悄然发生改变。近几年来,人们不管经济是否富足,都可能出现冲动消费行为。尤其是大学生由于社会阅历浅、思想单纯、消费欲望强烈,更容易受市场营销、商业广告等方面的影响而发生冲动性购买。已有研究发现,当代大学生的物质主义水平普遍偏高。这种物质主义倾向是否会对其冲动性购买产生影响,是一个值得探讨的课题。物质主义者将金钱作为成功和幸福的标志,为此形成的金钱态度会影响个体的
学位
报纸
<正>外籍人才是我国高新技术发展不可或缺的组成部分。新个人所得税法改革确立了综合与分类相结合的混合计征体制,将非居民纳税人的居住时间范围收紧。本文从新个税制度改革要点入手,分析新个税法改革对我国高新技术企业引进外籍人才的影响以及企业可能面临的涉外税务风险,并提出企业的风险防范策略。
期刊
<正> 我科1986~1990年以来运用补血活血法治疗顽固性头痛40例,收到较为满意的效果。现就临床观察报道如下。临床资料40例头痛患者中,女性32例,男性8例;年龄18~45岁;病程3年以上者25例,4月至1年15例;最长5年,最短4月。其特点为:头痛反复发作,时轻时重,经久不愈,兼有头晕,脉沉或弦,舌质淡或暗。其中拍片示颈椎改变5例,脑电图轻度异常2例,经前期头痛加重5例,外伤引起2例。治疗方
期刊
随着我国对外开放水平的不断提高和“一带一路”建设的迫切需求,党中央高度重视人才引进工作,为响应习近平总书记提出的要“聚天下英才而用之”的号召,各地相继出台政策制度确保引进流程进一步规范化、简捷化,出台配套措施要保障对外籍人才的吸引力和可持续性发展。但“选人”“用人”和“留人”难的问题一直是制约地方高校引智工作的重要因素。本文借助数据分析了辽宁省属高校在外籍人才引进中面临的实际困难,从导向引领、侧重
期刊
<正>我国教育已经迎来了全新的改革,全面推行素质教育。但在过去的高中语文教学中,繁杂的语文课程导致教师教学手段一成不变,教学内容比较枯燥,课堂教学效率不高,学生也提不起学习语文的兴趣。所以,创新高中语文课堂教学手段显得格外重要,只有通过多样化的教学手段才能使学生保持对高中语文的学习兴趣,从而帮助学生提升语文水平,启发学生的思维能力,为未来的学习和生活提供坚实的基础。
期刊
<正>引言全球外籍人才情况概览外籍人才即具有外国国籍、在某一行业领域具有特殊造诣的专门人才1。外籍人才的流动,对于技术扩散、国际贸易、科技创新、文化创意等方面都具有重大意义2,与本国人才形成充分互补。1970-2020年,全球国际移民流动规模由0.8亿人增长至2.8亿人3(图1)。新冠肺炎疫情暴发后,全球移民流动有所放缓,很多外籍人士在综合考虑出入境政策、就业形势、医疗保障、家庭团聚等因素后,决定
期刊
<正>《幼儿园教育指导纲要(试行)》健康领域的目标中指出,“教师与家长要根据幼儿的需要建立科学的生活常规,培养幼儿良好的饮食、睡眠、盥洗、排泄等生活自理习惯。”当前大多家庭的孩子由爷爷奶奶抚养长大,由于溺爱的存在,导致大多幼儿生活自理能力较差,很多小班幼儿在入园以后难以适应幼儿园的生活和学习。因此,加强对孩子自理能力培养,帮助孩子逐渐养成生活自理的好习惯,势在必行。
期刊
在日常生活中,文本和图像是两种常见的承载信息的模态。随着人工智能和深度学习技术的发展和成熟,计算机模拟人类行为、从自然语言中生成图像的方法受到了广泛的关注。在生成对抗网络技术的研究与应用过程中,跨模态的文本到图像生成任务取得了一定的成果,但由于该任务结合了自然语言处理和计算机视觉等多个领域的技术,具有生成步骤复杂、挑战性高等特点,文本生成图像模型的性能需要进一步提升,尤其是生成图像的质量亟需提高。
学位
机器阅读理解,旨在根据对文本的理解给出符合问题的答案,是自然语言处理和人工智能领域的研究热点问题之一。随着深度学习技术的快速发展和理论研究的深入,机器阅读理解的应用范围也日益广泛,并间接促进了自然语言理解、信息检索、图像识别等领域的进展,具有非常高的学术研究价值和商业应用价值。现有模型虽然已经具备了在单文档或者单段落中进行答案预测的优异性能,但是,在多段落或者多文档中实现多跳推理的机器阅读理解任务
学位