人类长非编码RNA-疾病关系网络的表示学习研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:FollowMyHeart88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类长非编码RNA和疾病关系研究不断深入,出现了预测长非编码RNA-疾病关系的方法。引入被证实的长非编码RNA和疾病的关系组建关系网络,科研人员使用网络表示学习获得节点表示向量,用于预测长非编码RNA-疾病关系。节点表示向量在网络相关分析中能起到很好的效果。本课题使用长非编码RNA和疾病的关系数据,构建了由190个长非编码RNA和疾病节点组成的一个双层关系异质网络。这个网络包含有的内部关系3633条无向边。然而,基于本课题网络关系数据,同质网络表示学习方法没有增加社区约束信息,异质网络表示学习方法没有引入同类型节点相似性数据。同质网络表示学习方法缺少社区约束,对长非编码RNA-疾病关系异质网络做同质化输入处理后,对长非编码RNA相似性网络和疾病相似性网络进行社区发现、增加社区约束的改进和网络关系预测实验分析。异质网络表示学习方法存在无法利用到长非编码RNA和疾病的相似性数据的问题,在长非编码RNA-疾病关系异质网络上,引入社区成员以增加跳转对象、结合相似性网络的改进和网络关系预测实验分析。这里使用AUC(Area Under Curve)值作为关系预测模型的评价标准。两种改进表示学习方法获得的关系预测结果与重启随机游走RWR方法、Deepwalk表示学习方法和Node2vec表示学习方法进行对比。此外,结合相似性网络改进的异质网络表示学习方法还和Metapath2vec表示学习方法进行对比。其中,增加社区约束改进的同质网络表示学习方法的关系预测结果比Deepwalk表示学习方法提高了1.65%,比Node2vec表示学习方法提高3.12%。结合相似性网络改进的异质网络表示学习方法的关系预测结果比Deepwalk表示学习方法提高了3.34%,比Node2vec表示学习方法提高了4.81%,比Metapath2vec表示学习方法提高了6.29%。最后利用节点表示向量,计算余弦相似度的大小。计算结果被文献验证关系,说明本课题方法可指导实验。
其他文献
电子本身迁移率及弛豫时间等多种因素,限制了电信系统的速度和带宽。而光学器件的运行速度仅受光速的限制,所以超高速大容量的全光网络是一种有效的解决电信系统瓶颈的办法,
无线通信的核心问题是信息传输的效率与可靠性。信道编码技术是解决可靠性问题的重要手段之一。因为具有灵活的码本结构设计、线性复杂度的编码算法、并行化的译码结构和接近
在自然界中几乎不会发现纯净的氢气,必须通过各种化学方法从其他化合物中制备。生产方式多样是氢能的主要优势之一,因为它增加了能源安全性并减少了对某些原材料的依赖性。不
随着半导体外延和芯片技术的快速发展,紫外LED的技术与应用已成为产业的研究热点。本课题结合地方特色产业,主要针对近紫外LED在鞋服皮革照明与建材领域的光催化去甲醛方面的
图像分割是根据不同应用需要将图像分割成若干个具有独特性质且互不重叠的区域,进而将感兴趣区域与背景分离的过程,由于图像的多样性和复杂性,图像分割一直是图像理解和计算
我国的耐磨钢球生产技术水平相对较为落后,生产的磨球普遍存在着质量差、寿命短的问题,极大地加剧了矿业消耗。因此,制备高性能的磨球,具有十分重要的经济价值和社会意义。针
图像检索是计算机视觉的一个重要分支领域。图像检索的一般流程是,首先提取训练集中图像的特征,然后提取待检索图像的特征,接着计算待检索图像特征和训练集中图像特征的相似
当前新型恶意代码数量和种类日益增多,对网络空间安全提出了新的挑战。基于特征码等传统的恶意代码检测技术,其检测形式单一,难以检测新型恶意代码。基于常规机器学习的检测
近年来国内致密砂岩油藏在水平井、体积压裂与“工厂化”作业等技术的支持下,得到了有效的开发利用,但对致密砂岩储层孔隙结构特征的研究和致密砂岩油藏水驱油效率影响因素的
在深部资源开采工程和地下空间拓展工程中,岩柱的稳定性问题一直是实际工程开展所面临的一项难题。由于深部岩体处于“三高一扰动”的特殊地质力学环境,天然或人造岩体发生失