论文部分内容阅读
随着人类长非编码RNA和疾病关系研究不断深入,出现了预测长非编码RNA-疾病关系的方法。引入被证实的长非编码RNA和疾病的关系组建关系网络,科研人员使用网络表示学习获得节点表示向量,用于预测长非编码RNA-疾病关系。节点表示向量在网络相关分析中能起到很好的效果。本课题使用长非编码RNA和疾病的关系数据,构建了由190个长非编码RNA和疾病节点组成的一个双层关系异质网络。这个网络包含有的内部关系3633条无向边。然而,基于本课题网络关系数据,同质网络表示学习方法没有增加社区约束信息,异质网络表示学习方法没有引入同类型节点相似性数据。同质网络表示学习方法缺少社区约束,对长非编码RNA-疾病关系异质网络做同质化输入处理后,对长非编码RNA相似性网络和疾病相似性网络进行社区发现、增加社区约束的改进和网络关系预测实验分析。异质网络表示学习方法存在无法利用到长非编码RNA和疾病的相似性数据的问题,在长非编码RNA-疾病关系异质网络上,引入社区成员以增加跳转对象、结合相似性网络的改进和网络关系预测实验分析。这里使用AUC(Area Under Curve)值作为关系预测模型的评价标准。两种改进表示学习方法获得的关系预测结果与重启随机游走RWR方法、Deepwalk表示学习方法和Node2vec表示学习方法进行对比。此外,结合相似性网络改进的异质网络表示学习方法还和Metapath2vec表示学习方法进行对比。其中,增加社区约束改进的同质网络表示学习方法的关系预测结果比Deepwalk表示学习方法提高了1.65%,比Node2vec表示学习方法提高3.12%。结合相似性网络改进的异质网络表示学习方法的关系预测结果比Deepwalk表示学习方法提高了3.34%,比Node2vec表示学习方法提高了4.81%,比Metapath2vec表示学习方法提高了6.29%。最后利用节点表示向量,计算余弦相似度的大小。计算结果被文献验证关系,说明本课题方法可指导实验。