论文部分内容阅读
计算药物重定位旨在利用计算方法为已有药物寻找新的用途。与传统创新药物的设计研究相比,计算药物重定位有着投入低和周期短的特点。此外,已经批准上市的药物经过严格的临床实验,其毒副作用通过了严格的评估,安全性有保证。因而根据这些药物新用途制备的药物更容易通过监管部门的审核。计算药物重定位对于新药的研发有着重要的意义。研究人员针对计算药物重定位问题提出了多种模型。但这些模型在两个方面有待改进:一方面是模型采用的数据不够充分,没有借助生物信息领域丰富的数据信息;另一方面是采用的模型在学习能力上存在不足,无法从数据中学习到更高层次的药物-疾病关系。因而本文针对这两个方面的问题,对计算药物重定位进行了如下研究工作:(1)多源数据的利用。为了使得学习到的药物-疾病关系更加可靠,本文不仅考虑已有的药物和疾病间的治疗关系,还考虑到药物、疾病、基因的自身属性信息,采用多种数据信息,丰富药物-疾病关系。(2)基于异质网络多源游走的药物重定位模型。本文采用多源数据信息,利用图模型对药物、疾病和基因关系进行建模,提出了异质网络多源随机游走模型(Multi-Random Walk on Heterogeneous network,HMRW)。HMRW模型首先构造一个包含药物、疾病和基因三种不同类型节点的三层异质网络,并利用分别从药物节点和疾病节点出发的随机游走,计算药物和疾病节点间的关联程度。实验结果表明,与未引入基因信息的模型相比,HMRW有更好的模型表现。(3)基于混合泛化矩阵分解的药物重定位模型。本文受推荐系统启发,尝试利用协同过滤技术解决重定位问题。在泛化矩阵分解模型的基础上,本文提出了混合泛化矩阵分解模型(Hybrid Generalized Matrix Factorization,HGMF)。HGMF模型从药物和疾病两个方面添加侧面信息,利用自动编码器对药物和疾病属性进行特征提取,将提取的药物和疾病特征作为药物隐向量和疾病隐向量参与协同过滤。实验结果表明,HGMF模型的预测效果优于仅依赖药物-疾病关系的泛化矩阵分解模型,也优于上述的异质网络多源随机游走模型。