基于网络表示学习的癌症协同驱动通路识别研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:mirror722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症主要由体细胞基因突变加速积累导致细胞无限增殖引起,癌症研究的一个关键步骤是识别导致肿瘤从正常状态向恶性状态转变的驱动突变和驱动基因。此外,癌症驱动基因往往只在少数生物学通路中发生作用。因此,研究者们开始将关注点从识别驱动基因转移到识别驱动通路。识别驱动通路有助于揭示疾病发生和发展的自然规律,对癌症患者的精确治疗、新的药物靶点和诊断测试具有重要意义。研究表明,多条通路在相同的生命活动和致癌过程中协同作用。然而,识别协同驱动通路的计算方法尚未得到很好的研究。现有方法存在的问题包括数据不完整、缺乏通路协作评价指标、不容易求解和结果缺乏可解释性等。针对这些问题,本文整合基因组数据、通路数据和基因与通路之间的关联性数据等多种生物数据,进行协同驱动通路识别研究,主要工作如下:(1)针对通路数据不完整和缺乏通路协作评价指标问题,提出一种基于社区发现和链路预测的协同驱动通路识别方法(CDPLP)。该方法首先设计了一个权重函数来量化基因对目标癌症的影响,筛选出对目标癌症影响较大的候选驱动基因参与基因模块识别,从而降低后续参与计算的数据规模。然后,CDPLP结合体细胞突变数据和基因表达数据构建基因关联网络(具有表达相似性和突变互斥性),在基因关联网络上使用社区发现算法来识别与目标癌症相关的基因模块。接下来,CDPLP构建包含三种节点(基因、mi RNA、通路)的异质信息网络,利用该网络的结构信息预测通路之间的互作关系。最后,CDPLP设计了一个新的量化函数去量化两个通路之间的协同作用,并将协同得分最高的10对通路识别为目标癌症的协同驱动通路。在四个数据集上的实验结果表明,CDPLP能够有效识别与目标癌症相关的协同驱动通路。(2)针对当前癌症协同驱动通路识别方法存在的包括计算量大和结果缺乏可解释性等问题,提出了一种基于元路径和多视图聚类的癌症协同驱动通路识别方法(Multi Co DP)。该方法构建由基因、通路、病人三种节点及它们之间关系组成的异质信息网络,选择起点和终点都为通路节点的元路径来描述通路之间的关系。Multi Co DP选择四条元路径通路-基因-通路、通路-基因-基因-通路、通路-基因-病人-基因-通路(基因突变数据)和通路-基因-病人-基因-通路(基因表达数据)分别描述通路之间的基因重叠、基因相互作用、基因突变共现和基因表达相似四种关系,并通过计算元路径通路节点的相似度得到四个描述通路相似度的矩阵。然后,Multi Co DP采用多视图聚类方法聚类与目标癌症密切相关的协同驱动通路。实验结果表明,该方法识别的协同驱动通路不仅能够促发目标癌症,而且通路之间存在强协同作用。
其他文献
背景和目的:骨关节炎(Osteoarthritis,OA)的发展与关节组织中老化细胞的增多和软骨降解有关,原因可能是线粒体功能障碍和氧化应激。因此,减少氧化应激对软骨细胞的损伤通常被视为治疗OA的有效手段。淫羊藿作为一种传统中草药,常用于OA的基础研究和临床治疗。其独特的黄酮类化合物淫羊藿苷被历版《中国药典》指定为淫羊藿药材质量评价的指标性成分,具有清除氧自由基(Reactive oxygen s
学位
随着信息技术的蓬勃发展,人类社会中产生的数据量飞速增长,数据对象的类别及其相互之间的关联越来越复杂,形成了规模巨大、种类繁多的异构信息网络(Heterogeneous Information Network,HIN),如何挖掘这些数据中包含的知识成为亟需解决的问题。因此,需要探索合理的异构信息网络表示方式,以提高存储与分析的效率。早期的方法基于网络采样的结果学习网络节点的稠密向量表示。然而,这类方
学位
随着互联网行业的快速发展,人类的生产生活产生大量的复杂网络。链路预测的主要任务是通过已知的网络节点以及网络结构等信息,预测网络中尚未产生连边的节点对之间在未来产生链接的可能性。作为数据挖掘领域的一个重要分支,链路预测已成为各领域研究者关注的重点,广泛应用于生物实验、推荐系统、网络重构、在线社交等领域。以共同邻居(Common Neighbors,CN)为代表的传统链路预测算法仅根据节点的一阶邻居信
学位
药物组合在治疗多种复杂疾病中发挥着重要作用,它能从多个治疗方向促进患者健康恢复。与单一药物治疗相比,药物组合治疗不仅能够提高治疗效果,而且可以降低单一药物剂量增加带来的副作用。然而,通过临床实验手段验证成千上万种药物组合的有效性,会消耗大量人力和物力资源。深度学习的迅速发展,为临床医疗数据的挖掘与运用提供了新手段。通过深度学习技术对临床医疗数据加以分析,筛选出潜在有效的治疗药物组合,可以大大减少临
学位
目的 观察护理干预对Leep刀宫颈锥切术治疗宫颈疾病的影响及效果。方法 选取行Leep刀宫颈锥切术治疗的宫颈疾病患者40例,分为基础护理干预组和整体护理干预组各20例。对比两组手术一次成功情况、术后并发症、宫颈长度、疼痛程度、生活质量及护理满意度。结果 整体护理干预组手术一次成功率高于基础护理干预组(P<0.05),术后并发症发生率低于基础护理干预组(P<0.05),护理满意度高于基础护理干预组(
期刊
随着互联网技术的快速发展,社交网络作为重要的信息载体,极大程度改变了信息的传播方式,使每个人都能扮演信息的创造者、传播者和消费者,因此,对信息流行度的高效预测成为了研究热点之一。然而,由于内容形式的多样性、网络结构的复杂性以及影响因素的多元性使得预测任务面临众多挑战,如何建立高效的预测模型是亟待解决的问题。通过对相关文献资料的充分调研,本文深入研究并分析了信息流行度的诸多影响因素,运用深度学习技术
学位
瑞幸咖啡在2017年以来发展的三年时间里,一直在吞噬着星巴克和蓝山咖啡等主导的咖啡饮品市场。通过对瑞幸咖啡的分析可以看出,瑞幸咖啡的价值链管理还存在着一些问题,这将会影响到其未来市场核心竞争力的发展。因此,文章利用环境分析和SWOT分析等手段,对瑞幸咖啡的核心竞争力进行了深入的分析,提出相应的策略。希望通过文章的研究,能够对目前市场环境下瑞幸咖啡的核心价值进行进一步的优化,并且为其他新兴行业的企业
期刊
随着社会经济持续发展和城市建设不断加快,城市公共交通在提高交通服务运营水平、改善城市居民出行体验上愈发重要。然而在城市公共交通日常运营中,部分地铁站点或公交站点在遭受极端天气后可能引发大范围交通阻塞,导致交通系统结构连通性严重下降。同时,城市公共交通系统存在不平衡发展现象,部分地铁站点或公交站点承载了城市公共交通系统的大部分运量。为提升城市公共交通网络抗毁程度,避免站点故障大幅降低出行效率,优化交
学位
随着大数据智能领域的迅速发展,人类向着信息化社会不断前进和突破,现在已经进入到了现实世界和虚拟世界相结合的时代。如何综合分析不同领域带来的不同体量和维度的信息来提供正确的决策是当前领域发展必须面临的问题。在多类型信息源融合的实际应用过程中,一般都是通过传感器来获得相应的信息,传感器的信息收集是多传感器融合过程中至关重要的第一步,信息源的可靠性收集决定着最终的决策结果是否正确。现实情况中,由于恶劣天
学位
基于2022年“高校考试招生改革引导学生德智体美劳全面发展研究”项目组所收集的“高考改革调查问卷”中40326份高中生问卷,结果显示:高中生对高考选科制度和选科结果基本满意,对高考选科需要多主体共同参与基本认可,认为高考选科利于专业选择与职业规划,部分高中生选科时出现心理焦虑,传统文理分科仍是所选人数最多的组合。同时也发现:高中生对高考选科制度和对未来发展的引导基本满意、对家长参与高考选科的认可度
期刊