论文部分内容阅读
摘 要:恶性胰腺癌(pancreaticcancer)其实是一种消化道恶性肿瘤,具有很高的恶性癌变程度,诊断和早期治疗困难很大。近几年来,发病率和患者死亡率显著提高。胰腺癌的早期手术确诊死亡率一般较低,手术晚期死亡率高,治愈性能也较低。胰腺癌是否发生的尚不清楚。科研机构希望利用与人工智能相关的大数据技术辅助放射科医生进行医学图像识别,提高医疗成像数据的准确性,降低放射科醫生的压力,达到早发现和治疗疾病的目标。本课题采用大数据技术分布存储胰腺光影像数据,利用深度学习技术将大量胰腺X光图像从自动特征中提取,并通过大数据技术研究了癌症药物。
关键词:胰腺癌;X光影像;大数据技术;对比治疗机制
前言:
近几年来,随着大数据技术的迅速发展,基因组拷贝变化、突变、甲基化数据和转录组、蛋白质组、代谢群等与癌症有关的组学数据也在迅速积累,为癌症的研究和精确医学的发展提供了大量的机会。通过前期的调查,胰腺癌是最差预后的恶性肿瘤之一,被称为"癌中的王子",在前期难以发现,药物作用也不理想。针对目前存在的问题,我们对于胰腺癌前期X光片及药物治疗效果进行了大数据处理并构建了对比治疗机制。
1.设计思路
对比 alexnet 神经网络, mobilenets 神经网络, vgg16 神经网络模型,以及胰腺 x 光图像识别的精确度,根据分析效果优劣,选择 vgg16 网络模型对算法进行改进,分别命名 vggy 和 vgg y1 ,标准卷在 vgg16 网络上。积被 vggy 网络模型改为深度分离的卷积,并将改进的网络模型应用于胰腺梗阻性慢性胰腺炎,症状糖尿病,血栓型静脉炎,黄疸性肝炎,胆石症,胆囊病和正常七种类型的识别。
2.设计原理
2.1基于转录组大数据和深度学习的药物重定位预测
在这部分研究中,基于 lincs 计划的药物刺激下细胞反应转录组的大数据,构建了一个基因共表达网,它由不同的治疗性质组成,并由此基因共表达网络构成,并由此基因共表达网络的核心成分 dgcn 组成。 dgcn 基因共表达关系的联结可以被用来探究基因诱导的药物表达方式,从而使研究人员更深入地理解药物作用的机制。接下来,利用 lincs 计划的 l1000 数据集中的药物扰动和基因沉默转录组中的大数据以及深度学习,构建了一个深度神经网络 dnn 模型,系统进行了药物靶标的关联预测。通过交叉验证,发现 dnn 模型的精确度比其他预测算法要高,而且所预测的药物靶标相关联系在其他相关的数据库中明显集合。
2.2基于多组学数据融合的癌症共识分子亚型辨识的Web计算实现
在第二个部分的研究中,使用 tcga 、 icgc 和 target 国际大型项目的癌症多组学资料和多聚类算法,建立了 comsuc 癌症认识分子亚型的 web 计算工具。 comsuc 弥补了由不同测序平台,预处理过程和聚类法等因素引起的分子亚型不一致缺陷,这是 comsuc 弥补的。 comsuc 实现了多个应用场景,多种聚类算法,可以展示并输出分析的发表等级。以辨别肾上腺皮质癌 acc 的共识分子亚型为例,展示了 comsuc 在癌症分子亚型识别方面的实用性。本研究展示了转录组和多组学数据融合的计算分析,并在药物重定位预测和癌症分子亚型识别方面的应用。
3.设计优势分析
3.1 构建了药物诱导的基因共表达网络
经过一系列预处理的数据,构建了药物扰动转录反应的表达谱数据。计算不同的药物刺激细胞系中所有基因之间的 pearson 相关系数和 p 值,按一定筛选规则进行合并,构成了不同的治疗性药物刺激下基因共表达网,从而形成了一个核心药物引导基因共表达网。该网络帮助研究者更深入地理解了药物作用的机制。
3.2 将深度学习方法引入到药物重定位领域
相对传统新药研发模式,药物重定位策略发现药物新用途具有显著的成本效益优势,能加快药物上市步伐,满足恶性肿瘤、罕见病、个性化医疗等特定领域药物临床用药需求。而深度学习可以有效提取图像隐含特征,在医学影像识别方面的应用快速发展。采用递增扩充卷积并且融合批量标准化和LeaklyReLU函数对输入胰腺癌早期X光片及药物效果数据进行特征提取与学习;然后通过结合递减扩充卷积和ReLU函数对提取的特征进行图像重构;二者结合,将深度学习方法引入到药物重定位领域,可以提高药物-靶标关联关系预测的准确率。
3.3 搭建了包含多个组学数据和多个聚类方法的癌症共识分子亚型Web计算工具
复杂性疾病常由环境因素和遗传性因素(多组学层次)共同作用引起。对认知疾病发生的全面分析,对认知疾病发生的进程至关重要。多组学数据整合分析可以提高特征检查的效率,提高疾病的预测精确度。癌症共识分子亚型网络计算工具可以将不一致的聚类方法融合到多个组学和聚类方法中,从而发现与癌症共识分子亚型相关的生物标志和相关诊断,有助于对医疗进行针对性诊断。
4.可行性
近几年来,随着恶性功能肿瘤基因组学的迅速研究发展,与各种癌症发病有关的基因组织科学分析数据也在迅速发展积累,这些基因组的科学分析数据与各种癌症发病有关。为癌症药物的研发和精确医学的发展创造了大量的机会。转录组数据是生物医学的一个重要组成成分,在生物医学和临床应用中得到了广泛的应用。而细胞扰动表达谱测量的转录组在各种扰动情况下的变化,通过对组织细胞不同的生理,病学,药物作用等基因表达谱印记的对比分析,可以在不同的生理,病学作用和药物作用中建立联系。
5. 推广前景
近几年来,机器学习尤其是深度学习技术的发展,使得深度学习成为计算机视觉,语音识别,自然语言处理的成功。药物大数据与深度学习相结合,将为生物医学在包括药物开发在内的各个领域带来新的发展机会。随着基因测序、高通量基因芯片和低成本转录组技术的迅速发展,积累了大量关于药物扰动、基因沉默和癌症的多组学资料,这些大量数据不仅对生物学基础研究产生了深远的影响,而且对药物重定位、癌症分子的分型等应用研究也产生了深远的影响并为癌症大数据提供重要的机遇。
参考文献:
[1]宋欣雨,文昱琦,刘祯,何松,伯晓晨 基于LINCS转录组大数据的药物诱导基因共表达网络构建【J】军事科学院军事医学研究院 2018(06)
[2]宋欣雨 基于组学大数据的药物重定位预测和癌症共识分子亚型辨识【J】军事科学院 2019
[3]熊阿珍,孟光兴 药物重定位候选药物筛选路径【J】中国医药工业杂志 2020(02)
作者简介:
姓名:冯熙然,性别:女,籍贯:云南省昆明市西山区,出生年月:2002年10月28日,学历:本科;研究方向:医学影像技术
姓名:李思婷,性别:女,籍贯:福建省漳州市芗城区,出生年月:2001年11月12日,
学历:本科;研究方向:医学影像技术
姓名:赵娜,性别:女,籍贯:山东省威海市环翠区,出生年月:1991年10月10日,学历:本科,职称:讲师,研究方向:临床医学
关键词:胰腺癌;X光影像;大数据技术;对比治疗机制
前言:
近几年来,随着大数据技术的迅速发展,基因组拷贝变化、突变、甲基化数据和转录组、蛋白质组、代谢群等与癌症有关的组学数据也在迅速积累,为癌症的研究和精确医学的发展提供了大量的机会。通过前期的调查,胰腺癌是最差预后的恶性肿瘤之一,被称为"癌中的王子",在前期难以发现,药物作用也不理想。针对目前存在的问题,我们对于胰腺癌前期X光片及药物治疗效果进行了大数据处理并构建了对比治疗机制。
1.设计思路
对比 alexnet 神经网络, mobilenets 神经网络, vgg16 神经网络模型,以及胰腺 x 光图像识别的精确度,根据分析效果优劣,选择 vgg16 网络模型对算法进行改进,分别命名 vggy 和 vgg y1 ,标准卷在 vgg16 网络上。积被 vggy 网络模型改为深度分离的卷积,并将改进的网络模型应用于胰腺梗阻性慢性胰腺炎,症状糖尿病,血栓型静脉炎,黄疸性肝炎,胆石症,胆囊病和正常七种类型的识别。
2.设计原理
2.1基于转录组大数据和深度学习的药物重定位预测
在这部分研究中,基于 lincs 计划的药物刺激下细胞反应转录组的大数据,构建了一个基因共表达网,它由不同的治疗性质组成,并由此基因共表达网络构成,并由此基因共表达网络的核心成分 dgcn 组成。 dgcn 基因共表达关系的联结可以被用来探究基因诱导的药物表达方式,从而使研究人员更深入地理解药物作用的机制。接下来,利用 lincs 计划的 l1000 数据集中的药物扰动和基因沉默转录组中的大数据以及深度学习,构建了一个深度神经网络 dnn 模型,系统进行了药物靶标的关联预测。通过交叉验证,发现 dnn 模型的精确度比其他预测算法要高,而且所预测的药物靶标相关联系在其他相关的数据库中明显集合。
2.2基于多组学数据融合的癌症共识分子亚型辨识的Web计算实现
在第二个部分的研究中,使用 tcga 、 icgc 和 target 国际大型项目的癌症多组学资料和多聚类算法,建立了 comsuc 癌症认识分子亚型的 web 计算工具。 comsuc 弥补了由不同测序平台,预处理过程和聚类法等因素引起的分子亚型不一致缺陷,这是 comsuc 弥补的。 comsuc 实现了多个应用场景,多种聚类算法,可以展示并输出分析的发表等级。以辨别肾上腺皮质癌 acc 的共识分子亚型为例,展示了 comsuc 在癌症分子亚型识别方面的实用性。本研究展示了转录组和多组学数据融合的计算分析,并在药物重定位预测和癌症分子亚型识别方面的应用。
3.设计优势分析
3.1 构建了药物诱导的基因共表达网络
经过一系列预处理的数据,构建了药物扰动转录反应的表达谱数据。计算不同的药物刺激细胞系中所有基因之间的 pearson 相关系数和 p 值,按一定筛选规则进行合并,构成了不同的治疗性药物刺激下基因共表达网,从而形成了一个核心药物引导基因共表达网。该网络帮助研究者更深入地理解了药物作用的机制。
3.2 将深度学习方法引入到药物重定位领域
相对传统新药研发模式,药物重定位策略发现药物新用途具有显著的成本效益优势,能加快药物上市步伐,满足恶性肿瘤、罕见病、个性化医疗等特定领域药物临床用药需求。而深度学习可以有效提取图像隐含特征,在医学影像识别方面的应用快速发展。采用递增扩充卷积并且融合批量标准化和LeaklyReLU函数对输入胰腺癌早期X光片及药物效果数据进行特征提取与学习;然后通过结合递减扩充卷积和ReLU函数对提取的特征进行图像重构;二者结合,将深度学习方法引入到药物重定位领域,可以提高药物-靶标关联关系预测的准确率。
3.3 搭建了包含多个组学数据和多个聚类方法的癌症共识分子亚型Web计算工具
复杂性疾病常由环境因素和遗传性因素(多组学层次)共同作用引起。对认知疾病发生的全面分析,对认知疾病发生的进程至关重要。多组学数据整合分析可以提高特征检查的效率,提高疾病的预测精确度。癌症共识分子亚型网络计算工具可以将不一致的聚类方法融合到多个组学和聚类方法中,从而发现与癌症共识分子亚型相关的生物标志和相关诊断,有助于对医疗进行针对性诊断。
4.可行性
近几年来,随着恶性功能肿瘤基因组学的迅速研究发展,与各种癌症发病有关的基因组织科学分析数据也在迅速发展积累,这些基因组的科学分析数据与各种癌症发病有关。为癌症药物的研发和精确医学的发展创造了大量的机会。转录组数据是生物医学的一个重要组成成分,在生物医学和临床应用中得到了广泛的应用。而细胞扰动表达谱测量的转录组在各种扰动情况下的变化,通过对组织细胞不同的生理,病学,药物作用等基因表达谱印记的对比分析,可以在不同的生理,病学作用和药物作用中建立联系。
5. 推广前景
近几年来,机器学习尤其是深度学习技术的发展,使得深度学习成为计算机视觉,语音识别,自然语言处理的成功。药物大数据与深度学习相结合,将为生物医学在包括药物开发在内的各个领域带来新的发展机会。随着基因测序、高通量基因芯片和低成本转录组技术的迅速发展,积累了大量关于药物扰动、基因沉默和癌症的多组学资料,这些大量数据不仅对生物学基础研究产生了深远的影响,而且对药物重定位、癌症分子的分型等应用研究也产生了深远的影响并为癌症大数据提供重要的机遇。
参考文献:
[1]宋欣雨,文昱琦,刘祯,何松,伯晓晨 基于LINCS转录组大数据的药物诱导基因共表达网络构建【J】军事科学院军事医学研究院 2018(06)
[2]宋欣雨 基于组学大数据的药物重定位预测和癌症共识分子亚型辨识【J】军事科学院 2019
[3]熊阿珍,孟光兴 药物重定位候选药物筛选路径【J】中国医药工业杂志 2020(02)
作者简介:
姓名:冯熙然,性别:女,籍贯:云南省昆明市西山区,出生年月:2002年10月28日,学历:本科;研究方向:医学影像技术
姓名:李思婷,性别:女,籍贯:福建省漳州市芗城区,出生年月:2001年11月12日,
学历:本科;研究方向:医学影像技术
姓名:赵娜,性别:女,籍贯:山东省威海市环翠区,出生年月:1991年10月10日,学历:本科,职称:讲师,研究方向:临床医学