【摘 要】
:
近年来,随着人们生活水平的提高以及饮食习惯的改变,结直肠癌发病率呈增长趋势。由于结直肠癌具有异质性,不同的发展机制和发展阶段都会表现出不同的临床进程,进而影响患者的预后。为此,临床上通过将结直肠癌划分为不同的分子亚型并预测患者生存时间,制定合理的治疗方案,以促进个体化精准治疗。多组学主要包括基因组学、蛋白组学等,反映了癌症发展过程中的生物过程和分子机制,对于患者的病理评估以及治疗方案的制定有着重要
论文部分内容阅读
近年来,随着人们生活水平的提高以及饮食习惯的改变,结直肠癌发病率呈增长趋势。由于结直肠癌具有异质性,不同的发展机制和发展阶段都会表现出不同的临床进程,进而影响患者的预后。为此,临床上通过将结直肠癌划分为不同的分子亚型并预测患者生存时间,制定合理的治疗方案,以促进个体化精准治疗。多组学主要包括基因组学、蛋白组学等,反映了癌症发展过程中的生物过程和分子机制,对于患者的病理评估以及治疗方案的制定有着重要的参考价值。相比于临床病理数据,多组学数据具有高维小样本等特点,加上结直肠癌的异质性,导致不容易从多组学数据中提炼有效信息、准确预测患者生存时间。机器学习方法以其优异的非线性表征能力,在挖掘数据内在模式、预测准确性等方面有着独特的优势。鉴于此,本文以“医工信”联合研究为依托,在浙江大学医学院附属第二医院、浙江大学肿瘤研究所的支持下,尝试在医学多组学数据分析中引入机器学习和数据驱动的思路,开展结直肠癌分子分型和生存分析研究。主要工作和研究成果如下:(1)研究了多组学数据的生物学特性、预处理方法以及整合方法。针对单组学数据以及临床病理数据难以反映结直肠癌进展中复杂生物过程的问题,分析了多组学的医学机理、与癌症进展的关联性。针对多组学数据中存在缺失值的情况,采用有序k近邻方法预测缺失值并填充,提高了填充的准确性。针对不同组学特征的尺度差异,进行了标准化处理。根据多组学整合的特点,探讨了不同策略的适用性。根据结直肠癌异质性的特点,提出了先分子分型,再生存分析的基本路线,为后续研究奠定了基础。(2)研究了利用多组学数据信息的结直肠癌分子分型方法。针对多组学数据高维小样本特点下基于距离的聚类方法失效的问题,采用群体因子分析方法将高维组学特征归结为少数与患者预后相关的公共因子。为了减小多组学数据中测量噪声对聚类结果的干扰,提出了基于改进自组织映射的聚类方法并自适应确定最佳聚类个数,划分出不同的结直肠癌分子亚型。与传统基于密度以及距离的聚类方法比较,所研究方法提高了同种亚型内样本分子特征的相似度以及不同亚型间预后的差异度。为了在外部数据集中验证分子分型有效性,针对缺乏同质多组学验证集的问题,提出在单组学验证集上进行外部验证的策略。通过方差分析提取原数据集中不同亚型间的单组学差异特征,采用支持向量机预测验证集中样本的亚型,对预测结果进行统计学检验,在单组学验证集上验证了分子分型的有效性。(3)研究了利用多组学数据信息的结直肠癌生存分析方法。针对传统生存分析方法在高维小样本下易过拟合且结直肠癌存在异质性的问题,采用Cox单变量检验分别对每个亚型样本进行特征选择,提取亚型特异化预后显著特征来分别建立生存分析模型。针对传统生存分析方法所依赖的统计学假设难以满足的问题,提出了基于多任务学习的生存分析方法,将生存时间预测问题转化为对患者连续时间点生存概率预测的多任务问题,摆脱了对生存时间分布的统计学假设依赖。在多任务学习的神经网络中融合正则化方法,避免了模型的过拟合,提高了预测准确性。根据每个亚型患者预测生存时间的分布将患者划分为高、低风险群体,通过统计学检验表明不同风险群体预后差异较为显著,可以有效区分结直肠癌患者预后风险。(4)围绕多组学数据模型结果进行了医学相关性分析和实际样例分析。通过对分子分型结果进行通路分析,研究不同分子亚型间分子模式差异的根源。结合临床病理分期对分子分型结果和生存分析结果进行了相关性分析,研究了不同亚型间的分期分布差异以及不同分期间预测生存时间分布差异。对不同分子亚型的患者进行了样例分析。综上所述,本文针对结直肠癌个体化精准治疗的需求,研究了利用多组学数据进行分子分型和生存分析的方法,开展了验证与分析工作。所研究方法在结直肠癌患者分子亚型的划分以及生存时间预测中表现出较好的性能,对于结直肠癌的病理评估与个体化治疗具有借鉴意义。
其他文献
微波光子技术具有大带宽、低损耗、抗电磁干扰能力强等优势,在无线通信、相控阵雷达、深空探测等领域具有重要的应用前景。然而在传统的微波光子链路中,通常需要多个分离器件的级联来实现相位调制、变频、光频梳等信号处理功能。而这些分离器件的级联会造成较大的传输损耗和性能下降。传统铌酸锂电光调制器的体积较大,且其基底并不易与其它材料集成。最新发展的新型单晶铌酸锂薄膜,在充分利用铌酸锂的调制特性的同时,由于其基底
随着万物互联时代的来临,大量联网的嵌入式设备的安全性对信息安全至关重要。为了安全性考虑,一般在嵌入式设备上部署加密算法进行保密通信和身份验证,但大部分嵌入式设备的计算资源通常受到限制。目前已经被国际互联网工程任务组标准化的后量子密码算法之一的XMSS(e Xtended Merkle Signature Scheme)数字签名算法需要执行数万次HASH计算以生成密钥对、签名和验证,并且需要足够的内
机器人抓取是机器人领域的重要研究内容之一,在生产生活中有广泛的应用。在基于视觉引导的机器人抓取系统中,快速准确的物体位姿估计算法对提高机器人抓取效率十分重要。近年来许多物体位姿估计算法被提出,但它们在复杂场景中存在鲁棒性不足、难以处理物体的弱纹理和对称性等问题。针对现有位姿估计算法的问题,本文面向机器人抓取任务展开了物体位姿估计算法的研究,主要研究内容和成果如下:1)针对弱纹理物体位姿估计存在目标
TC4钛合金具有比强度高、抗疲劳特性高、耐腐蚀性好等优异性能,被广泛的应用于医学、航空航天等领域,选区激光熔化(SLM)技术具有快速性、低成本、精度高等一系列优点,可以充分发挥出TC4钛合金的优势。激光扫描速度会对SLM成形TC4合金的缺陷、组织和性能产生较大影响,但目前对激光扫描速度与微观机理演变规律的研究还不够深入,尤其是缺陷的表征和α’马氏体相的形貌特征及取向关系还有待进一步探索。因此,本文
为满足电动汽车这一高电压变比、大功率应用场合中的电压变换、电能双向传输、电气隔离等需求,隔离型双向DC-DC变换器的研究得到了广泛的关注。目前,有两个制约其进一步发展的技术难点,即充电效率较低和电池寿命较短,而变换器的电流应力决定了开关器件导通和关断过程中损耗的大小,是影响充电效率的重要因素,同时,电流的冲击也会缩短电池的寿命。因此,降低电流应力和功率损耗,提高容量和效率,是当下隔离型双向DC-D
小管道气液两相流广泛应用于能源、化工和医疗等领域,由于小管道气液两相流的复杂性,小管道气液两相流气泡轮廓重建技术在工业生产和学术研究中都有十分重要的价值和意义。为了更好地满足小管道气泡可视化、气泡轮廓机理研究和其他参数检测等方面的需求,本文基于小管道气液两相流的光学机理,对小管道气泡轮廓重建技术进行了研究,提出了一种小管道气泡轮廓重建新方法,该方法能够实现气泡截面轮廓和三维轮廓的重建。本文的主要工
癫痫发作是由脑神经元群异常放电所致。发作期间由于病人身体不受控制,当无人照看时极易受到损伤,这种反复的折磨严重影响着患者和其家人的生活。癫痫发作预测研究旨在病人发作前给出预警,以最大限度降低危害,具有很重要的应用价值。目前,癫痫预测研究已经取得了很大进展,但远没有达到实际临床应用的需求。从多个特征维度和视角研究大脑由正常到发作的渐变过程中的信息,对研究癫痫预测具有重要意义。本文一方面从注意力机制的
气液两相流是一种常见的流体形态,广泛存在于石油石化、金属冶炼、生物制药等众多轻、重工业领域的生产过程中,针对气液两相流进行检测具有重要意义。电导检测技术是一种经典和常用的气液两相流检测技术,一直备受科研人员的关注和重视。然而,传统的电导检测技术大多为接触式检测,存在电化学腐蚀、电极极化、电极沾污等问题,其应用受到诸多限制。电容耦合式非接触电导检测(Capacitance Coupled Conta
当前河道水面漂浮物清理手段主要以人工打捞为主,耗时耗力,安全性低,内河水面无人船具有环境适应能力强和人工成本低等优点,在水面漂浮物清理以及河道资源探索等方向有着广阔的应用前景,而视觉感知技术是无人船在自动行驶过程中获取周围环境信息的重要渠道。针对无人船视角的水上环境包含大量倒影干扰以及水中漂浮物面积比较小的问题,本文提出了联合水域分割任务和漂浮物检测任务的卷积神经网络模型;为了提高模型的推理速度,
水是人类生存不可或缺的资源,正确、有效地管理和利用水资源对经济发展有着重要的作用。在掌握水情、调配水量以及灾害防范中,河道流速和流量是十分重要的数据。传统测速方法使用旋桨式测速仪、声学多普勒测速仪、雷达波测速仪等仪器进行测量,虽然具有测量精度高的优点,但是成本高、实时性不够、检测范围窄,难以满足大规模系统部署的需要。随着计算机视觉技术的进步和成本的降低,采用视频图像进行流速检测成为一种可能。在图像