癌组织和癌旁组织DNA甲基化预测模型研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:yjso579202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌组织和癌旁组织的DNA甲基化与癌症的发生和发展密切相关,在某些情况下,难以大规模获取癌组织和癌旁组织的DNA甲基化数据是探索DNA甲基化在癌症病因和发病机制中作用的一大障碍。采用计算的方法预测癌组织或者癌旁组织的DNA甲基化对于理解癌症的发生、评估癌症的风险十分重要。在本文中,我们建立了机器学习模型,能够预测癌组织和癌旁组织全基因组Cp G位点的DNA甲基化。此外,对DNA甲基化连续表达值的预测,分辨率更高且能够更好地用于表观基因组分析和研究。主要研究内容如下:(1)基于单位点方法的DNA甲基化预测模型。本研究收集了TCGA数据库肾透明细胞癌(KIRC)和甲状腺癌(THCA)的DNA甲基化数据集,基于配对的癌组织和癌旁组织的DNA甲基化数据集,我们构建了单位点方法的DNA甲基化预测模型,并且采用十折交叉验证方式评估每一个Cp G位点上建立的模型的预测性能。对于KIRC数据集,总体上预测和真实组织间的位点水平的平均R~2(相关系数的平方)从原始的0.90增长到了0.96,平均绝对误差由原始的0.069降低到了0.043,在THCA数据集上有类似的提升。此外,我们观察到在使用线性回归模型进行预测时,可以至少降低70%Cp G位点的平均绝对误差。(2)基于多位点方法的DNA甲基化预测模型。考虑到在基因组中,一个Cp G位点与周围或者更远距离的Cp G位点是相互关联的,我们提出了一种使用多个相关Cp G位点来预测目标组织中DNA甲基化水平的框架。对于每个选定的目标Cp G位点,我们使用训练数据集选择N个与目标Cp G位点相关的特征子集,之后基于选择的多个相关Cp G位点构建模型来预测目标Cp G位点的DNA甲基化。结果表明所构建的XGBoost模型在大多数情况下取得了更好的预测性能。(3)预测模型的生物医学应用。本文通过差异甲基化分析、通路分析和DNA甲基化与临床病理参数的统计分析说明了所建模型的生物医学应用。本研究基于机器学习算法建立了癌组织和癌旁组织DNA甲基化数据的数学模型,十折交叉验证的结果表明了所提出的算法提高了组织间甲基化数据预测的准确性,建立的多位点模型进一步提高了DNA甲基化的预测精度。此外,通过生信分析说明了模型的潜在生物医学应用。这项研究可能从表观遗传学角度为癌症研究提供新的见解。
其他文献
目的 探讨锚钉联合空心螺钉治疗复杂粉碎性髌骨骨折的手术方法及临床疗效。方法 对2016年8月-2020年10月收治的23例复杂粉碎性髌骨骨折(AO/OTA分型均为C3型)患者,进行切开复位锚钉联合空心螺钉内固定治疗。术后通过骨折愈合时间、膝关节活动度、B■stman髌骨骨折疗效评分等指标评价手术治疗效果。结果 3例患者失访,其中1例术后3个月失访,2例术后6个月失访。术后平均随访时间为(11.5±
期刊
全球新一轮科技正在加速海洋渔业发展,掀起了新的蓝色经济发展浪潮,自此我国海洋牧场建设进入快速发展时期。在海洋牧场发展过程中忽视牧场建成后的全过程监测评估、预警预报问题,导致海洋牧场仍处于生态环境质量不可见、不可知,以及经济物种资源不可统计、灾害不可预警的状态。本文针对无人机协同水域传感网开展研究,以实现海洋牧场生态监测与信息传输。网络架构中水下、水面、空中、陆地的立体组网能够保证对环境实时、有效的
学位
随着海运事业的快速发展,海洋环境中的船舶数量逐年增加,导致船舶监控更具挑战性,难以保障船舶的安全行驶以及工作效率。现实海洋监控中,受海浪、杂波等背景干扰以及船舶尺度变化影响,现有船舶检测方法通常存在船舶误检和漏检现象。因此如何对复杂情况下的船舶实现有效地监测定位,受到了国内外研究人员的广泛关注。此外,船舶目标具有类别多,颜色、外观和尺度多变等特点,现有方法对船舶目标的全局和局部特征捕捉并不理想,影
学位
金沙江是中国西南地区重要的水运通道,其航运体系与公路、铁路等其他重要交通运输方式相辅相成,能有效缓解由于地形、经济发展等原因造成的地区运输能力不足的问题。向家坝水电站是金沙江下游的最后一环,其通航建筑物向家坝升船机是该水电站唯一的通航建筑物。向家坝升船机长期高效运转,承船厢频繁往复上下运行,船厢门、通航门频繁启闭,各关键部件长期处于低速重载的工作环境,因此对向家坝升船机各关键部件运行状态进行监测,
学位
随着信息化时代的到来,如何在海量数据中快速地提炼出所需信息已成为难题,数据挖掘技术的提出为之提供了解决方案。离群点检测技术是数据挖掘领域的研究热点之一,筛选数据集中的离群点不仅可以作为数据分析的预处理步骤,还可以通过研究离群对象携带的信息获取新的行为特点,为生产、科研提供新思路。因此,设计合适的算法对数据集中的离群点进行高效且准确的检测显得尤为重要。本文通过对现有检测方法进行分析,提出了一种基于改
学位
报纸
甚高频数据交换系统(VHF Data Exchange System,VDES)是一种新型海上通信系统,也是国际海事组织(International Maritime Organization,IMO)主导的e-航海战略基本通信方式之一。在VDES通信中,针对不同无线信道质量,设计了不同的数据调制和信道编码技术,如何高效智能的利用不同数据调制和信道编码策略,进而提升VDES系统数据吞吐量是高性能V
学位
近年来,我国长江三峡—葛洲坝船闸的通航流量不断加大,通航船舶的安全隐患日益增多。2018年初交通运输部为保障船员船舶安全,要求对过闸船舶实施100%安检,工作人员的安检任务随之加重。当前,“船舶过闸安检智能一体化研究”项目围绕船舶人员资质证书的核验、通航船舶限高、船载货物自动识别等方向展开了技术研究并取得了重要成果,有效提升了过闸安检效率。其中,船载货物自动识别技术作为过闸船舶远程安检的重要一环,
学位
市场营销管理是一项专业性的工作,其往往需要在不同的营销场景中,对于消费者的心理进行研究和判定,继而生成更加针对性的市场营销管理方案,才能够引导市场营销管理工作进入到高质量的状态。基于这样的角度,首先对于消费心理的内涵、表现类型进行概述,归结当前市场营销管理的现状,提出要在消费心理透视的基础上去开展市场营销管理工作,期望由此使得市场营销管理工作质量不断提升。
期刊
深度学习源于对人工神经网络的研究,由于神经网络的通用效果和性能都很出色,深度学习技术已经应用到各个行业领域。度量学习在特定任务上学习一个距离度量函数来研究样本对之间的关系,度量学习已经帮助许多算法取得了很好的性能,加入度量学习会使得不同类别的样本区分性更强。因此许多学者研究了深度学习和度量学习的协同作用,近年来许多深度度量学习算法被相继提出。这些深度度量学习模型从样本中提取高质量的特征虽然能够提供
学位