【摘 要】
:
肿瘤转移是其高死亡率的关键。越来越多的学者开始关注肿瘤转移的研究,并在这一领域取得了令人满意的成果。乳腺癌是女性最常见的恶性肿瘤。它的高死亡率,主要是由于转移和复发造成的。侵袭性和非侵袭性乳腺癌患者需要不同的治疗方法,因此迫切需要预测工具来指导临床决策,以避免非侵袭性乳腺癌的过度治疗和侵袭性病例的治疗不足。测序时代的到来允许在分子水平上研究肿瘤转移,这对于了解肿瘤转移的分子机制、识别诊断标志物和治
论文部分内容阅读
肿瘤转移是其高死亡率的关键。越来越多的学者开始关注肿瘤转移的研究,并在这一领域取得了令人满意的成果。乳腺癌是女性最常见的恶性肿瘤。它的高死亡率,主要是由于转移和复发造成的。侵袭性和非侵袭性乳腺癌患者需要不同的治疗方法,因此迫切需要预测工具来指导临床决策,以避免非侵袭性乳腺癌的过度治疗和侵袭性病例的治疗不足。测序时代的到来允许在分子水平上研究肿瘤转移,这对于了解肿瘤转移的分子机制、识别诊断标志物和治疗靶点、指导临床决策具有重要意义。本文使用illumina infinium 450k甲基化表达谱来进行乳腺癌侵袭性的研究。主要包括以下几方面工作:首先根据全基因组DNA甲基化距离来划分样本集;然后基于肿瘤的450k甲基化数据对肿瘤纯度进行评估和校正,MEpurity是一种基于β混合模型的算法,它只需要肿瘤样本的DNA甲基化数据就可以计算出肿瘤的纯度,而不需要匹配的正常样本;DESeq2是一种差异分析方法,它允许用户提供肿瘤纯度,从而减少由于肿瘤不纯而对后续分析造成的影响。实施了两种差异甲基化分析方法来识别特定的Cp G位点并对结果取交集,为了降低基于统计检验筛选的差异位点的假阳性,使用了两种算法实施差异分析。接着对差异位点集合进行有效的降维,基于四种降维算法的结果,使用随机森林算法分别构建甲基化分类器来对原发性乳腺癌进行分类。最后利用乳腺癌(BRCA)HM450 DNA甲基化数据和来自肿瘤基因组图谱(TCGA)数据库的临床数据从多个角度来验证和评估分类器的性能,包括基本的模型评估指标,基于超几何分布的临床因子富集分析,基于最优特征集的层次聚类,肿瘤转移相关基因的文献验证。总之,这项研究显示了DNA甲基化作为预测肿瘤侵袭性和为转移癌研究提供新信息的生物标记物的潜力。此外,还开发了一个基于本文提出的差异甲基化分析、降维以及分类算法的网站,以便于科研人员研究和预测乳腺癌的侵袭性。
其他文献
药物研发耗时费力成本高昂,药物重利用是解决问题的重要途径,其中药物-疾病的关系预测是药物重利用中的研究热点。早期的方法主要是基于文本挖掘的关系链接预测的相关方法,但是无法考虑疾病的潜在机制。为了更好地处理和分析疾病机制中的复杂关系,网络模型被应用到药物-疾病相互作用关系预测研究上。现有的基于网络模型的关系预测方法虽然考虑了复杂关系的整体性,但却忽略网络中的节点差异性。另一方面,现有模型大都采用是以
随着当前互联网环境中各类社交媒体的快速发展,人们在互联网上留下了海量的电子足迹信息,这些信息包含了人们的社会言论、社会关系、社会行为等丰富数据。这些数据为我们构建用户画像,分析社会关系提供了重要的数据支持。社会关系是人类社会的重要组成部分,社会关系分析是社会网络研究的重要基础。传统的社会关系分析研究多倾向于关系的方向、强度和类型,缺乏丰富的语义内涵,因此这些方法所构建的关系画像存在局限性,难以支撑
在信息检索中,最近的研究表明,信息检索系统的平均有效性的提高可能会降低信息检索系统在多个主题的得分的稳定性,这个现象表明有效性和稳定性两者之间存在一个折中。另外,一些风险指标被提出来度量系统的风险,但是这些评价指标是与前面所提到的有效性评价指标是分开定义的。综上所述,目前信息检索评价领域主要存在三个问题:(1)系统的有效性和稳定性尚未在一个统一的框架中进行系统的评估;(2)在这个框架下,这个统一的
目前关于人脸面部表情的研究主要是对静态人脸图片直接分析识别,这种方法往往在实验室环境下的人脸数据集上表现不错,却难以适用于含有有损人脸的野外复杂环境下的人脸数据集,比如低分和有部分遮挡等人脸图片。本文旨在通过人脸修复模型对有损人脸进行修复生成,然后利用人脸面部表情识别模型对修复后的人脸进行面部表情动作单元识别分析。本文主要解决的问题是保证修复生成后的人脸图片的人脸面部表情动作与真实的人脸面部表情动
校园暴力和欺凌已经成为严重影响青少年健康成长的问题之一。目前的预防措施主要依靠个人主动揭发或者学校监督。到目前为止,还没有一个有效的解决方案能够自动检测出暴力欺凌事件。检测暴力欺凌事件的本质就是人体行为识别。目前,人体行为识别在教育、医疗、商业和军事领域已经有广泛的应用。而且,人体行为识别在计算机视觉、可穿戴传感器和基于环境传感器技术方面都有一定的研究。但是,这些技术都有一些设备,场景的限制,无法
三维钻孔可视化是钻孔设计中的重要方面,旨在更形象的展示钻孔的内部结构,方便用户的设计,具有一定的现实意义。本文对三维空间展示相关理论进行了研究,并对系统需求与系统的主要开发技术进行了深入的分析。确定以MVC开发模式为基础,采用Beego框架以及Mongo DB数据库,结合HTML5、Web GL和Java Script等前端可视化技术实现系统功能设计与界面设计。系统划分为计划钻孔展示、实际钻孔展示
知识图谱在描述现实世界中的各种实体和关系方面具有良好的表现形式,它是人工智能领域的一项关键技术,研究热度随着人工智能的发展而不断提高。作为描述大规模知识图谱的标准数据格式资源描述框架RDF,伴随着知识图谱的兴起,也广泛应用在各个领域,与我们生活息息相关。例如,用于帮助搜索引擎找到更符合用户需求的答案、用于优化对一个事物的具体描述。RDF数据的广泛使用导致其数据日益庞大,亟需一个高效的数据管理系统进
世界上有数以万计的聋哑人,如果手语能够通过识别技术转化为语音,将极大地促进聋哑人与正常人之间的交流。为了实现手语领域的人机交互,需要设计出一个可以识别多个身体部位的动作系统。本文研究了基于Wi-Fi信道状态信息(Channel State Information,CSI)的手语识别问题,利用商业Wi-Fi设备实现了一个名为WiSign的原型,实现了单词级别和句子级别的手语识别,并在真实的室内环境中
管线铺设是地浸矿山井场设计中的一个重要环节,开发基于Web GL的井场管线铺设系统能够在三维场景下辅助技术人员进行管线铺设,为管理者的决策提供数据支持,具有一定的实用价值。本文首先对国内外井场管线铺设系统的发展现状进行了分析,研究了相关理论与技术。通过需求分析将系统划分成了地表模建模、地表交线铺设、井场管网规划、管线数据统计等模块。为实现地表建模模块,提出了一种改进的距离反比插值算法,首先使用K均
自然语言处理技术已被广泛应用于很多领域,其中也包含对电影剧本的分析。近年来看电影成为人们常见的休闲娱乐方式,人们总是希望在看电影之前更多的了解电影内容,判断是否有自己感兴趣的片段,并且希望可以快速的定位到该片段。但目前常用的视频播放软件并不能满足人们这样的需求,不能进行片段的索引,在对片段进行定位的时候人们只能手动的快进或后退拉动进度条,有时候可能会错过自己想看的内容。因此,为了能让用户在比较短的