基于特征选择方法识别喉癌和下咽癌患者的预后基因标志物

来源 :吉林大学 | 被引量 : 0次 | 上传用户:liangxiaoyan0307
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
喉癌是头颈部常见的恶性肿瘤,且大多数是鳞状细胞癌。下咽癌在临床上相对少见,占头颈部恶性肿瘤的3.0%-5.0%,同时它也是头颈部肿瘤中相对预后最差的恶性肿瘤[1]。近年来,喉癌和下咽癌的发病率呈逐年上升的趋势[2]。基因表达失调是许多疾病发生的内在条件,因此,识别喉癌和下咽癌的预后基因标志物,既可以为喉癌和下咽癌的治疗提供新的有效靶点,也可以提供可靠的诊断。本文将喉癌和下咽癌患者的预后基因标志物的筛选分为三个阶段,分别为初筛阶段、特征选择阶段和验证比较阶段。在初筛阶段,在包含20531个基因的微阵列中用Log-rank检验筛选出26个基因。在特征选择阶段,分别使用Lasso回归、Boruta、XGBoost和基于注意力机制的深度神经网络(Attention-based DNN)在26个基因的基础上做进一步特征选择。Lasso回归筛选出的基因标志物为DGCR9、FXYD6、LOC220930、PLAC1和PRAM1,Boruta筛选出的基因标志物为ST13、STIL和DGCR9,XGBoost筛选出的基因标志物为STIL、PLAC1、ZNF578和MRPL35,Attention-based DNN筛选出的基因标志物为DGCR9、KRTAP12、PRPF19和SELL。在验证比较阶段,分别用不同模型筛选出的基因标志物建立Cox回归模型,然后按照所有样本的风险比率(HR)的中位数分为两组,进行Log-rank检验,Lasso回归、Boruta、XGBoost和Attention-based DNN的Log-rank P值分别为1.564321e-06、0.0001945455、0.009050826和1.187648e-05。其中,Lasso回归的Log-rank P值最小。接下来在Lasso回归的基础上做了进一步改进,提出一种基于强化学习和Lasso结合的特征选择方法。该方法让智能体不断尝试特征子集的搜索,以Lasso分类器的准确率作为即时收益,根据特征子集得到的收益动态调整特征子集内特征。最终,智能体会选择最大收益的特征子集作为最优策略,该特征子集即是筛选的预后基因标志物。强化学习和Lasso结合的特征选择方法筛选的预后基因标志物有BMP2,LOC220930,OR52B4和SNORA71D,其对应的HR值中位数分组后的Log-rank检验的P值为8.732182e-07,小于Lasso回归的Log-rank P值。
其他文献
孙中山是我国近代历史上伟大的政治家和革命活动家,他的政治思想在清朝至民国的时代交替之际具有承前启后、继往开来的重要作用。他政治思想中的监察思想是他在批判性的继承
保险法律机制是一个协同与对立的机制。其通过投保人的告知义务、合理期待原则以及保险人的说明义务、不利解释原则等构建了一个双边的义务体系。但是传统的“全赔或者不赔原则”在司法适用中架空了这种保险机制,取而代之的是法官基于其价值判断而对某一方利益的舍弃。为了平衡保险当事人的利益,保险司法实践中出现了对比例原则的适用。在此背景下,本文共分为四章对比例原则在保险法上的适用进行探究。第一章探究比例原则在保险法
水,是一切生命的源泉,是我国国民经济的命脉。水资源的利用和保护更是事关国计民生的大事。水行政执法则是国家水资源管理工作中的重要一环,其执法效果不仅关乎我国水利事业
结肠癌患者演变为肝转移的风险将对其生存率和治疗预后产生重大影响,但目前患者的早诊率低、生存期短,诊治状况不容乐观,因此采取有效措施评估患者的肝转移风险,提前控制肿瘤发生发展,将有助于临床医师展开有效的个性化预后。本文旨在提出基于CT增强图像的中位数法和基于CT增强图像的M-K均值聚类法识别结肠癌患者发生肝转移的风险,并利用混淆矩阵对比两种方法在训练集和测试集的性能表现,以探究结肠癌细胞肝转移风险的
墨西哥有着悠久且灿烂的历史文明,在当今世界艺术风格瞬息万变的潮流中,墨西哥的艺术创作风格鲜明独特且以其浓厚的地域文化精神的特质独树一帜。鲁菲诺·塔马约(1899年8月26日——1991年6月24日)是20世纪墨西哥画坛的主要代表人物之一,是继墨西哥著名壁画三杰之后被世界画坛所公认的杰出的墨西哥现代绘画大师。他的绘画根植于墨西哥本土文化之中,展现了本民族深层的历史文化内涵,实现了民族传统艺术特色与西
随着PPP模式在各领域的不断深入发展,公法与私法因素的进一步交融,对PPP协议争议救济制度提出了新的要求。由于学界对PPP协议的法律性质存在不同认识,PPP有关法规政策对法律
图像合成是深度学习和视觉计算中的一个重要的研究方向,其在当今社会生活中具有广泛的应用前景和价值。它一般通过对输入的原始图像进行特征的提取与分析,再对这些特征作特定的约束与变换得到新的特征,最后利用新的特征来合成输出新的图像。传统的图像合成方法一般基于人为设定的特征如颜色直方图、纹理信息、形状信息和灰度信息等,再结合先验知识进行图像合成的研究。这类方法由于过度依赖人为设定的浅层特征而忽略了图像的深层
在二级市场,投资者转让或买入股票达到公司股本一定比例时,抑或每增持或者减持一定比例的股份时,法律法规要求投资者必须履行通知、报告等义务的制度,谓之为大额持股披露制度。在证券市场中,违法行为人违反大额持股披露制度,违规增持股份的行为乃违规举牌。近年来,我国违规举牌频发,资本市场该类案件发生的数量与频率也在不断增加,暴露出大额持股披露制度在设计上存在缺陷;辩证的看,大额持股披露制度与违规举牌的密切联系
Mg-RE系合金具有高强、高韧、耐热、抗蠕变和耐腐蚀等优异的综合性能。热挤压变形和热处理是提高镁合金性能的重要手段。然而合金中第二相含量、分布和形貌对热挤压镁合金的
贝壳珍珠层凭借“砖-泥”纳米叠层结构的桥联承载,及对裂纹偏转、桥接和钝化,实现强韧性的完美匹配。本研究采用“化学吸附分散-叠合轧制-累积叠轧”的方法,制备叠层尺度和界