【摘 要】
:
肺癌是世界上最常见的恶性肿瘤之一,其中非小细胞肺癌(non-small cell lung cancer,NSCLC)占所有肺癌病例的85%。由于NSCLC早期阶段的无症状性和缺乏有效的筛查方式,约75%的患者被发现时已处于中晚期,因此迫切需要新的生物标志物(相关基因)来用于NSCLC的诊断、预后和药物反应。本文以NSCLC的生物学数据作为研究对象,设计NSCLC相关基因编码蛋白质序列的聚类算法、
论文部分内容阅读
肺癌是世界上最常见的恶性肿瘤之一,其中非小细胞肺癌(non-small cell lung cancer,NSCLC)占所有肺癌病例的85%。由于NSCLC早期阶段的无症状性和缺乏有效的筛查方式,约75%的患者被发现时已处于中晚期,因此迫切需要新的生物标志物(相关基因)来用于NSCLC的诊断、预后和药物反应。本文以NSCLC的生物学数据作为研究对象,设计NSCLC相关基因编码蛋白质序列的聚类算法、构建NSCLC诊断预测模型以及检测肿瘤转移的早期预警信号和临界期。主要工作如下:(1)蛋白质是基因功能的执行者,对已发现的与NSCLC相关的基因所编码的蛋白质序列进行聚类研究。首先基于氨基酸的两种理化性质将蛋白质序列转换为数值序列。再对数值序列进行离散傅里叶变换(discrete Fourier transform,DFT)并将不同长度的功率谱扩展到相等长度。最后通过计算功率谱序列间的欧氏距离来度量原基因编码蛋白质序列的相似性。由62条NSCLC相关基因编码蛋白质序列的聚类结果发现:聚类是按基因功能进行的分类。该聚类算法能够识别出具有相同功能的不同种类基因,并且根据聚类结果能够预测NSCLC相关基因的未知功能。通过相关基因功能的研究,初步了解NSCLC发生、发展的分子机制。(2)为了得到NSCLC新的生物标志物并建立有效的诊断预测模型,利用GEO(Gene Expression Omnibus)数据库下载的基因芯片GSE19188和GSE40791进行研究。首先对基因表达数据进行差异分析,得到805个同趋势差异表达基因(differentially expressed genes,DEGs)。然后利用DEGs构建蛋白质交互(protein-protein interaction,PPI)网络,该网络中123个关键基因在11条细胞通路中显著富集。根据这11条关键通路的差异得分可以清楚辨别癌症样本和正常样本。最后利用相关性显著的通路中18个串话基因结合支持向量机建立NSCLC诊断预测模型。经测试,模型分类准确性达到97%,表明这18个基因作为NSCLC诊断预测基因有较好的稳健性和敏感性。(3)为进一步了解NSCLC转移的分子机制,提出利用单个时间点样本的动态网络生物标志物(time-point sample dynamic network biomarkers,tDNB)来检测肿瘤转移早期预警信号的新方法。tDNB模块是由不同时间点的癌症样本和正常样本的差异关联信息确定的,具有疾病预测及疾病状态改变预警的能力。将该方法应用于NSCLC转移数据集,根据单个时间点样本准确识别出IIA期为NSCLC转移临界期,该分期的tDNB模块为NSCLC转移的主导模块。功能富集分析显示主导模块中包含的基因与IIB期的癌细胞增殖和肿瘤转移相关,其中173个基因已被研究证实与肺癌相关,表明利用tDNB确定疾病关键状态具有一定的有效性。此外,研究结果中还未经证实与NSCLC相关的基因有一定的后续研究价值。
其他文献
随着资源危机和环境污染的日益严重,再制造工程作为对废旧资源的循环利用工程而受到广泛关注。采用何种再制造模式实施废旧产品的再制造一直是该领域的研究热点,其中,独立再制造商模式是当前再制造生产的主要模式之一。而制约该模式最大的问题是缺少产品的原始模型。针对这个问题,本文以汽车液力变矩器中破损导轮叶片为研究对象,从破损零件表面的点云数据获取、点云数据预处理、破损部位点云修补、曲面重构和光顺性与精度评定四
随着核能的开发与应用,以及核技术在食品、医药、军工、农业等领域的应用,难免会产生放射性废水。污染水体中的放射性核素通过食物链进入人体,危害人类健康和生存。因此,利用高效、经济的放射性废水处理技术来解决这一问题迫在眉睫。用适合的吸附剂吸附放射性废水中的核素是现有的常用的物理化学方法之一。吸附法因具有工艺简单、去污系数高、对核素有选择性等特点已被应用到放射性废水的处理当中。但是由于一些吸附剂或多或少会
地球气候系统的内部变率一直是全球气候变化的热点研究问题,由于器测资料时间尺度的局限性,其仅仅只可以提供过去百年的海洋和大气环流的变化趋势。但对于千年尺度的气候变化
近年来,钒基化合物由于成本低、安全、能量密度高、可快速充放电、无污染等优点在锂离子电池领域受到了人们的广泛关注,但是电导率低,结构不稳定等缺点阻碍了其进一步发展,通
凭借国家鼓励我国企业对外走出去的战略,越来越多的中国公司到世界各地进行总承包项目的建设,其中以基础建设和工业设施建设最多。电站总承包企业是我国最早走出去的一批企业
当今TCP/IP网络架构采用以主机为导向的通信模型,它是为互联网早期的特殊数据传输而设计的。然而,随着互联网的使用和普及,应用需求逐渐转变为内容分发和获取,而网络体系结构
采用倍频投影光栅技术对人体进行三维面型测量,能够解决人体三维面型测量采集过程中不稳定的问题。实现了三维物体表面各取样点形貌高度的独立计算,解决了传统单一空间频率光栅相移技术中位相展开运算依赖路径而产生累计误差的问题;大大提高了测量结果的精确度。为实现活体的三维面型测量提供了一种行之有效的测量方法。主要研究工作如下:1.编写了制作投影光栅条纹的计算机程序。采用数字图像技术制作了不同空间频率的正弦分布
云贵川多山高原地区高速公路建设中斜坡路基占比较高,并伴随高填方,加之该地区地震活动频繁,不仅给斜坡路基的设计与施工带来困扰,同时也导致地震条件下斜坡路基的稳定性控制
随着人类社会经济发展和工业化水平的提高,人类对环境所施加的压力越来越大,而且,全球气候与环境变化成为人们最为关注的问题。洞穴石笋作为一种古气候记录的地质载体,有丰富的代用指标,如氧碳稳定同位素以及多种微量元素(Ca、Mg、Ba、Sr)及其比值,可以提供诸如降水、植被演化、水文地质等多种古环境信息。而且,石笋因其精确定年、广泛分布、气候代用指标丰富、外界干扰微弱等优势在近20年得到了快速发展。然而,
在我国经济文化迅速崛起的背景下,公路的建设过程也进入了前所未有的快速增长阶段。公路隧道作为公路建设运营的特殊路段,在当今倡导建立交通信息化、智能化、节约化的形式下