肿瘤相关的细胞外基质基因知识图谱的构建与应用

来源 :石河子大学 | 被引量 : 0次 | 上传用户:xf6088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤细胞在发生发展过程中建立的适宜其生长的内环境被称为肿瘤微环境(Tumor microenvironment,TME)。细胞外基质(Extracellular matrix,ECM)是TME的主要成分,参与了肿瘤的血管生成、信号传导、增殖与侵袭等过程,ECM中表达的多种基因已经成为判断肿瘤预后的重要指标,为肿瘤疫苗和抗肿瘤药物的研发提供了丰富的靶点。人们目前获得了大量与ECM基因有关的生物医学知识,然而这些知识却广泛散布在数据规模庞大的文献中,给利用这些知识带来了困难。为此,本文开展了系列生物信息学研究,对肿瘤相关细胞外基质(Cancer-related extracellular matrix,C-ECM)基因知识进行了系统的收集、整理与预测。1.C-ECM基因知识图谱的构建知识图谱是收集、整理与呈现生物医学知识的重要手段。为构建C-ECM基因知识库,本文首先构建了ECM基因以及相关肿瘤疾病的本体。第二步使用生物实体识别工具从48712篇Pub Med摘要中识别出了325个与癌症条目同时出现的候选C-ECM基因。然后经过三轮严格的人工判读,得到了225个有明确文献依据、生物学过程、注释信息等的C-ECM基因。进一步生物信息分析表明,这些基因倾向于参与细胞增殖分化、信号转导、血管生成、免疫等功能。为便于用户使用此知识图谱,本文研发了专门的网站CECMAtlas,用户通过提交基因、疾病或生物学过程信息即可在线获得相关的C-ECM基因信息,详细功能注释及文献支持。作为首个全面收录C-ECM基因的数据库,CECMAtlas将有助于深入揭示C-ECM基因和肿瘤发生的关系,为新的肿瘤标志物和药物靶标的寻找提供线索。2.基于知识图谱发现新的C-ECM基因目前人们对C-ECM基因的认识仍然有限,本文构建的知识图谱为发现新的C-ECM基因奠定了基础。基于CECMAtlas,本文建立了基于Me SH的深度学习预测模型。首先本文整合了397,896篇文献摘要以及388,632对基因-文献对应关系,进而将文献中的非结构文本进行词向量转换,利用自编码器挖掘知识图谱中存在的隐关系。本文建立的预测模型在金标准数据集上取得了一定的预测效果(ROC曲线下面积0.67~0.88)。在独立测试集中,预测结果排名靠前的10个基因中有9个基因可以被文献所证实,说明此模型具有一定的发现新的C-ECM基因的能力。本文构建的CECMAtlas知识图谱以及C-ECM基因预测工作,将有望为领域内相关生物医学研究提供重要数据资源和研究线索。
其他文献
目的:运用三维有限元生物力学分析方法探索常用于修复下颌kennedyⅠ类缺失的种植覆盖义齿的Locator附着体、Magfit磁性附着体与不同骨质类型之间的应力关系,以期为不同骨质类型匹配更适附着体。方法:建立双侧第一磨牙位点种植体支持的种植覆盖义齿修复下颌双侧第一前磨牙至第二磨牙缺失的三维实体模型。根据骨质类型(Ⅰ、Ⅱ、Ⅲ、Ⅳ)及附着体类型(Locator、Magfit)构建为8类模型:L-Ⅰ、
目的:采用低能量激光疗法(LLLT)联合Dycal用以大鼠磨牙直接盖髓术,不同时空观察牙髓的炎性改变和修复性牙本质的情况,及测量牙髓内白介素-1β(IL-1β)、瞬时电位受体通道1(TRPA1)、P物质(SP)、碱性磷酸酶(ALP)的表达。探讨LLLT联合Dycal用以牙髓活力保存及牙髓创伤愈合机制,为临床提供一定的实验基础。方法:64只成年雄性大鼠随机分组,健康对照组(NC)、低能量激光组(LL
目的:探究三种系统性炎症反应指标中性粒细胞/淋巴细胞比率(NLR)、C反应蛋白/血浆白蛋白比率(CAR)和淋巴细胞/单核细胞比率(LMR)对乳腺癌骨转移患者的预后是否具有预测指导作用和研究价值。方法:收集2009年1月至2020年6月期间于石河子大学医学院第一附属医院进行乳腺癌术后复查而发现骨转移的212例患者。运用受试者工作特征(ROC)曲线确定NLR、CAR、LMR的最佳截断值,并将研究对象划
目的:通过研究性别决定区域Y盒蛋白5(Sex determining region Y-box protein 5,SOX5)在口腔鳞状细胞癌(Oral Squamous Cell Carcinoma,OSCC)组织中的表达及体外研究其在OSCC细胞株CAL27侵袭和转移中的作用,以期探索OSCC的新靶点,为OSCC的诊断和治疗提供理论依据。方法:免疫组织化学Envision两步法用于检测OSCC
目的:回顾分析结肠镜下腺瘤、进展期腺瘤、结直肠癌(colorectal cancer,CRC)的临床病理特征及其检出率的变化趋势。方法:回顾自2010年1月1日至2019年12月31日于石河子大学第一附属医院兵团消化内镜中心完成结肠镜检查者病历资料。描述结直肠腺瘤、CRC的临床病理特征及检出率。按行结肠镜检查时间,将其分为前五年(2010-2014)及后五年(2015-2019)两组。比较两组结直
目的:1.比较磁共振图像形态学特征、强化方式、时间-信号强度曲线(Time-signal intensity Curve,TIC)、表观扩散系数(Apparent diffusion coefficients,ADC)及体素内不相干运动(Intravoxel incoherent motion,IVIM)模型各参数在乳腺良恶性肿块中的差别,探讨ADC及IVIM模型参数鉴别乳腺良恶性肿块的诊断价值。
目的:通过对宫颈癌(Cervical cancer,CC)患者进行3.0T磁共振DKI和DWI序列扫描,以DWI定量参数为对照,探讨DKI定量参数在宫颈癌病理组织学类型、病理分级以及临床FIGO分期诊断中的应用价值。材料与方法:于2019年10月到2020年11月,回顾性分析在我院核磁室经病理结果证实的CC患者总共42例,按病理组织学类型将患者分2组:宫颈腺癌(Adenocarcinoma,ACA
目的:观察乳腺癌术后再发甲状腺癌患者的临床特征,对可能影响乳腺癌患者术后再发甲状腺癌的相关因素进行分析,以期发现影响乳腺癌患者术后再发甲状腺癌的危险因素。方法:在石河子大学第一附属医院对电子病历查询系统及纸质版存档病历进行检索,收集2014年1月~2020年6月就诊于该院的乳腺癌患者的病例资料。符合纳入排除标准的病例共计716例,其中乳腺癌术后再发甲状腺癌的病例有18例,将这18例患者设为病例组(
目的:通过GEO(Gene expression omnibus)数据库筛选胰腺癌(Pancreatic adenocarcinoma,PAAD)差异表达基因(Differentially expressed genes,DEGs),利用TCGA(The cancer genome atlas program)数据库对DEGs行预后分析并构建预后风险模型,用ICGC(International c
目的研究中青年女性分化型甲状腺癌(Differentiated thyroid carcinoma,DTC)患者行促甲状腺激素(Thyroid stimulating hormone,TSH)抑制治疗所致亚临床甲状腺功能亢进症(Subclinical hyperthyroidism,SHyper)对认知的影响,并探讨中青年女性DTC患者术后认知功能障碍的影响因素。方法分析中青年女性DTC患者的临床