基于转录组荧光测序数据整合策略的癌症分类研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:sb198908240015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
激光诱导荧光测序技术是应用最广泛的生物数据检测技术。从第一代激光诱导荧光测序技术发明至今经历了25年的时间,现在可以实现百万级像素传感器并行跟踪激光诱导的荧光进行测序。这项技术带动了多组学范围内的复杂疾病研究。转录组荧光测序技术的一项重要应用就是癌症样本分类标志物识别,分类标志物可以辅助临床诊断和个性化治疗。单分子分类标志物的再现性备受质疑,也很难阐述其功能层面和系统层面的生物学意义。生物学通路数据的不断丰富,为寻找整合型分类标志物提供了基础,基于通路基因功能富集和基于拓扑网络的分类方法应运而生。前者通过对特定基因集合的统计分析识别分类特征,方法具有明确的统计学意义,但是生物学解释性较差,因为它只考察基因集合中基因的数量关系,并不关注基因的具体测量值。后者将分类特征识别的研究置于更广泛的生物网络中,综合运用机器学习和统计分析的方法识别分类标志物,方法识别的分类标志物普遍具有更好的生物学解释性,但是这类研究多数以无向网络为基础,且不考虑局部通路失调的重要性,也很少考虑多种分子数据的整合。分类方法整体的研究重点聚焦在开发复杂的分类算法,而忽视了鲁棒的分类特征构建。针对上述问题,本文提出了以mi RNA介导的子通路为特征,构建机器学习为基础的分类标志物识别方法流程(mi DRW)和生存标志物识别方法流程(mi DRWSurv),并对该流程识别的分子标志物进行了深入的研究,全文主要从四个方面进行阐述:1.基于KEGG通路数据库中的调控信息,通过化合物和酶等物质的融合技术,构建全局有向通路网络(GDPN),并在网络中添加虚拟基因节点解决网络悬挂问题。提出了加权有向随机游走算法,为算法设置了具有生物学意义的参数。实验结果表明加权有向随机游走算法有效的增加了网络中hub基因的拓扑权重。2.提出mi RNA介导的子通路并构建了表征mi RNA介导的子通路活性的数学模型。一方面,模型设置了符合生物学调控机制的约束条件。另一方面,模型整合了mi RNA和m RNA的差异表达程度、m RNA的表达水平、mi RNA和m RNA的靶向关系,以及全局有向通路网络的拓扑信息来计算mi RNA介导的子通路活性。实验结果表明mi RNA介导的子通路活性具有区分样本模式的能力。3.提出了集成多种机器学习方法的分类方法流程,该流程采用统计学分析确定候选特征,再通过贪婪算法识别癌症特异性的失调子通路。实验结果表明该流程不依赖于具体的机器学习模型,经典的机器学习方法也可以识别鲁棒的分类特征。4.提出了生存加权自适应Lasso-Cox模型,并利用该模型识别了生存标志物,该方法使用Cox回归模型学习mi RNA介导的子通路活性值与样本生存时间之间的关系,并通过设置生存相关的自适应参数使方法快速识别预后生存相关的分类标志物。实验结果表明方法可以有效识别乳腺癌相关的生存标志物,标志物可以显著的将分开高风险和低风险样本。大规模实验证明,mi RNA介导的子通路作具有较强的鲁棒性和良好的生物学解释性。基于mi RNA介导的子通路构建的分类方法具有较好的范化能力和稳定的分类能力。
其他文献
下沉式竖井掘进机作为井筒机械化、智能化施工的高端装备,其集光、机、电、液、传感、信息技术于一体,涉及地质、土木、机械、力学、液压、电气、控制、测量等多门学科技术,而且要按照不同工程的地质进行设计与制造,其研发与制造直接反映了一个国家先进制造业的水平。其形成的掘、排、支相结合的全新沉井工艺,与传统工法相比,更加安全高效。
漆酶能够高效降解木质素、酚类、胺类等难降解化合物,在造纸、纺织、环保等诸多领域具有良好应用前景。以采集自广西十万大山国家森林公园的高产漆酶革耳属真菌为材料,开展分类鉴定、菌丝最适培养条件、液体发酵产漆酶条件以及染料脱色活性研究。结合形态鉴定与ITS鉴定,确定目标菌株F1625为野生革耳(Panus rudis);结合生长速度和长势,菌丝生长最适碳源为葡萄糖,氮源为酵母浸粉,碳氮比为10/1 – 2
本文利用2004-2006年取消农业税的自然实验,使用1994—2009年的县级面板数据首次从实证上检验了财政压力导致地方政府融资平台成立这一假说。利用双重差分模型研究发现,取消农业税改革导致的财政冲击越大,县级地方政府在改革后设立融资平台的概率越高。这一发现在不同模型设定下保持稳健,并通过了基于改革前样本和利用其他税种收入变动构造的安慰剂检验。我们还排除了上述发现由扩权强县和财政省直管县等其他财
当前,新冠疫情得到有效的防控,学校教育也相应地从"云课堂"回到了真实的校园。疫情期间,一线教师作为在线教育的实施者,其在线教学能力在培训和实践中不断成长。甘泉外国语中学的教师们积极思考并实践:重构传统课堂教学模式,实现"线上""线下"教学深度融合。现结合学校创新实验室的微项目"银耳中SO2残留量的测定",谈谈混合式学习的项目设计和认识。
期刊
既有建筑物加装电梯的改造项目一般规模面积不大,但在设计中既需要考虑既有建筑的现状条件又需要进行加装部分的结构设计,还要合理确定二者的关系。涉及地基基础、抗震设计、钢结构或其他结构类型的设计以及结构加固等多方面的内容,需同时参考和满足多个规范中的相关规定,要对结构设计规范进行综合的运用。既有建筑的情况各不相同,但加装电梯的结构设计有一定的共同之处。本文结合实际案例的审查,分析了既有建筑加装电梯项目的
随着互联网技术的兴起和广泛应用,网络化系统已逐渐渗透到生活中的各个领域。到目前为止,基于网络化系统的控制与测量已经被广泛应用到组合导航系统、电液伺服系统、遥感测量以及风力发电系统等诸多领域中去。与此同时,网络环境的引入使得信息的测量和传输等也带来了诸多的不确定性,如:传感器测量丢失、信息调度、设备故障、输入非线性、网络攻击等带来的不完全信息情形。利用滑模控制对扰动的不敏感特性,解决上述不完全信息情
放射治疗作为三大治疗手段之一,在癌症治疗中起着至关重要的作用。近年来,放疗技术进展都与肿瘤精确定位密切相关。如何实现既保证肿瘤靶区的充分照射又尽可能减少肿瘤周围正常组织与器官的照射,这在临床放疗中极其重要。然而,在放疗过程中人体呼吸运动会导致肿瘤产生移动和变形,特别是胸腹部肿瘤受影响更大。因此,通过追踪胸腹部肿瘤呼吸运动,实施临床放疗中呼吸运动补充和管理,对提高放射治疗效果意义重大。医学成像存在肿
近年来,航空航天领域对于结构轻量化、集成化和多功能一体化的关注迅速提升。C/SiC点阵夹层结构复合材料作为一种兼顾材料、结构、功能等因素的功能性构型材料,不仅可以提供优异的力学性能,还具有实现热控管理、能量吸收、抗冲击、减振降噪等多功能一体化的潜在优势,使其成为航空航天领域首选的新型结构材料之一。目前关于C/SiC点阵夹层结构复合材料设计、制备以及相关力学性能的研究已取得了许多成果。然而对于C/S