【摘 要】
:
随着高通量测序技术的快速发展以及大型基因组计划的不断开展,以DNA甲基化芯片数据为代表的表观基因组数据的规模日益增长。如何对DNA甲基化芯片数据进行有效分析及应用成为生物信息学领域的热点问题,对揭示表观遗传与复杂疾病间的关系具有重要意义。然而,DNA甲基化芯片存在探针设计引起的数据偏差,这将影响甲基化芯片数据分析的准确性,制约甲基化芯片数据的应用。同时现有甲基化芯片数据预处理方法存在自适应性差的问
论文部分内容阅读
随着高通量测序技术的快速发展以及大型基因组计划的不断开展,以DNA甲基化芯片数据为代表的表观基因组数据的规模日益增长。如何对DNA甲基化芯片数据进行有效分析及应用成为生物信息学领域的热点问题,对揭示表观遗传与复杂疾病间的关系具有重要意义。然而,DNA甲基化芯片存在探针设计引起的数据偏差,这将影响甲基化芯片数据分析的准确性,制约甲基化芯片数据的应用。同时现有甲基化芯片数据预处理方法存在自适应性差的问题,因此亟待开发与建立新的数据偏差校正方法,为甲基化芯片数据的准确分析奠定良好基础。本文针对DNA甲基化芯片数据偏差校正问题及基于该数据的癌症亚型识别和肿瘤纯度估计两个问题上的分析方法开展研究,主要内容分为以下几方面:第一,针对现有DNA甲基化芯片数据偏差校正算法缺少全面比较分析的问题,提出一个DNA甲基化芯片数据偏差校正测评方法。通过整合多个不同DNA甲基化数据分析流程,构建一个偏差校正测评标准,设计消除技术性误差、消除探针设计数据偏差、识别差异甲基化位点和区域等测评指标,对现有数据偏差校正方法进行比较分析,指导研究人员根据数据分析需求的不同选择合适的方法及模块。第二,针对现有DNA甲基化芯片数据偏差校正方法自适应性差的问题,提出一个基于高斯混合模型的DNA甲基化芯片数据偏差校正方法。通过对具有良好统计性能的甲基化M值进行建模消除数据偏差,该方法不需要事先的生物学假设可在分布拟合过程中自动识别不同甲基化状态断点从而避免了人工设置带来的误差。该方法在技术性误差消除、探针设计偏差校正、识别有生物意义的差异甲基化位点等指标上优于现有方法,能够有效提高DNA甲基化芯片数据的质量。同时,该方法还具有通用性,适用于采用了两种探针设计的不同版本DNA甲基化芯片的偏差校正。第三,针对癌症亚型识别问题,提出一个基于变分自编码器的DNA甲基化芯片数据分型方法。该方法通过变分自编码器深度学习框架将DNA甲基化芯片数据高维特征向低维空间进行映射,抽取其隐空间特征进行聚类,提升亚型识别结果的准确性。该方法拓宽了传统癌症亚型识别问题的研究思路,为识别新的癌症亚型特异性的DNA甲基化模式提供了新的方法支撑。第四,针对肿瘤样本纯度估计问题,提出一个基于DNA甲基化芯片数据的肿瘤纯度估计方法。该方法首先通过基于limma差异甲基化分析和基于MannWhitney U统计量多方法进行差异甲基化位点的提取和融合,分析提取特征的生物学意义,然后利用核密度估计对肿瘤样本的纯度进行估计,提升肿瘤样本纯度估计结果的准确性。
其他文献
以燃料为冷源对来流空气进行冷却的预冷组合发动机为高超声速飞行提供了新的推进思路。在可以投入实际应用之前,这类发动机依然面临一些急需解决的问题。首先,预冷发动机众多的循环方案虽然为高速推进提供了更多的选项,然而,当前对预冷家族缺乏系统性地研究,而对不同循环方案碎片化的分析使得对整个发动机家族难免产生不一致,甚至矛盾的认识。其次,作为预冷空气的热沉来源,燃料所能提供的冷源极其有限,因此为实现冷源的高效
地球陆地拥有超过50%的崎岖地形,而四足机器人能以最好的静稳定性及较低的复杂度快速通过。高危或者非结构化环境中的运输传送、侦查救援、星球探测等任务对足式机器人的高速高灵活性具有现实而迫切的需求。而足式机器人拥有典型的高冗余度多支链、拓扑结构实时动态变换的传动机构;且高速运动中极短的足-地接触时间、极大的着地冲击及强非线性运动耦合为足式机器人动步态运动带来更高挑战。反观自然界中的猎豹拥有柔韧的脊柱、
准确测量颗粒的粒径分布、光学常数和形貌参数在气溶胶测量、燃烧诊断和纳米颗粒制备等领域具有重要意义。弹性光散射是一种常用的粒径测量方法,是精确表征粒径分布的工具。以往基于光散射方法的研究往往是针对球形粒子的特征参数进行研究,而对非球形粒子的研究较少。一般来说,现实生活中除了球形粒子外,椭球形、圆柱形和团聚粒子也广泛存在。因此,准确测量非球形粒子的粒径分布、光学常数和形貌参数非常重要。当被测粒子形状变
以湖南的56种国家第一批重点保护植物为对象,研究制定了湖南珍稀濒危保护植物的定量化分级指标。通过对评价指标的定量化和权重分配处理,求得植物种的“濒危系数”和“优先护存值”,从而确定植物种的濒危程度和优先护存的序列。研究结果表明,该定量分级比当前国内外普遍采用的定性分级更能真实和全面地反映植物的濒危状态和优先护存的程度。
相对于常规炮弹,旋转制导炮弹具有打击精确化、作战远程化、使用灵活化等优势,是未来军队的核心主战装备。惯性导航系统作为旋转制导炮弹的核心设备,在空中动基座对准时面临着对准时间较短、传感器生存概率较低、动力学环境较为复杂等诸多难题。因此,旋转制导炮弹用惯性导航系统空中对准方法成为影响旋转制导炮弹性能的关键技术。为进一步提高旋转制导炮弹用惯性导航系统空中动基座对准性能与可靠性,提高旋转制导炮弹用惯性导航
燃料电池和电解水装置是理想的能量存储和转换设备,这些设备的开发和利用是缓解能源危机及加快可持续发展的有效途径之一。氧电极反应包括氧还原反应(ORR)和氧析出反应(OER),受其自身动力学缓慢、过电位高且工作环境苛刻(强氧化性)等特性的限制,常需使用大量高效、稳定的电催化剂加速电化学反应。优异的ORR、OER电催化剂是实现燃料电池、金属-空气电池和水电解器等可再生能源装置的全面推广的基石。传统的OR
作为新资源绿色材料,玄武岩纤维及其增强聚合物(BFRP)具有高比强度、高比刚度和环境友好等特性而被应用于土木建筑、军工、船舶等领域。但玄武岩纤维增强聚合物水热老化性差已成为行业发展亟待解决的问题。本文根据国内外纤维用成膜剂技术研究进展和玄武岩纤维自身表面特性,以解决水热老化性差与绿色制造的需求,分别使用阳离子表面活性剂(十六烷基三甲基氯化铵,CTAC)、非离子表面活性剂(嵌段共聚物,F108)和硅
碳纤维增强树脂基复合材料因其结构可设计性及优异的力学性能被应用于航空、航天、船舶及汽车等领域。复合材料高性能化及轻量化成为高性能先进材料的重要发展方向。然而碳纤维表面化学惰性导致复合材料增强体与基体间界面结合弱及复合材料层间剪切强度低等界面问题,已严重制约了复合材料发展。为提升复合材料界面剪切强度及层间剪切强度,本文以跨尺度增强体结构设计为途径,分别采用连续上浆、同轴圆柱电场和平行电场电泳等方法制
我国国土幅员辽阔,气象条件十分复杂,冰冻地区占我国国土面积的75%,冬季及初春时节道路冰雪灾害持续时间长、影响范围广、危害程度深,严重危害了人民生命和财产安全。冰作为地球上摩擦力最小的物质之一,其物理及力学性能复杂多变,极易受周围环境影响,因此,在摩擦系统中引入冰或雪介质显著改变了摩擦副相互作用机制,这大大的增加了冰雪路面抗滑性能研究的复杂程度。传统路面抗滑性能评价手段及研究方法难以获取胎-冰-路
横向磁通电机的主磁路所在平面垂直于电机运动方向,实现了电负荷和磁负荷之间的解耦,可以通过减小极距,增加极数的方式来进一步提高电机的力密度。横向磁通直线电机集成了横向磁通电机高力密度和直线电机直接驱动负载做直线运动的特点,适合于应用在低速直线直驱领域。本文针对传统横向磁通直线电机内部空间利用率不足的缺点,提出一种具有双边永磁励磁结构的横向磁通直线电机,即双交替极横向磁通直线电机(Dual-Conse