基因组尺度高信息量RNA干扰筛选数据分析:一类系统生物学应用中若干模式识别问题的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:majunchigg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
控制论、系统论思想与模式识别相关方法广泛参与诸多交叉学科的研究。控制论、系统论可以指导对各种实际问题的认知,模式识别相关方法则构成了具体的解决方案。本文将控制论、系统论与模式识别相关方法应用于一类系统生物学研究。具体的,以基因在细胞形态变化中的调控作用为主要研究对象,以在果蝇培养细胞种系中进行的大尺度高信息量RNA干扰筛选(RNAi HCS)为应用背景,我们分析并解决了RNAi HCS数据分析中的一系列问题,包括细胞形态表现型在线发现、表现型在线建模与确认、针对不同表现型的特征选择与细胞分类、综合单个细胞分类结果的基因功能建模等。我们将本文设计的一系列方法组合为一套完整的数据分析流程,并协助生物学者对近200万单个细胞图像进行综合分析,提出了“细胞形态表现型具有定型化性质”的生物学假设。本文提出利用高斯混合模型对表现型建模,改进了利用间隔统计估计聚类个数的方法、设计了迭代表现型兼并流程以比较新数据集与已知表现型的异同、利用最小分类误差方法实现表现型模型在线更新,最终形成了在线表现型发现算法。这种方法随着新数据的不断产生辨认新颖表现型,并对其进行建模与确认。当前的RNAi HCS数据分析流程大多使用手工挑选的典型表现型及代表细胞作为训练集,但数据集规模的不断扩大使手工分析难以反映整个数据集的完整风貌,我们的方法有效的解决了这一问题。为了考察整个数据集中各个细胞与典型表现型的相似程度,我们设计了“支持向量机迭代特征消去-遗传算法”联合特征选择方法,利用精简的特征集合描述表现型形态并使用以高斯径向基函数为核函数的支持向量机进行细胞分类。根据支持向量机对每个细胞形态的分析,我们执行一系列质量控制、统计分析及数据筛选与整合操作,为针对每个基因的RNAi实验挑选出一个带有稳定形态特征的细胞群落;根据可重复性细胞群落的形态特征生成每个基因的量化形态分值,并利用聚类分析辨别在细胞形态变化中发挥不同作用的基因与基因家族。本文以控制论、系统论为指导,整个数据分析流程中综合运用多种模式识别、统计分析技术,形成了完整、高效的RNAi HCS数据分析流程。在数据分析方案设计中注重动态与静态分析的对立统一,实现了典型表现型在线发现与在线建模;注重利用统计学方法发掘微观与宏观层面的联系,系统化处理单个细胞形态作为分析基因功能的基础;注重对单一层面分析结果的升华,努力通过特定应用的分析结果掌握普遍规律,提出并初步验证了细胞形态表现型具有定型化特点这一假设。
其他文献
正义观念具有多重性,而司法实践中的普遍正义和个案正义一直都是正义观念中极具代表性的两面,却又有着复杂的联系.一方面,虽然普遍正义以个案正义为目的,并靠个案正义予以实
本文在研究校史文化拥有的思想政治教育功能的基础上,结合国内高校的实际情况,探讨如何进一步发挥高校校史文化的思想政治教育功能,以提升思想政治教育的特色和水平。
随着全民阅读时代的到来,“书香”二字常见诸报端,教育系统围绕“书香”开展的活动更是蓬蓬勃勃。现在,有了现代化教育装备为我们的课外阅读教学提供强有力的保障,课外阅读更
随着计算机的发展和各种算法研究的推进,安防监控和家庭看护监控开始更多地应用计算机视觉技术,行人检测成为监控应用中实现姿态识别、行为分析等功能的首要步骤。当前流行的
期刊
目的观察高尿酸血症对阴茎勃起功能的影响。方法将健康成年雄性SD大鼠40只随机均分为正常对照组和实验组2组。对照组给予普通饮食,实验组给予高尿酸饮食。4周后分别检测各组
期刊
国际惯例是指在国际交往长期反复的实践中逐渐缓慢形成的,在某一特定社会经济领域中发挥作用的习惯性做法。在经济全球化的大背景下,国际惯例对于国际经济交往起着越来越重要的