基因组数据分析的信号处理方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:haley912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对呈指数增长的海量基因组数据,生命科学必须引入和融合以数理和信息科学为代表的学科,开展算法和海量数据处理技术的研究,才能探寻隐藏在海量生物数据里的生物信息,挖掘基因功能,解释生命过程与现象。 本文运用信号处理理论和技术,从预测与定位DNA序列中的蛋白编码区、提取和识别微阵列数据中的特征表达模式和周期表达基因类等方面开展了研究,取得的成果与结论如下: (1)借助于蛋白编码区具有的周期-3性质,采用傅里叶频谱分析,本文比较了现有8种数值映射方法的优劣。在此基础上,本文提出了一种DNA序列数值映射的概率法。研究表明,与现有其它方法比较,新方法能够更真实地反映原始DNA序列中的碱基分布规律,保留更多生物信息。 (2)本文提出了一种预测与定位DNA序列中蛋白编码区的改进滑动窗功率谱估计方法。与经典的功率谱估计方法比较,本文方法定位蛋白编码区的平均误差是12个碱基对,远低于经典方法的54个碱基对,极大地提高了蛋白编码区的定位准确率,且本文改进方法的计算时间仅仅是经典方法的10%,降低了计算复杂度。 (3)把AR模型(Auto-regressivemodel)现代谱估计技术引入到蛋白编码区的预测与定位问题中,本文发展了一种适合于预测小尺度DNA序列中蛋白编码区的有用工具。研究表明,在经典的周期图法对小尺度DNA序列中的周期-3性质迅速失去预测能力的情况下,AR模型法展现出比周期图法更强的预测能力,获得了更高的预测正确率,具有抗DNA序列长度和结构变化的刚性。本文对于AR模型法在定位蛋白编码区的问题上也开展了有益的探索。 (4)本文提出了一种分块主成分分析(PrincipalComponentAnalysis,PCA)方法,并以此为基础形成了一种提取周期表达基因的新方法。新方法能够克服PCA方法存在容易丢失重要信息的弱点,特别是能够全面地提取出隐含在方差较小的主成分中的细胞周期表达基因。利用已有的生物证据,本文结果能够得到较好的生物意义解释。 (5)针对微阵列数据特点,本文提出了一种改进的NMF(ImprovedNon-negativeMatrixFactorization,INMF)算法,并运用INMF算法提取微阵列数据中隐藏的特征基因表达模式。研究结果表明,INMF算法适用于任何尺寸和分布的微阵列数据,比奇异值分解(SingularValueDecomposition,SVD)等同类方法提取的特征表达模式类型更全面,抗噪声能力强。与现有研究结论比较,基于INMF算法从酵母微阵列数据中聚类的周期表达基因能够取得令人满意的结果。
其他文献
(一)中国共产党领导人民夺取政权历时28年,各级领导主要是面临生死考验。按阶段分:第一次国内革命战争时期,是革命道路和壮大力量的考验;第二次国内革命战争时期,是武装反抗
近年来,图像融合已成为图像理解和计算机视觉领域中一项具有重要应用价值的新技术,尤其是在医学工程领域中,由于医学仪器的成像机理及应用环境的不同,不同的医学影像为医生提
介绍了综放工作面拆除后沿空留设切眼的方法和取得的经济效益。 The method and the economic benefit of leaving the cut eyes after the removal of fully mechanized to
前几年,中央电视台播放的8集 电视连续剧《黄克诚》,对他生平的主 要历程作了介绍,实际上黄克诚将军 还有许多鲜为人知的重要业绩未能搬 上银幕。如60年前黄将军在苏北盐阜
生物组织的光透明技术是近年生物医学光子学领域的研究热点之一,但针对光透明剂对血管、血流影响的定量研究却很少。激光散斑衬比成像技术能够高时空分辨地获取动态的血流信
胡锦涛同志在中纪委第七次全会上强调,要大力倡导八个方面的良好风气,其中第一条就是“勤奋好学,学以致用”,为此,笔者从学习和做人两个方面谈点体会。 At the Seventh Plen
随着新材料技术、传感器技术、特别是MEMS等技术的迅速发展,为微创、无创的消化道诊疗技术提供了一个可行的有效途径。胶囊内窥镜、消化道定点药物释放系统、消化道采样胶囊
向生物组织中引入高渗、高折射率的化学试剂能降低光在生物组织中的散射、提高光在组织中的穿透深度,为光子医学诊断与治疗带来新契机。但皮肤角质层象一层天然的屏障,严重阻
脑动脉中的栓子有可能阻塞脑血管而引起短暂性脑缺血或脑卒中等脑血管疾病,具有很大的危害性。采用经颅超声多普勒仪可以无损检测栓子,在临床上得到广泛的应用。然而由于各种
目前,利用RNA干涉文库进行大规模、高通量的功能基因扫描已成为发现新功能基因的重要方式和手段。因此我们希望通过构建限制性siRNA干涉文库扫描在细胞增殖和分化过程中具有