基于连续小波变换分析的基因表达谱数据分析

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:jydliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量生物技术的产生使得生物科学家能够对生物体内成千上万个基因的表达含量进行并行监控,其所产生的大规模基因表达数据已经成为现代生物遗传学和生物医学研究的重要基石之一。基于基因表达谱数据在基因组水平上对肿瘤进行分析和研究是当前生物信息学研究的重要课题之一。其主要挑战在于基因表达谱数据天生具有高维小样本,高噪声,高冗余,高变异等非典型的数据结构特点,使得传统的模式识别或统计方法难以取得理想的数据分析效果。  通过将基因表达谱看做为一个“时序”信号,本文提出应用连续小波变换技术分析基因表达谱数据,特别的,我们对基因表达模式提取及肿瘤亚型识别问题进行了研究。小波变换能够有效分解时序信号以提取有用的局部细节信息,具有比经典傅里叶变换更强大的信号分解和重构能力,已被广泛应用到许多数据分析领域。小波变换可以由两种方式实现,即离散小波变换和连续小波变换。一些研究人员已经将离散小波变换应用到了基因表达数据分析,获得了不错的应用效果。在这里,鉴于连续小波相比离散小波具有更加灵活的信息提取能力,我们提出应用和发展基于连续小波变换的基因表达数据分析方法。由于在基因表达数据中大量有用信息被隐藏,因此,应用连续小波变换方法以提取基因表达谱的局部隐含细节是合适的、并有希望获得更好的数据分析性能。具体的,我们将从以下四个方面进行基于连续小波变换的基因表达谱数据分析方法的研究:(1)研究不同小波基函数对应用连续小波变换方法提取有用基因表达模式性能的影响;(2)研究尺度和平移系数变化对应用连续小波变换方法提取有用基因表达模式性能的影响;(3)研究如何有效集成著名的SNR基因选择方法与连续小波变换技术以更好的提取有用基因表达模式;(4)研究在应用连续小波变换的过程中不同的基因输入顺序对基因表达模式提取性能的影响。  最后,在广泛收集公开的肿瘤基因表达谱数据的基础上,我们对本文所提的算法进行了大量模拟实验验证,并与现有分析方法进行了比较,证实了基于连续小波变换的基因表达数据分析方法的良好性能,对肿瘤的特征识别和分类具有重要的参考价值。
其他文献
该文考虑具有Z-等变性质的七次Hamilton平面向量场,应用微分方程定性理论,并在数学软件Mathematica以及Matlab的辅助下,对参数空间做了严格的划分,得到以下结果:(一)具有Z-等
在分形几何与迭代函数系理论的基础上,Barnsley提出了具有高压缩比潜力的分形图像压缩概念.但是,目前流行的块搜索算法普遍存在编码时间过长这一主要困难,严重阻碍其走向实用
该文共分三章,第一章讨论了具有n次的Lienard型系统,利用微分方程定性理论及数值计算方法,对非线性常微分方程组进行了详细的讨论.第二章讨论两个细胞环的数学模型,用定性理
该文主要涉及多值映射拓扑度理论及其应用.全文共分两章.第一章研究人员利用Browder建立的单调型映射拓扑度理论,在Hilbert空间中讨论了一类非线性发展方程解的存在性.此外,
该文讨论了半线性发展型分布参数系统(即由偏微分方程所描写系统)的精确能控性问题以及一些与之相关问题,如半线性分布参数系统的能观性问题,线性系统的唯一延拓性问题等。全文
以往关于超饱和设计的研究主要集中在两水平因子的设计方面,该文作者讨论多水平超饱和设计.首先作者系统地总结了目前关于两水平因子超饱和设计的研究状况,然后定义了三个准
随机变量的收敛性问题已有许多人在研究,该文进一步讨论了独立随机变量和在Hilbert空间中的某些强收敛性,以及由它们所构造的两种统计量的极限弱分布情况,对Hilbert空间中独
求总极值问题的方法在科学技术、工程设计、经济管理等方面有着很广泛的应用.该文主要研究讨论某些求总极值的确定性算法.
有限维变分不等式及互补问题是一类重要的数学规划问题.本文主要研究了其数值解法.  对于有限维非线性互补问题(NCP),该问题可转化为等价的非光滑方程组.基于光滑化的思想,