基于高维仿生信息学的生物序列分析方法研究

来源 :中国科学院半导体研究所 | 被引量 : 0次 | 上传用户:ymqlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因组计划的实施,产生了海量生物序列数据,要想理解这些生物数据反映的生物意义是一个巨大的挑战,这需要我们不断加深对生物细胞和器官机能的了解。不过,这其中还有一项重要的工作就是研究如何去组织、分类和分析哪些随着基因工程而产生的海量的生物序列数据。虽然确定生物分子结构和功能最可靠的方式依然是通过直接的生物实验。但是因为获得DNA基因序列以及相应的RNA和蛋白质序列却比通过生物试验确定它们的结构和功能容易的多。所以研究如何能从这些生物序列获取生物信息的计算方法就变得十分有意义。生物由特定的祖先进化而来,表现在生物序列上就是会有一些相似性,用这些相似性来从生物序列中获取生物信息是生物序列计算分析的出发点,而且大多数生物序列计算分析的核心思想是用那些生物试验已经确定的信息来研究分析更多未做生物实验研究的生物序列中的未知信息。   论文首先就生物序列比较方法的研究现状进行了综合论述,对各种方法的理论依据和实现方式作了较详细的介绍,并指出了当前生物序列比较方法领域的难点所在,为我们进一步的研究工作明确了方向。   论文接着研究了把生物序列映射为高维空间中点的可行性,由此提出了一种新的生物序列分析方法——基于高维仿生信息学的序列比较方法。这一方法是从把信息数字化的角度出发,先通过寻找合适的映射把生物序列对应为特征空间中的点,进而把生物序列分析比较问题转化为高维空间点分布问题,最后再用高维仿生信息学方法来研究相应的点分布问题。   然后使用这一方法,通过生物全基因组序列数据研究了病毒种系进化问题,设计了以此为基础的方法模型,并用该模型研究了SARS冠状病毒和其它冠状病毒之间的种系进化关系,构建了种系进化树,最终的实验结果准确的重现了冠状病毒的种系进化关系,与直接通过生物实验得到的结果完全一致。而且实验的结果表明SARS病毒和其它冠状病毒进化关系较远,自己独自构成一组,这和很多研究工作者通过各种方法得到的结果一致。   最后,针对全基因组序列,提出了一种兼顾序列整体连贯信息的特征提取方法。在该方法中借用了相机拍照的思路,通过“调焦”将不同长度的序列放入同一尺寸的“序列照片”中,然后通过研究核苷酸含量的变化来提取特征。之后我们以这种方法为基础研究了病毒自动分类问题。使用从GenBank中获取的多类病毒全基因组序列数据作为材料进行实验,并采用词频统计的特征提取办法作对比实验。在构建识别系统的时候,我们采用了基于仿生模式识别的方法。实验的结果表明对于全基因组序列,本文提出的特征提取方法分类结果非常出色。实验结果还表明,基于“认识”和“同源连续性”的仿生模式识别方法在处理这种类别非常多,样本个数很少的识别问题时相当有效。
其他文献
本文通过对荣华二采区10
期刊
信道编码技术在无线通信系统中被广泛采用,是数字基带中的核心技术之一。随着信道编码技术的研究与发展,信道编码从经典的代数编码进入了现代的概率编码阶段。Turbo码和Polar码
新定义型试题,通常给出一段某个新数学概念的定义,要求学生根据阅读新定义获得的信息回答所给的问题。主要考查学生在规定时间内,以最快的速度理解并运用新知识或新方法解答数学
在高功率微波功率测量中,开口波导天线由于其增益低、主瓣宽、结构简单而常被用作接收天线。对于L波段的高功率微波测量,开口波导体积庞大,不便于外场测量。在这种情况下,L波
本文对三维复杂目标在频域、时域下电磁散射特性的若干算法进行了研究。主要内容如下: 1.采用矢量有限元一快速多极子混合算法计算涂敷各向异性介质目标电磁散射问题,讨论了
MEMS开关在无线通信和无线传感领域的有良好的应用前景,是目前MEMS研究中的一个热点。与其他开关结构相比,横向热驱动MEMS开关具有开关结构简单、驱动电压低、加工成本低、成品
随着经济发展和环境变化,许多外来植物正在不断地扩散,对生态系统造成严重的威胁。南美蟛蜞菊(Wedelia trilobata(L.)Hitchc.)是100种有害的外来入侵种之一,却作为园林植物被广
静电梳齿驱动器常用于实现平面内的横向驱动,但是实现非平面内的纵向驱动比较困难。国外很多学者采用正反对准、多次选择性刻蚀获得纵向有一定错位的可动梳齿和固定梳齿,从而实现纵向驱动,但是它很难实现可动梳齿和固定梳齿之间的精确对准,另外还需要进行多次干法刻蚀、淀积等工艺,步骤繁多而复杂,所以这种工艺成本高而且不实用。本论文的主要工作是设计和制作一种基于塑性变形工艺的自对准垂直梳齿驱动器。设计的驱动器采用塑
《中国信息技术教育》:罗老师,您好.很高兴能有机会与您谈一谈有关孩子们的教育.作为一名母亲,相信您对儿童的教育感触颇深,那么您为什么最终选择了从事科技教育呢?rn罗敏:入
期刊
Let R be a prime ring with center Z and S (C) R. Two mappings D and G of R into itself are called cocentralizing on S if D(x)x - xG(x) ∈ Z for all x ∈ S. The