生物信息学中的若干组合问题

来源 :山东大学 | 被引量 : 0次 | 上传用户:candyshelly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在生命科学中,许多问题都可以抽象为计算机科学与数学中关于序列、树和串的组合问题。本文主要研究两个重要的生物信息学问题:寻找motif问题和RNA折叠问题。这两种问题简言之都是在许多生物学序列中寻找共同部分。  近年来,生命科学的飞速发展带给我们越来越多的研究数据,如何在这些浩如烟海的数据中挖掘有用的信息已经成为当前科学家们需要面对的首要问题,并由此产生了研究生命的新学科:生物信息学,它以生物学实验室研究的数据为材料,利用网络和计算机技术,来实现对生命本质的研究、探索。  本文考虑的第一个问题是寻找motif问题。在生物学中,基因的活性往往取决于一些称为motif的小片段的性质,寻找motif问题就是要在DNA序列中找出这些小的片段,然而,motif往往并不以本来面貌出现,合理的模型是允许未知的片段以少许错配、插入和缺失的形式出现在所研究序列中。我们可以描述寻找motif问题如下:给定一个序列集,以及一个未知片段,这个片段以少量变化的形式(诸如错配、插入和缺失)在不同位置出现每个序列中(序列中对应的片段即叫做motif),我们能否找出这些motif呢?在DNA序列中寻找motif是计算生物学中的一个基本问题,在基因调节中有十分重要的应用,基因序列数量的巨大让问题计算起来相当困难,而且其中的许多问题都是NP-hard的。近十年来,人们为此设计了许多启发式算法,但问题还远远没有解决。  本文主要考虑motif变异的两个形式:嵌入和缺失。即允许未知片段以少许嵌入或缺失的形式出现在所研究序列中。我们刻画问题如下:问题3.1.1(d嵌入motif问题)给定∑域中的序列组  S={s1,…,sn},|si|=m.i=1,…,n,以及整数d.L求一个长为L的字符串s,使s以至多嵌入d个字符的形式表现在每个si中,即存在si的长为L+d子串ti,满足s为ti的子序列。问题3.2.1(d段嵌入motif问题)给定∑域中的序列组  S={s1,…,sn},|si|=m,i=1,…,n.
其他文献
Hamiltonian系统是微分方程中一类基本的研究体系,它研究的主要问题之一是非线性项满足一定条件下方程周期解的存在性及个数问题,所用到的基本原理和方法主要有拓扑度理论和变
本文主要研究的是关于关于微分代数系统解的迭代序列的收敛性、波形松弛迭代法收敛性的新的方法、具有时滞扰动的非自治中立型FDE的3/2-稳定性. 在第一章中,得到了微分代数系
为促进经济平稳较快发展,防止出现大起大落,党中央和国务院把促进经济快速、健康发展,稳定市场物价确立为“十五”期间的重要任务之一。从一开始就采取了一系列宏观调控措施,
中央党建领导小组成员、中直工委原常务副书记伍绍祖最近在我区考察工作时强调,要坚持以党的执政能力建设为重点,坚持立党为公,执政为民,真正做到权为民所用,情为民所系,利为
而卡尔曼滤波用于实时融合动态的低层次冗余传感器数据,该方法用测量模型的统计特性决定统计意义下最优融合数据估计。如果系统具有线性动力学模型,且系统噪声和传感器
8月24日至25日,中央组织部、中央统战部在北京召开全国培养选拔党外干部工作座谈会。中共中央政治局委员、书记处书记、中央组织部部长贺国强出席会议并讲话。他强调,培养选
  线性二次最优控制问题不但可以模拟现实世界中的很多现象,而且可以近似一些复杂的问题;同时其结构又相对简单,处理方便,因而成为现代控制理论中的一类重要问题。不管是确
  本论文给出了非参数回归模型中估计单调回归函数的一个惩罚局部多项式估计,除了单调性,新提出的估计在单调性和渐近性质之间达到了平衡。比起单调估计的惯用技术,新估计
  在铸造工艺中,铸件的充型过程非常重要,充型过程控制的优劣,将直接影响到液体的热传导和凝固。对此,本文对铸件充型过程进行了数值模拟。为简单起见,本文主要考虑的是一个二维
本文主要研究正交约束下的非均衡Procrustes问题:给定矩阵A∈Rn×n,B∈Rn×k,n>k,使得‖AQ-B‖F最小化,其中QTQ=Ik,Q∈Rn×k.全文共分为四章. 第一章是绪论部分,主要介绍了正交约