基于Gibbs抽样和EM算法的生物保守序列motif识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:hyflover
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着许多物种的基因测序工程的完成和生物技术的发展,人类拥有了大量的生物数据。本世纪一个具有挑战性的问题就是挖掘这些数据中的生物信息,其中发现生物序列中的保守片断是一个重要的问题。这些保守片断被称为motif。Gibbs抽样是在生物序列中的motif识别中应用最广泛,最成功的算法。以往的研究都把motif的长度视为固定的,而实际情况是事先并不知道motif的长度。本文通过把motif的长度看作缺失数据,通过算法来确定这个长度。实验结果表明,这个算法是可行的。Bailey和Elkan在1994年通过二元混合模型把EM算法用于生物序列中的motif识别。这个方法首先把原来的生物序列截断,然后用二元混合模型来拟合新的数据集。注意到新的数据集中有很多数据并不能由这个二元混合模型来生成。本文通过引入多元混合模型来拟合这个数据集,从而使每个数据都能由这个多元混合模型生成。由于我们的模型能更准确地描述数据,从而能够使参数更快、更准确地收敛于真正的参数值。
其他文献
随着生活品质提高,人们对食品安全性关注度越来越高。近年来食品中检测出多种有害污染物,人体吃了含有重金属的食物会对身体产生严重危害。目前对食品中重金属多采用原子吸收
E-Learning下为什么要建立社会服务体系?如何建立?本文从实际出发进行了有益的探索,并从实践的角度提出了一些建设的模型与发展原则。
近几年,随着食品安全问题的日益严重,人们对食品质量越发关注,提高食品质量检测效率与准确性,杜绝不合格食品进入市场,保障人们身体健康,已经成为社会热点。基于此,本文探讨
目的探讨产科优质护理新模式对自然分娩的促进作用。方法将产科收治的120例产妇按照随机数字表法分为对照组与观察组各60例。对照组产妇实施常规护理,观察组产妇在常规护理基
食品药品安全关乎人民群众的身体健康和生命安全。今天,邢台市人民政府新闻办公室举行的新闻发布会上,邢台食药监局公布了“邢台市2017年上半年食品药品典型案例”,涉及售卖假药
语言是文化的载体,在跨文化的交流中,语言交流受到各自文化背景的约束。中日两国的语言和文化都具有很大的差异,很多语言的基础知识必须从日本文化进行解读,否则学生的对日语
海男小说的生命意识具有“宿命性”的明显特征。宿命论是一种较为复杂的哲学思想,宿命观指出,所有人事的安排都是由一种神秘力量的主宰,人在宿命面前束手无策。海男小说生命意识
在豫东,河南长领食品有限公司在2016年再次以产值两个多亿元夺得花生炒货单品冠首。“这是多年来公司精准定位,舍得与共的结果。”河南长领食品有限公司总经理张显朝对公司近几
沼渣液与玉米秸秆混合,并添加不同氮源及木醋液,进行堆肥实验。分析了堆肥过程中不同处理的pH、C/N、有机质含量、氮元素的转化及种子发芽指数等指标。分析结果表明,以鸡粪作
日本帝国主义在中国犯下了滔天罪孽.在这场民族解放斗争中,中国军民体现出了英勇顽强、前赴后继抗击日本帝国主义惊天地、泣鬼神的伟大精神.然而,爱好和平的人们面前仍然有很