基于位置依赖性的Gibbs采样模体发现算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jlckyang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着生物测序技术的突飞猛进,现代生物技术的研究取得了突破性的进展,生物序列数据以前所未有的速度增长。人工分析和处理生物序列数据已无法满足需要,如何分析和处理如此庞大的数据,以及理解这些生物数据所表示的生物意义,已经成为当前重要的研究任务。DNA序列中的模体发现是生物信息学中最基本的问题,它涉及到基因的发现、转录因子结合位点的发现、启动子的发现等生物学问题。生命性状由基因决定,当前基因如何决定性状的研究已从单个基因决定作用转向多个基因的协同作用研究。DNA序列调控区的模体对DNA的转录翻译起着重要作用,因此对调控区motif的分析具有重大意义和理论价值。同时,识别这些模体对基因组解码也起到了非常重要的作用。目前,已经有很多算法被用来解决模体发现问题,例如Gibbs采样算法,MEME算法等。本文首先对模体发现算法中常用的模型进行了分析,并且基于不同的模型对上述几种传统的模体发现算法进行了分析和研究。这些传统的算法都假设模体内部各个位置之间是相互独立的。但是最近的生物实验证实,模体内部各个位置之间并不是完全独立的,有的模体的各个位置之间存在明显的依赖性。这种依赖性应该被用于模体识别以提高模体识别的精度。本文正是基于这种考虑,将模体内部的依赖性引入得分函数中,基于Gibbs采样算法提出了PIGS算法,进行motif识别。同时改进了Gibbs采样算法的收敛条件和相移方法。在合成数据和真实数据上的实验结果表明,查找出的模体在准确度方面有较大的提高。
其他文献
计算机的发展激起了人们对人工智能的渴望,互联网的飞速膨胀改变人们对信息的理解。人们希望计算机能和人类用语言交流,能读懂互联网上的信息,能帮助人们从海量的信息中准确
分片式处理器体系结构(TPA)能够很好地应对纳米工艺代的功耗、线延迟、设计和验证复杂度等一系列问题,是一种具有良好的性能扩展潜力的众核处理器体系结构设计方案。作为一种
与文本无关的说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域有着良好的应用前景。 本文介绍了说话人识别系统中需要用到的理论和方法例如高斯混合模
随着信息社会的快速发展和网络的广泛应用,每天从社交网络、业务交易以及传感器等应用中产生的数据难以计数。尽管传统的哈希技术能够很大程度上压缩数据并提高数据管理性能,但
集传感器技术、嵌入式计算技术、分布式信息处理技术和通信技术于一体的无线集成传感器网络以其低廉的价格、便利的部署方式正得到越来越广泛的使用,对传感器网络各个方面的
随着计算机科学技术的发展,其应用的领域也越来越广泛。在图像处理领域中,处理的数据量巨大,提高图像处理的速度就是一个巨大的挑战,这是由图像数据的特点和图像处理算法的复
独立分量分析(Independent Component Analysis, ICA)作为一种变换方法,在神经网络、盲源分离、统计分析等领域的有着广泛的应用,它在过去二十年尤其是近十年内得到了长足的
本文在假定深度的基础上提出一种几何物体位姿计算的方法,并且初步研究位姿计算中基本几何物体的三维感知经验。文章首先概述了位姿计算的基本研究背景综述了一些基本的研究
P2P(Peer-to-Peer)技术作为Internet的重要技术之一,近些年来受到了计算机业界越来越多的关注。P2P技术直接将人们联系起来,让人们通过互联网可以直接交流。P2P使得网络上的
数字图像和视频修复是填充图像或视频内指定的破损区域的处理过程,是当前计算机图形学、计算机视觉和图像处理的研究热点领域之一。目前,图像修复的基本方法主要有两大类:基