基于马尔科夫模型的可趋近性miRNA靶基因预测算法

来源 :燕山大学 | 被引量 : 0次 | 上传用户:chly31
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNA(miRNA)是一类重要的基因表达调控因子,准确预测miRNA的靶基因对研究miRNA的功能和作用机制至关重要。目前发现了大量的miRNA,但与之相互作用的靶基因数量很少。植物的miRNA通过完美的碱基互补方式结合到mRNA上,靶基因很容易被预测。动物的miRNA与靶基因只需要部分碱基配对,是靶基因预测的难点。由于miRNA和靶基因作用机制不太清楚,根据传统交互规则设计的算法效果不太理想。本文通过对miRNA和mRNA交互的可趋近性进行研究,提出一种新的预测算法。首先,针对miRNA以具体序列方式靶向mRNA的特性,以概率思想建模,提出基于二阶马尔科夫链模型的可趋近性靶基因预测算法Atar。该算法允许miRNA种子区中存在且至多存在一个G:U碱基配对。以非重叠的计数方式统计与miRNA种子区互补的特定核苷酸片段(寡聚体)在可趋近3’UTR序列上偶然出现的次数,并以出现一定次数寡聚体概率值的大小排序相应miRNA-3’UTR对,取前N个排序结果作为预测结果。其次,针对高阶马尔科夫链模型存储量大和维数多的缺点,提出可变长马尔科夫链模型预测可趋近交互位点算法。该算法通过比对miRNA和可趋近性mRNA位点形成的二聚体序列获得一条新序列。新序列中用不同字符代表不同碱基配对类型,以可变长马尔科夫链模型模拟新序列,并在概率后缀树加入平滑化技术改进模型。通过比较正、负分类上新序列概率的大小判断新序列所属类别。进而获得miRNA和mRNA可趋近位点的交互信息。最后,利用miRbase中实验验证的真实靶基因数据。在通用评价标准下,评估本文算法和其他预测算法的实验结果,从而验证本文算法的优越性。
其他文献
<正> 我国国有企业的改革,仍没有彻底解决企业行为与企业活力问题。我们认为,这里的要害是没有合理解决剩余产品基金在国家与企业之间的分配问题和与此相关的没有合理解决企
揉弦作为小提琴演奏艺术中的重要演奏技巧和弹奏方法,出神入化的使用揉弦技巧能够更加增添小提琴整体演奏的流畅性和多样性,同时更丰富地展现了小提琴演奏艺术的优美感和灵活
高质量的审计服务是保护市场各方利益的最佳选择。在新的信息市场环境中,上市公司业务的复杂性及公司治理手段的隐蔽性增加,审计师面临着巨大的审计风险。媒体作为信息传播的
研究均匀的理想来流作用下,小垂度矩形双曲抛物面薄膜结构的气弹失稳临界风速;考虑气流在薄膜结构前缘的分离形成漩涡,在风与薄膜结构之间以及尾流中引入无限薄的漩涡层;考虑风与
今天,在遇到一些节日(如三八妇女节、春节等)时,不少学校总是将其作为学生德育实践的一个平台,如,开展“为母亲洗一次腳”“我为家里出份力”等感恩性质的活动。不但如此,有的学校觉得节日时间短,不能强化学生的感恩意识,于是,在寒暑假,便把为父母洗一次脚当作一项作业布置下去。那么效果如何呢?学生是不是因为洗一次脚就对父母心存感恩了呢?我看未必。  还记得去年的三八妇女节来临时,某学校欲开展一次“给妈妈洗一
通过分析高职院校现有英语教学模式,根据人才市场需求和<高职高专教育英语课程教学基本要求>规定,从英语课程设置、教学方法、师资队伍、教材建设等方面,探究构建EGP和EsP相
2009年4月正式开工建设的沈阳展览中心是东北最大的展览馆。目前,展馆吊顶工程已过半,预计2009年底前展馆将呈现雏形。
<正> 最近拜读了李长明教授的《谈谈直观在解题中的作用》一文(见本期P.6),深受启发。该文运用图象法解决了一系列国内外的数学难题。构思巧妙,直观简便,新颖有趣,引人入胜。
开学啦!学校的校园又充满了生机,各项工作都在井然有序的进行。学校工作要快速进入“轨道”,班级教室后面的“板报”便是学校开学初需要布置的一项工作。我校根据开学初季节时令具有的“节日文化”,提出了鲜明的板报要求:主题突出(以教师节、国庆节,中秋节三节为主题),板块鲜明,书写规范工整。学校教师根据要求便纷纷开始忙碌起来了。  今年,我和班主任小王老师共带一班。小王老师是一个工作认真,对学校布置的各项工作
据悉,凭借网络游戏改编的电影《魔兽》在中国的票房已经成功突破12亿人民币,成为了这半个月的二次元超级网红。而近日上海迪士尼首日开园车站客流就已经达到了58400人次。再次
会议