基于机器学习方法的基因剪接位点识别研究

被引量 : 0次 | 上传用户:dage10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,完整地了解基因组功能,成为了后基因组时代的主要目标。为了实现这一目标,需要从一些局部的关键问题入手,真核基因剪接位点识别就是其中重要和关键的问题。真核基因剪接位点的识别是基因识别中的重要环节,要从大量的符合GT-AG规则的序列中识别出真实的剪接位点,从本质上看,这是一个分类的问题。由于在真核基因剪接位点的识别中引入了机器学习方法,剪接位点的识别率有了大幅度的提高。真核基因剪接位点是真核细胞生物基因序列中外显子和内含子的相邻区域。如果能识别出真核基因序列中的剪接位点,则可以将基因中的表达区域和非表达区域区分开。为了对剪接位点取得更加精确的预测结果,本文采用HMM方法设计并构建剪接位点识别系统。该系统利用HM-SVM工作集最优化算法训练并优化HMM模型,依据剪接位点附近存在的序列保守性,高效地提取位点附近保守序列在边缘分布与条件分布上的统计特征。实验结果表明,该识别系统在用于剪接位点的识别中,较常用的机器学习方法,获得了更高识别率。
其他文献
通过对张集矿13—1煤东部采区老空水探放的实际资料及老空区水文地质特征的分析研究,总结出张集矿13-1煤东部采区采空区充水系数的经验数值。
广东民办高职教育作为我国高等教育的重要组成部分,近年来发展十分迅速,为我国经济社会发展和产业转型升级提供了有力的技术技能人才支撑。但新形势下广东民办高职教育仍面临
非常高兴有机会来与大家一起切磋、探讨新疆民族文学翻译问题,我是带着向大家学习的心愿来的,看到我们民族文学翻译的队伍已成长壮大起来,成为一支中坚力量,由衷地感到高兴和
指嵴纹数是一个综合的皮纹学指标,包含了诸多的遗传信息,是医学皮纹学和运动皮纹学研究的一个重要内容。本文利用计算机为主要研究工具,对运动人群和普通人群的指嵴纹数进行
介绍一种Huffman算法与RLE(Run-Length Encoding)算法相结合的混合压缩算法对车载监控系统GPS数据进行压缩处理。该算法依据NMEA0183协议获取GPS数据的统计特性,混合对重复的
随着电力体制改革的推进和主辅分开、主多分离的实施,我国电力集体企业面临着巨大的挑战与机遇,对其人力资源管理工作也提出了更新、更高的要求。本文结合我国电力集体企业人
目的:建立正常孕妇血清抑制素A在孕中晚期各孕周的参考值,探讨孕妇血清抑制素A水平异常与胎儿染色体非整倍体可能存在的相关关系。方法:采用酶链免疫吸附技术(ELISA)试剂盒测
目的:了解早期经皮雌激素替代治疗(estrogen replacement therapy,ERT)对高脂喂养的去势雌性大鼠动脉粥样硬化水平的影响。方法:28只大鼠随机分为4组:A组为假手术对照组,B组
大家已经知道,百度云盘、115网盘等都支持将BT种子文件离线下载到云空间中。但是,有的BT种子一个文件就包含数千个资源的链接,而我们获取的一个BT种子里,包含的内容不一定全
通过观察一堂英语课,分析教师核心知识的呈现方式、教学方法的应用以及学生小组合作学习和学习效果,课堂教学设计意图,评价教师教了什么、怎么教的、学生怎么学的、学得如何等,是