基于机器学习的复制起始位点识别

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:JK0803_lichunfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会日益信息化,各个领域在这一进程中不断地推进科学与技术的相互结合,综合了多门学科知识的生物信息学应运而生,它不再局限于仅使用传统的生物实验方法解决问题。而人类基因组计划的实施使得生物基因测序工程得到了迅猛发展,在生物信息学基因时代,载有遗传信息的基因数据呈爆炸式增长。这些庞大的数据带动了生物学很多领域的快速发展如基因组学,蛋白质组学,疾病研究,精确医疗等。在这些领域中,二分类和多分类问题是经常遇到的问题,如非编码RNA识别、蛋白质同源检测、位点识别等问题。其中本文研究的DNA复制起始位点识别属于位点识别中的一种。本文首先对生物信息学和机器学习进行理论阐述,然后根据研究任务制定相应的研究思路。在实证分析中,本文把从国际酵母生物数据库获取得到的基因组作为我们的初始数据集,利用k元核苷酸频率、伪核苷酸组分、热独编码和词向量等特征提取方法,训练出融合DNA序列的k元碱基频率特征和二型三元伪核苷酸物理化学性质特征的一种新方法。该方法主要是先对核苷酸频率特征进行了优化选择,然后结合改进的伪核苷酸组分做第二步特征提取,其中选取了所有三元伪核苷酸物理化学性质来进行研究。接着利用主成分分析对特征集进行降维,并在新得到的数据集上进行合理建模,计算5折交叉验证下分类模型的预测精度,最终得到基于SVM算法的酵母DNA复制起始位点预测模型。结果表明酵母基因组复制起始位点的预测模型的准确率Acc达到了88.05%,与已有算法对比证明了该模型的可行性。
其他文献
本文通过对湖北省随县安居镇的南高丛越橘‘奥尼尔’和‘密斯梯’、半高丛越橘‘北陆’以及吉林省靖宇县的北高丛越橘‘陶柔’和‘PLJY-2’、‘北陆’等5个越橘品种的树体生长势、叶片形态特征、叶片叶绿素含量、叶片解剖结构、光合生理特性和果实品质等指标的调查研究,进一步对其进行综合评价,结果如下:1.叶片解剖结构方面:‘PLJY-2’主脉厚度802.10μm、叶片厚度224.21μm、上表皮厚度23.42
随着物联网技术的高速发展,一些发展物联网所必需的技术已逐步被掌握。但在物联网的应用中,限制传感器性能和生命周期的关键因素是能量供应与电池寿命问题。由于太阳能具有资源广泛、获取容易等优点,利用太阳能光伏电池实现传感器节点能量的自供给,以有效延长传感器节点的生命周期是当前物联网方向研究的重点。其中,对基于光伏电池进行光电能量采集的电源管理芯片进行设计与研究具有十分重要的研究及应用价值。基于可重构光伏电
目的:探讨研究透明质酸(hyaluronic acid,HA)、HA、CD44及C-jun在C57BL/6J小鼠形觉剥夺性近视眼巩膜上的表达以及肝肾同补法对表达的影响。为肝肾同补法延缓近视发展提供理论依据。方法:正常健康小鼠随机分配为对照1组,模型1组,中药干预组,对照2组,模型2组,中药高、中、低剂量组和阳性药物对照组。其中模型组和给药组(包括中药干预组,中药高、中、低剂量组和阳性药物对照组)右
动态取证是计算机数据取证系统的重要一环,内存分析是动态取证系统的核心。由于各个厂家对内存数据的保护,使得取证过程尤为困难。作为目前市场占有率最高的X64架构的Windows
随着计算机视觉技术的应用发展,人脸属性编辑应用在现实场景中得到拓展,不仅实现了对现有人脸磨皮和人脸美白等基础功能的强化,在图像美化、视频直播、人脸对抗攻击等领域也
设施蔬菜主要以农户为生产单元,缺乏科学水肥管理技术,导致水肥投入过量现象十分普遍,造成地下水硝态氮含量超标问题日趋严重,对饮用水安全和人体健康构成威胁,亟需进行水氮科学管理。本研究采用田间优化施肥试验和土壤-作物系统模型相结合的方法,在集约化农业程度高的大兴区开展设施黄瓜优化施肥试验,设置常规和优化施肥量的4个处理,生长期内主要采集产量、养分吸收量和氮淋失量数据。使用试验实测数据对WHCNS_Ve
人脸识别技术作为生物特征识别领域中的一种重要的识别技术,旨在通过计算机提取人脸图像的特征,并根据这些特征进行人脸身份的验证。由于人脸图像的特殊性,人脸识别问题不仅
尾若金矿大地构造位置隶属于南盘江盆地西北部,是烂泥沟金矿区外围的一个小型金矿床。该矿床成矿地质条件优越,具有较好的找矿潜力。尽管前人对烂泥沟金矿进行了大量研究工作,但对尾若金矿床矿床成因类型,成矿物质来源以及流体演化特征等研究程度整体较低。笔者在前人研究基础上,通过野外详细的地质调查和采集典型代表性样品,对尾若金矿床中各类脉体的先后穿插关系、矿石组构特征、成矿流体来源以及硫化物的形成机制进行了系统
土地资源是人类赖以生存和发展的最基本资源,人类的各类生产活动都离不开对土地资源的利用。在生态脆弱的干旱区与荒漠区,土地资源往往因经济发展而受到了诸多的生态环境压力。磴口县是典型的半干旱区与荒漠绿洲交错区,当地可供人类使用的土地资源比较有限,而当地易遭受沙化的生态环境又使土地资源变得更加脆弱。此外,当地的土地生态经济系统被输入进大量的化肥、农药、除草剂和石油等工业产品以满足快速增长的人口和人类消费的
岩崩是一种破坏力极强的地质灾害,它具有发生突然、速度快、运移距离远、能量大、破坏力极强等特点,发生时往往给人民生命财产安全带来极其严重的破坏。而此类灾害在云南地区时有发生,晚二叠系峨眉山玄武岩作为其物质基础,广泛分布于该地区,且研究区滑源区岩体主要为晚二叠系峨眉山玄武岩,本文通过研究峨眉山玄武岩细碎屑几何形态特征,对其进行定量及定性的评价,同时也对其呈现出圆润几何形态的形成机理进行探讨;并进一步对