基于序列信息对真核复制起始位点预测

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gsfv85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA复制是保持亲代到子代遗传信息稳定传递的关键步骤,是生物遗传的基础。复制起始于基因组的特殊位点,称为复制起始位点(ORIs)。复制起始位点对DNA复制的起始进行调控,在复制机制中扮演着十分重要的角色。研究复制起始位点不仅有助于理解细胞分裂周期和基因的表达调控,而且在遗传病的新药研究中会提供新的策略。因此,对DNA复制起始位点的准确识别将为DNA复制机制的探究及药物研发提供十分重要的线索。目前,众多湿实验技术能够精确捕获复制起始位点的位置,但庞大的数据量需要较长的周期,还需要投入大量的经费,因此,开发基于计算机的研究方法是很有必要的。而与此同时,生物信息学手段已经成功应用于功能基因组学和蛋白质组学领域,并随着三代测序产生的爆炸性数据量,使得采用计算机方法识别复制起始位点成为可能。本文中研究中,我们构建了第一个多物种真核生物复制起始位点的集成预测器ORi-Pred。首先,从数据库DeOri和OriDB获取了人类、小鼠、果蝇、拟南芥、酿酒酵母、毕赤酵母、裂殖酵母和乳酸克鲁维酵母八个真核生物的DNA复制起始位点数据集,基于支持向量机(SVM)五折叠交叉检验分别用k-mer、理化性质矩阵、二进制编码三种特征提取算法表征序列并比较结果,对最佳特征提取算法获得的特征用F-score进行特征筛选,并基于最佳特征集将SVM与其他算法比较获得每个物种的最佳分类模型。由于酿酒酵母具有作为模式生物的独特优势,前人在研究真核DNA复制起始位点时多将其作为实验研究对象,因此提升模型对酿酒酵母复制起始位点的预测精度对实验人员具有重要的指导意义。基于此,我们在现有的准确率为84.83%的酿酒酵母复制起始位点分类模型的基础上,使用二型伪核苷酸方法提取序列特征,通过两步特征筛选策略,最终获得了准确率为88.53%的酿酒酵母最佳分类结果。综上所述,人类、小鼠、果蝇、拟南芥、酿酒酵母、毕赤酵母、裂殖酵母、乳酸克鲁维酵母八个物种的最佳模型的准确率和ROC曲线下的面积分别为88.40%和0.947、85.03%和0.909、87.38%和0.946、82.64%和0.870、88.53%和0.905、90.45%和0.948、93.99%和0.978、83.82%和0.890。最后为了方便相关领域研究者使用,我们基于八个物种的最佳分类模型构建了一个多物种真核生物复制起始位点集成预测器ORi-Pred(http://lin-group.cn/server/ORI-Pred/)。
其他文献
【正】 祖国医家在诊断疾病上有一杰出的理论:“有诸内必形诸外”。是说内脏及情志病变必定要反映到外表上来,出现一系列的躯体和精神症状。在治疗与预防疾病上也有一杰出的
在消费社会和网络社会的双重裹挟下,身体在视觉中遭遇新的伦理悖论:视觉身体是否就等同于身体真实?视觉身体是否具有商品性?技术可能的今天如何确认身体的边界问题?而身份在
最近,在实验上由单层二维材料制成的二维异质结已引起人们的特别关注。石墨烯等二维材料既可通过强化学键作用,形成层内二维异质结,也可由它们部分重叠,通过Van derWaals力形
现实题材的崛起,是近两年网络文学发展的明显趋势。在多年沉迷于玄幻、穿越、盗墓、修仙等题材之后,对现实的回归成为一些网络作家的自觉。相比之前的天马行空、眼花缭乱,眼下的
报纸
伴随世界和各国整体经济发展,民众个人的财产在急剧积累,富人的队伍在日益壮大。最新发布的《2016年全球财富报告》中数据显示,中国拥有的超过5000万美元净资产的人已经达到1
天下大事,必作于细;天下难事,必成于实。精准施策是疫情防控的重要方法论,是确保各项防控措施取得实效的关键。$$“疫情防控形势不断变化,各项工作也不断面临新情况新问题,要密切跟
报纸
牵引变压器是连接牵引供电系统和电力系统的核心设备,其接线形式是牵引供电系统设计的重要内容.本文通过分析牵引负荷特点对牵引变压器接线形式进行了比较,并对高速铁路牵引
材质和贴图的应用技巧是三维设计中关键核心的技术之一,是中职学生三维课程学习过程中的一大重点和难点,本文以C4D材质教学为例,在教学中引入高效的金字塔原理,重新梳理知识
在中国影视行业,美食题材近来以《舌尖上的中国》《人生一串》《风味人间》等纪录片为代表。上一次美食题材集中涌现是上世纪90年代,1992年元彪、黎明等主演的《伙头福星》是港
报纸
学习行为是农民工流动到城市之后的重要适应行为,通过深度访谈调研其学习行为,概括总结出了农民工学习行为的特点及其学习行为中存在的问题.由此,为激发农民工的学习行为,社