基于碱基组成和分布的DNA序列特征提取方法及应用

来源 :燕山大学学报 | 被引量 : 0次 | 上传用户:cjfandhf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过特征提取方式挖掘生物信息数据中潜在的规律是生物信息学研究的基本问题之一。基于DNA序列的碱基转移概率、含量和位置比三类特征构造了24维特征向量,成功应用于11物种的β?珠蛋白基因完整编码序列和18哺乳动物线粒体基因组序列的相似性比较,构建的系统发生树与进化事实相符。基于该特征向量,结合支持向量机分类方法识别了28株细菌中的必需基因,平均AUC值高达0.808,高于部分识别方法。实验结果说明:生物序列基本构成元素的转移概率、含量和位置比可作为研究生物信息学中相关分类问题的选择性工具。
其他文献
将宁波港市经济的特色归为三大特征,即“由港兴市,以市促港”,“以工促港,工港联动”,“以港带路,以路促港”。而保持和凸显宁波港市经济特色之路在于创新。宁波港市经济发展模式的
针对数控机床定位精度检测中数据计算繁琐、效率低的问题开发了数据处理软件,该软件可为数控机床高效的精度检测、数据处理提供一种有效的工具。
弗里达·卡洛是20世纪墨西哥的一位特殊的女画家,病痛折磨着她,伴随她度过一生。她做过32次手术,不得不依靠麻醉药来消除疼痛感,她的爱情生活也充满波折。身体和精神上的
从浙江机电职业技术学院应用电子技术专业示范建设的主要成效出发,提出了应用电子技术专业“后示范”建设的推进策略和措施。以专业核心竞争力的内涵分析为引导,阐述了提升应用
通过两个具体实例详细介绍了“工”字型图PLC程序设计法的设计方法,同时在程序设计过程中经常出现的重复定义问题,给出了具体的修改意见。“工”字型图PLC程序设计法具有条理性
近年来,英语教学改革日益深化。教育部对全国高校开展了系统且深入的大学英语分级教学,设置个各种学习体系与评价体系,逐步完善了大学英语教学后续教学体系,更能满足高校日益多元
由于高职院校办学历史较短,校园文化建设经验不足,加之办学规模不断扩大,在文化建设过程中暴露出许多问题。因此,高职院校应立足自身实际,在不断总结、探索、提炼的基础上,努
基于独立学院的特点和市场营销专业的学科特色,加强实践教学是独立学院市场营销专业培养具有创新素质的应用型人才的重要环节。通过文献资料研究和有关独立学院调研,针对独立学
针对锦瑞煤矿8号煤层及顶底板围岩情况,采用现场调研、实验室试验等方法对8号煤层巷道围岩物理力学参数进行了测试,通过FLAC~(3D)数值模拟对巷道围岩稳定性进行了分析,并依据松
在热轧H型钢生产过程中经常出现腹板和翼缘延伸不均匀的现象,即所谓“舌形端部”,导致大量的切头损失。本文采用ABAQUS有限元软件模拟了H型钢的热连轧过程。计算结果表明改变轧