基于BP神经网络的启动子序列的预测分析

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lf740047016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因转录调控是基因表达调控活动中的一种主要方式。启动子是一类与基因转录调控活动息息相关的DNA片段。对启动子的分析研究是揭示特定通路的转录单位,理解基因调控机制及基因结构的研究基础,同时也是基因信息注释工作的工作基础。对启动子的预测识别一开始主要依靠传统的生物学实验,但传统的生物方法成本高、耗时、耗力。近几年,海量生物学数据基础及计算机技术的发展推动着基于计算方法的启动子预测研究的开展。启动子序列的多类特征已被用来对其进行预测识别,多个启动子相关预测模型也相继被提出,但绝大多数预测方法具有局限性。
  为改善启动子预测模型效果,本文引入了新的序列特征描述方法用于启动子的特征获取。除了关注模型是否具有令人满意的预测性能,其普适性能也不容忽视。若想提高模型普适性,需要分析更多的启动子序列并获取其更具有一般性或更为全面的序列特征信息作为分类依据。因此,本文以三种原核生物和两种真核生物启动子作为分析对象;在已有启动子研究基础上,引入信息论等信号处理方法综合分析启动子序列获取新的序列特征;特征整合后易造成特征空间存在冗余信息,为剔除冗余信息,采用基于随机森林的递归特征消除算法实现特征选择;利用选择前后的特征信息及BP神经网络分别对上述五个物种构建相应的启动子分类模型;最终通过五折交叉验证方法评价其分类效果。
  在原核基准测试集上得到的实验结果:大肠杆菌、枯草杆菌和绿脓杆菌的五折交叉验证结果平均准确率和AUC值分别为0.755和0.814、0.831和0.903、0.788和0.916;通过进行物种间交叉实验来测试模型普适性,以三种原核生物混合数据为基准数据集的物种交叉实验结果准确率和AUC值为0.819和0.804。在真核基准测试集上得到的平均实验结果:对人启动子的预测准确率为0.864、AUC值为0.940;对小鼠启动子的预测准确率为0.782、AUC值为0.825。两种真核生物的物种间交叉实验准确率和AUC值分别为0.823和0.884。以上结果表明本文基于信息论等方法获取的序列特征对启动子的识别是有效的;模型同时具有良好的普适性。这有助于揭示启动子更具普遍性的特征,开发更具鲁棒性的启动子预测模型,对跨物种间进行启动子预测分析和拓展应用具有推动作用。
其他文献
摘 要:通过对国家所有权立法目标的政治经济学分析,指出国家所有权基于权利来源和权利实现的不同规定性,需要遵循不同的现实规律和要求,从而在立法目标上天然的具有内在的冲突,即个体利益和公共利益的冲突,而这种冲突最终为权利平等的价值追求划定了界限。  关键词:权利平等;国家所有权;经济分析  中图分类号:D90 文献标志码:A 文章编号:1673-291X(2014)10-0297-03  权利平等是人
期刊
摘 要:城乡教师资源配置不均衡是中国义务教育阶段中的突出难题。农村中小学教师资源配置与城区相比存在巨大差异,严重影响到教育均衡发展。以广西M县为例,通过对影响教师资源配置问题进行实证分析,采取有针对性措施促进教师资源在城乡间的均衡配置。  关键词:义务教育;教师;资源均衡配置;经济因素  中图分类号:F240 文献标志码:A 文章编号:1673-291X(2014)10-0266-05  近年来,
期刊
摘 要:浙江省临安团市委立足农村青年、关注青年成长和支持青年创业,全力推进农村青年信用示范户试点工作,此举对于推动农村信用体系建设、农村信用环境建设和促进农村经济社会发展具有重要现实意义。临安团市委联合浙江团省委和杭州人行支行主要通过实施办法、领导重视、明确重点、建立机制和舆论宣传五个方面措施,系统全面地开展农村青年信用示范户建设工作。此试点的实践经验将为其他区县市团委推进农村青年信用建设提供借鉴
期刊
摘 要:通过综合指标评价法,对所得到的分类数据和数值数据进行处理,从而对大学生公共关系相关问题进行评价。基于实地调研,以问卷形式对大学生公共关系的相关问题展开研究,同时以焦点座谈会和访谈作为辅助调研工具,综合考虑大学生公共关系三个主要问题所实际面临的社会环境。调查表明,大学生群体具有较好的公共关系意识,但公共关系教育环境仍处与模糊阶段,高等院校院系缺乏良好的公共关系教育体系,不利于培养优秀的公共关
期刊
摘 要:国家电网公司十年的发展实践形成了国家电网特色的六大管理理论,即综合价值理论、持续超越理论、同心圆业务理论、集团公转理论、管理翻地理论和统一文化理论。十年的管理实践,国家电网公司始终以特色管理理论为指导,取得了举世瞩目的成绩。对国家电网六大特色管理理论的实践应用情况进行详细分析介绍,以期为其他相关企业强化管理提供借鉴和参考。  关键词:综合价值理论;持续超越理论;同心圆业务理论;集团公转理论
期刊
摘 要:随着社会经济高速发展,国内外创业激情涌动,中国深化经济体制改革,重点扶持小微、中小企业发展,激励着大学生参与到创业大军之中。大学生有创业热情,具有年轻化、知识化的特征,但是大学生创业失败率高居不下。如何引导大学生科学创业、如何促进大学生创业成功,成为政府、高校和社会的关注焦点。首先对国内外学者研究的大学生创业环境展开介绍,其次以所在大学为例证论证大学生人力资本和社会资本因素在创业中的作用,
期刊
摘 要:基于1978—2012年间河北省时间序列数据,采用协整分析方法对城镇化、城乡收入差距与经济增长之间的关系进行实证分析。研究发现,在1978—2012年间河北省城乡收入差距具有明显的阶段波动性,且呈扩大的趋势,河北省的城镇化水平、经济增长与城乡收入差距之间存在长期稳定的协整关系。具体来看,城镇化对城乡收入差距的影响显著,两者呈正效应关系,同时随着经济的增长加大了城乡收入差距。因此,如何协调城
期刊
信号源是一种在通信、军事等领域应用广泛的基础设备,它既可以为雷达设备提供标准的发射信号,又能为测量与模拟实验提供对照信号。随着FPGA等数字化技术的发展,高度数字化的信号源拥有了高精度、易修改、低复杂度等特点,在现代电子技术中扮演了重要的角色。塔康是世界上最早为飞行器同时提供距离与方位信息的近程无线导航系统,且应用非常广泛。设计并数字化实现塔康信号源将为塔康设备的测试与校准提供便利。
  本文结合中电XX研究所的XX配套项目,对通用信号源、Link22数据链基带加密模块与塔康系统等多种模式的信号源展
道路边坡滑坡、危岩崩塌给人民的生命财产造成巨大损害,边坡危岩的失稳状态实时监测至关重要。图像处理方法作为边坡危岩监测技术手段之一被广泛应用,能实时、高效监测边坡危岩状态。被监测场景中包含危岩、边坡、人、车、树等对象,其中人、车、树产生运动时就会影响危岩边坡的状态判断,传统图像处理方法通常以图像中物体运动作为判断依据,当人、车、树这类物体发生运动即得出危岩边坡失稳,导致误判。因此传统图像处理方法不能准确判断监测边坡危岩的失稳状态。
  针对以上问题,本文将人工智能算法应用于边坡危岩监测场景中,识别区分
低剖面垂直极化端射天线在机载、车载、弹载和雷达系统中具有广阔的应用前景。随着现代集成电路技术的成熟,无线通信、雷达等系统朝着小型化、紧凑化发展,因此,天线的小型化也成为了必然趋势,尤其是在国防、军事领域,如北斗导航系统、隐身战机等一系列高新装备无一不对天线的小型化、紧凑化提出了更高的指标要求。目前,在保证天线低剖面共形的前提下,实现垂直极化端射天线的小型化设计仍是极具挑战性的研究课题。基于这一背景,本文对垂直极化端射天线在降低天线剖面和减小天线尺寸两个方面进行了深入的研究,并在此基础上扩展了天线在柔性和可