一种新的预测水平转移基因的组合特征方法

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:liangxinnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水平基因转移(Horizontal gene transfer,HGT),又称横向基因转移(Lateral gene transfer,LGT),是指在不同的生物个体之间遗传物质的交流,即从亲代以外的个体中获得遗传物质的过程。不同的生物个体可以是同一种生物,但含有不同的遗传信息的生物个体,也可以是远缘的甚至没有亲缘关系的生物个体。已有的知识表明基因水平转移是一个重要的现象,水平基因转移相对于垂直基因转移(亲代传递给子代)来说打破了亲缘关系的界限,使基因的流动成为可能。大量的识别基因组中水平转移基因的计算方法已被提出,大多数使用参数方法预测细菌基因组中水平转移的基因,通常选取单个特征或几种特征简单地结合的方法分别对单个细菌基因组或人造基因组预测水平转移的基因。我们知道,不同的特征表征不同的基因序列编码信息,不同的基因序列可以由不同的特征进行表达,因此,不同的基因序列应该有不同的最优特征表达,且多个特征的组合应该比单个特征对基因序列的表达更加精确,不同的基因序列应该有不同的最优特征组合。因此,通过单一的特征或简单结合几个特征的方法去预测几种细菌基因组中水平转移的基因,应该会影响预测的精度和可靠性。为了解决这类问题,我们提出了一种新的组合特征方法,用以预测水平转移的基因。首先,我们选取17个经常使用且表现较好的特征,利用支持向量机模型对它们进行加权组合,以便于特征的选择,使用遗传算法对特征组合进行优化,有效提升我们的预测精度。其次,选取396个真实的细菌基因组用于预测,能够更加全面可靠地分析不同的特征在不同细菌基因组下对基因功能表达的不同影响,使得我们的结果更具说服力。本文中,我们的组合特征方法是通过支持向量机进行分类,利用遗传算法进行优化的水平转移基因预测方法,也是对参数方法的进一步研究。通过和其它预测方法的比较,我们提出的组合特征方法更加有效的提升了预测精度和降低了时间复杂度。对生物学研究者来说,使用更好更加有效的预测方法去处理实际的问题,能够节省大量的时间和不必要的开支,例如对细菌类生物和人类疾病的研究。本文方法是对大量的基因组数据进行处理,进一步的观察和分析,为原核生物的水平转移基因的预测提供参考,为生物学研究打下基础。在以后的工作中,我们会认真分析每一类细菌基因组,通过蛋白质的功能表达对其进行分类,并预测不同功能表达下蛋白质编码的水平转移的基因。
其他文献
强化学习通过试错与环境交互而获得策略的改进,其自学习和在线学习的特点使其在实际中获得了越来越广泛的应用。但是,强化学习一直被“维数灾难”所困扰。分层强化学习(HRL)
基于软件总线技术的电网实时数据管理系统随着电网企业规模的扩大和数据源的增多,系统响应速度和数据实时性受到很大的影响。为了解决这些问题,本文在查阅大量国内外文献的基础
信息系统工程建设具有投资大、周期长、风险高、技术含量高、涉及领域广的特点,在信息系统工程建设中,很多业主单位(包括政府部门)在实施信息化建设的过程中,因了解和熟悉信
网格是构建在互联网上的一种新兴技术,网格的研究是目前新的研究热点。随着网格技术的发展,Web服务概念的提出,网格技术已渗透到社会各行业。网格的目标是把互联网整合成一台
Job-Shop调度问题是许多实际车间调度问题的简化模型,是一个典型的NP-Hard问题,已被证明在多项式时间内得不到最优值。蚁群算法是近年来兴起的一种优化算法,特别在解决组合优
随着网络技术的迅猛发展和网络应用服务的不断深入,针对网络的攻击破坏,非法入侵等安全事件也在持续增长,而且大有愈演愈烈之势。而传统的基于入侵检测和防火墙的防御方式已
实时系统已广泛应用于国防、航空航天、通信、自动控制等领域。随着实时系统的规模和复杂性的增加,为了更好地理解所开发的系统,从而开发出高质量的实时软件,需要对系统进行
骨髓是人体的主要造血组织,对骨髓细胞形态和数量的分析有助于造血系统疾病及其他某些疾病的诊断和鉴别。传统的诊断方式是由人眼完成的,而这种方法存在很多的弊端。基于图像
射频识别(Radio Frequency Identification,RFID)是一种快速、实时、准确采集与处理信息的技术,在零售、物流、交通、医疗、国防等多个领域有着广阔的应用前景。其中,RFID中
服装CAD系统自二维向三维转变,是三维计算机技术成熟与服装个性化定制的一个必然趋势与结果。在整个服装CAD系统中,三维服装设计是最核心的部分。所以服装的褶皱的设计对提高