【摘 要】
:
随着人类基因组计划的实施及基因草图的完成,生物科学与技术得到了迅猛发展,同时积累了大量的相关数据,并且这些数据的增长速度已经远远超出了人们的想象。面对如此海量的数
论文部分内容阅读
随着人类基因组计划的实施及基因草图的完成,生物科学与技术得到了迅猛发展,同时积累了大量的相关数据,并且这些数据的增长速度已经远远超出了人们的想象。面对如此海量的数据,如何能够找到我们所需的信息成为了一项重要而又艰巨的工作。启动子作为调控基因转录的重要调控元件,在构建基因转录调控网络方面起着尤为重要的作用,加之真核启动子与原核启动子相比有着更为复杂的结构,故此真核启动子识别已成为当前基因组研究工作中的热点及难点。目前在启动子识别方面已经提出了许多算法,但都普遍存在假阳性较高的问题。为了改进现有启动子识别算法存在的不足,进一步提高算法的启动子识别性能,本文将Z曲线理论及启动子的结构特征应用到启动子预测的研究中来,提出了基于结构特征及Z曲线特征的真核启动子识别算法。所选取的6类结构特征能够较好地描述基因序列的空间形态,所选取的Z曲线特征能够从序列的全局角度描述序列中碱基及强氢键、弱氢键的分布情况,从而达到了从基因序列局部弯曲度及序列的双链的稳定性的角度来区分启动子序列与非启动子序列。首先提取训练集数据中的启动子及非启动子的结构特征、Z曲线特征;然后基于马氏距离构建结构特征分类器,基于Fisher准则构建Z曲线特征分类器。每个分类器由三个分类子模块组成,即启动子-外显子、启动子-内含子、启动子-3’UTR子分类模块,各分类子模块根据所属分类器的特征进行启动子预测;最后分类器将子分类模块的分类结果传递给综合评分模块进行综合评分并做出最终的判定。为了评价本文算法的预测能力,对登录号为L44140、D87675、AF017257、AFl46793、AC002368、AC002397的长基因进行了测试,测试结果为:敏感性71.92%,特异性55.56%,准确性63.47%。实验结果表明,本文算法具有更好的启动子识别性能。
其他文献
高炉泥炮机是冶金炼铁工艺中重要的炉前设备,使用环境主要为高温、腐蚀;为满足生产工艺要求,将KD240泥炮改型KD300泥炮斜底座,从而对设备基础进行适应性改造。设备换型产生基
据权威人士透露,因稽查人力不足,我国每年流失的税金达1000亿元人民币以上,为此政府规定,举报者一次最多可拿10万元奖金!山东女孩刘爽偶然从人们平时司空见惯的偷漏税现象中
目的探讨肝细胞生长因子在心肌梗死中对心肌血管新生的促进作用,寻找改善心肌梗死区域供血的有效治疗方法。方法新西兰大白兔30只,随机分3组,每组10只,即A组(术前注射组):行
机会是隐形的,要靠自己去抓那是扈高强最艰难的日子.投资酒店失败,40万元赔个精光.转做产品代理,货却卖不出去.最困难的时候,他连回家的路费都没有.可他熬了过来,他相信凭自
<正> 在81—82年度的篮球比赛季节中发现,几乎每个队都运用了一两套或更多的全场紧逼防守战术。这些战术中最流行的形式是全场人盯人紧逼或2—2—1, 1—2—1—1全场区域紧逼
<正> 哪块肌肉对跑、跳能力的影响最大呢?有些教练员可能说是小腿三头肌,其他也有的说是股四头肌,或者是由股二头肌和半膜半腱肌组成的股后肌群等等。基于这种认识,很多教练
“]坚持法律效果与政治效果、社会效果的有机统一,合理配置力量,改进方式方法,不断提高检察机关维护稳定的能力和水平”是中央领导对新形势下基层检察工作提出的新要求,那么
对于这个问题,相信稍有经济和市场知识的人,都会抢着回答:品牌、技术、人才、设备、资金、管理等,这些因素固然重要,但一方面我们问的是什么是最重要的商业资源;另一方面是这些资源在目前情况下,有多少现实意义和使用价值。好了,还是让我说出自己的观点吧:我认为最重要的商业资源是市场服务网络,即产品营销和售后服务网络。 在商品短缺时代,生产规模和生产速度决定着企业的命运和前途。在低烈度竞争状态下,技术水平决
泰国有两家餐馆,在开业的前几天,他们的生意都好得不得了,但是几天过后,两个老板发现了同样的现象,顾客数量下降到了原来的一半.……
从中西医结合的角度,探讨乙型病毒性肝炎的病因、病机、病位和治则治法认为:①乙肝的病因是病毒,它是一种阴毒;②湿热是内生的,是乙肝的症状而不是病因;③针对病因的温阳攻毒