启动子预测算法研究与软件开发

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hbdltx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
启动子作为调控元件的一部分,能够控制基因的转录。在原核生物中,启动子能够被RNA聚合酶的因子特异性识别。在大肠杆菌(Escherichia coli)中,σσ70启动子能够控制大肠杆菌中大部分必需基因的转录起始,因而被称为“管家启动子”;而枯草杆菌中的σ43启动子作用如同大肠杆菌中的σ70一般,同样调控着枯草杆菌中大部分必需的基因转录起始。由于启动子在转录调控中的重要作用,使得从整个基因组序列中准确识别出启动子,成为进一步了解基因调控机制的重要一步。随着基因组数据的出现和计算方法与设备的发展,人们非常希望通过使用机器学习方法来识别启动子。由于在一些研究大肠杆菌σ70启动子和枯草杆菌σ43启动子的预测方法中,它们的预测器仅考虑了序列的短程特征信息,而并没有考虑同样很重要的长程序列顺序信息。因此,本文提出了一种新的方法——PseZNC,用来公式化启动子样本序列,在这个模型中,既考虑了序列短程特征信息,也考虑到了序列长程特征信息。短程顺序特征信息由多窗口Z曲线通过描述碱基组分来获得,而序列的长程特征信息则由两个二核苷酸之间物理化学性质相关性来描述。我们选择支持向量机作为本文的分类算法。在使用5-fold交叉验证中,用该方法对大肠杆菌σ70启动子进行预测时,预测的准确率Acc为84.54%,灵敏度Sn为80.30%,特异性Sp为84.54%,AUC为0.9088;对于枯草杆菌σ43启动子的识别,预测准确率Acc为92.30%,灵敏度Sn为88.89%,特异性Sp为93.83%,AUC为0.9650。这些结果证明PseZNC是一个效果很好的预测器,且有很大的潜力应用于其他调控元件的识别中。为了方便相关研究者进一步研究大肠杆菌而不必重复本文方法,我们提供了一个用户友好、简单实用的在线服务工具iPro70-PseZNC,该工具可通过以下网址进行免费访问使用:http://lin.uestc.edu.cn/server/iPro70-PseZNC。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正> 具有高分子材料护套的电缆制品的工作能力取决于高分子材料的使用寿命。预测高分子材料耐久性问题目前受到很大重视。在复杂的复合体系情况下(阻燃聚乙烯复合物属于这种
海洋内波在海洋活动中扮演重要角色。海洋内波研究对我国海洋科学的理论研究、海洋资源的保护、开发和利用以及海洋军事等方面均具有重要意义。为了及时发现海洋内波的发生地点以及对海洋内波参数进行定量分析,本研究基于合成孔径雷达(syntheticapertureradar,SAR)影像中内波明暗条纹的边界特性,提出了一种集成的海洋内波检测算法:主要运用列分离邻域处理和Canny算子边缘检测算法对条纹进行检测
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
近年来,棕囊藻已成为我国北部湾海域藻华发生的主要原因种,严重影响北部湾海洋生态环境、水产增养殖业和防城港核电安全,急切需要对棕囊藻藻华原因种作进一步分析确认。2017
职业教育是教育事业中与经济社会发展联系最直接最密切的部分,推进职业教育改革与发展是实施科教兴国和可持续发展战略的一项重大任务,加快职业教育改革与发展,提高劳动者素质,直
<正>从教多年,常有学生或家长询问如何解答较复杂的分数百分数应用题。这类问题的关键是如何确定单位"1",特别是一道应用题中涉及两个单位"1"该如何帮助学生学习解答呢?这里
会议
介绍了煤系针状焦国内外生产现状,针状焦的成焦机理,生产针状焦的主要工艺技术路线以及几种针状焦的性能对比,最后提出了国内针状焦生产的建议。
利用常规石蜡切片法对胡杨根蘖繁殖特性进行形态解剖学研究。结果表明:胡杨横走侧根的初生木质部为三原型或四原型,周皮中栓内层较发达,由6~8层薄壁细胞组成。横走侧根横切面上
本报讯(李润)今年以来,德江县着力打造一批集种植、观光、科普、休闲体验等于一体的现代高效农业园区,努力把农业园区建设成为农旅一体化的示范区、高效农业高技术农业的展示区、
报纸