论文部分内容阅读
毒力岛是病原菌的主要元件,病原菌导致疾病是由其上的毒力岛引起的,毒力岛存在于多种动植物病原细菌中,对细菌的毒力变异、遗传进化甚至新病原亚种形成有重要意义。在病原菌基因组中毒力岛是一段外源DNA序列,通常毒力岛通过水平转移插入基因组序列中。典型毒力岛的结构包含毒力基因、整合酶基因、插入序列、同向重复序列等。此外,它的G+C含量、密码子使用与宿主基因组不同。
本文首先从病原菌与相关疾病、相关菌株的基因组、毒力岛序列、相关网站和文献四方面搜集资料建立了毒力岛数据库,并做了毒力岛数据库主页界面。接着利用fisher判别分析法对大肠杆菌CFT073、猪霍乱沙门氏菌SC-B67、沙门氏菌CT18、鼠伤寒沙门氏菌LT2、金黄色葡萄球菌MU50、霍乱弧菌六种病原菌的毒力岛进行识别,为了训练识别算法,将正负样本分成十份,取其中九份作为检验集。训练结果显示,霍乱弧菌的识别率高达94.1[%],金黄色葡萄球菌的识别率达到84.8[%],即使是最低的鼠伤寒沙门氏菌识别率也达到了73.5[%]。利用得到的判别标准对检验集进行检验,结果表明该识别算法对这六个病原菌毒力岛基因都具有较高识别率,从而证实了我们的识别算法对毒力岛识别良好的识别结果。
通过Mosaik和Velvet拼接软件对酵母测序序列进行拼接,拼接结果显示,Mosaik对Y12671和Y50049的拼接覆盖度都在90[%]以上,拼接效果良好。Velvet对序列拼接可以通过调整参数使拼接的长度增加。