论文部分内容阅读
目的:应用SAS软件进行数据挖掘,系统阐明幽门螺杆菌(H.pylori)CagA序列多态性及其特性。方法:采用SAS软件数据加工整理技术与生物信息学软件序列分析比对相结合的方法,对NCBI、swiss-prot/tremble、DDBJ三大蛋白数据库有关CagA蛋白序列数据进行整理,建立含97条完整序列及268条3端部分序列的数据仓库.并对其进行多态性分析。结果:通过SAS程序对数据的整理加工后观察、统计分析.明确了可变区的位置及长度,准确地得出了EPIYA基序的重复频率、多态性及概率分布,EPIYA基序