论文部分内容阅读
人类基因组计划实施以来已积累了海量的生物序列数据。随着现代生物技术的快速发展,高通量检测工具日趋完善,后基因组研究的瓶颈已不再是生物序列数据的产生和获取,而是如何对现有的生物序列数据进行有效的信息挖掘和分析。只有利用新的、有效的数据挖掘和分析工具才能从海量的生物学数据中提炼出有用的生物学知识,才能弄清楚它们所蕴含的结构和功能信息,进而彻底了解它们所表达的生物学意义。模式识别技术是揭示核酸和蛋白质序列数据中所蕴含的生物学意义的基本方法之一。其出发点是找出不同序列间的相似片段,从而归结出序列