论文部分内容阅读
基于LZ复杂性距离提出了一种非比对的蛋白质三维结构比较方法.该方法以蛋白质结构单元间的条件LZ复杂性为特征参数,根据条件LZ复杂性计算LZ复杂性距离来作为蛋白质三维结构(不)相似程度的定量刻画.该方法可在二次多项式的时间限度内计算完成.蛋白质的结构数据采用接触图的表示方式,以避免PDB格式数据中的非结构信息和不同坐标系对结构比较的影响.以真实的蛋白质三维结构数据所组成的5个数据集为实例,基于LZ复杂性距离对各数据集中的蛋白质单链进行了结构聚类.聚类的结果符合各蛋白质单链在传统的结构分类数据库中的分类,表明