基于频繁模式的蛋白质序列分类

来源 :2005中国计算机大会 | 被引量 : 0次 | 上传用户:lcc2451
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质序列的分类是预测新蛋白质序列的结构和功能的重要方法。已有的方法主要基于序列比对或概率后缀树。本文设计了一种基于频繁模式的蛋白质序列分类算法 CFS。我们使用每类数据独有的频繁模式代表该类,然后应用各类的频繁模式对测试数据进行分类。实验结果表明 CFS 方法在分类精确度方面优于目前公认最好的基于概率后缀树 PST 方法,而且在CFS 方法中每一类数据都是通过该类独有的频繁模式作为类代表,这样使得分类更直观,更易于理解,而且更具有生物信息学意义。
其他文献
实验采用聚丙烯酰胺(PAM)、聚合氯化铝(PAC)、聚合氯化铝铁(PAFC)三种絮凝剂,结合超声波工艺,考察絮凝剂与超声波结合对石化厂剩余污泥脱水效果的影响。结果表明,将PAM 分别与PA
会议
在铁铬铝合金片载体上,水热法原位合成了MCM-22 沸石膜,探讨了成膜的影响因素。结果表明,载体预处理条件不同,载体表面性质不一样,对合成沸石膜的质量有较大的影响。载体的表面缺
会议
本文介绍了 102-J 型原料气压缩机原浮环密封结构及存在的问题,简要阐述了串联式干气密封的工作原理,以及串联式干气密封和其测控系统在 102-J 原料气压缩机上的成功应用。
本文论述了DFLIV 分布式图形系统为流行 3D 图形工具集 FL-Inventor 分布式扩展,此系统为以分布式场景图作为数据分布基础、FL-Inventor 通知机制作为通信基础而构建的分布式
选育高效利用木糖生产酒精的菌株一直是利用木质纤维素生产燃料酒精的难点和关键问题。本实验从自然界中筛选出一株能利用木糖产酒精的菌株1125-3。菌株1125-3 可以快速有效
采用P2P方法构建资源管理和任务调度模型是目前网格研究的前沿和热点领域,但目前的P2P研究多集中在静态文件的搜索和调度领域,本文分析了当前主流P2P资源发现算法的优缺点,针对
会议
一九四七年诺培尔化学奖金,经诺培尔奖金董事会开会议决,因为英国劳平孙爵士在第二次世界大战期内,对于研究综合制造配尼西灵,很有功绩,所以就把这奖金赏给了他。劳干孙爵士
目前基于硬件性能监视计数器的程序性能测试与分析正在逐步成为现代性能分析的基础。同时,为方便用户安全地访问这些底层硬件计数器,可供用户程序调用的接口软件包被大量开发出
会议
对于一个命题逻辑 P ,如果存在一个函数rank : HP → N(其中 HP 是 P 上的原子集合),使得 P中每一条形如 a ← a1,...,am,not(b1),...,not(bn) 的子句,对于任意的 (1≤ i ≤ m,1≤
会议
GVF Snake 动态轮廓模型是提取图像中物体轮廓的一种有效方法,较好地解决了传统Snake 模型中存在的轮廓线初始化、检测“U 型”物体轮廓等问题。本文在详细分析 GVF Snake 模