【摘 要】
:
基因组序列拼接的主流方法是将整条序列随机打断成小片段,然后根据片段间重叠关系连接成长序列.由于较多噪音存在,算法复杂度高,加之生物数据的海量增长,序列拼接处理导致巨
论文部分内容阅读
基因组序列拼接的主流方法是将整条序列随机打断成小片段,然后根据片段间重叠关系连接成长序列.由于较多噪音存在,算法复杂度高,加之生物数据的海量增长,序列拼接处理导致巨大的时空开销而无法完成.本文提出一种基于最大频繁序列模式的聚类算法,将整个数据集分成若干个子集,分别高效地处理,实现了一个基因拼接网格系统、透明动态的资源管理,大大扩展了基因拼接计算能力.基于最大频繁序列模式聚类算法及挖掘算法,针对生物数据的特性做出了优化.
其他文献
美国的图书馆事业非常发达,特别是大学图书馆更被誉为“学校的心脏”。本文以南达科他州立大学为例,在介绍该校图书馆的一些基本情况的基础上,着重介绍了图书馆所开展的各项服务
提供灵活、动态、一致和开放的数据集成模型对于通过集成异构信息资源,实现大规模企业信息系统至关忠?本文以中介模型为基础,提出了一种基于发布/订阅通信的动态数据集成模型
阐述了嵌入式移动数据库的概况和技术现状,特别针对移动计算的特殊性分析了关键技术的差异与联系,提出了进一步的研究趋势.
以往算法的研究主要围绕着减少候选项目集进而减少事务数据库的扫描次数的角度,先求出候选项集,再计算候选项集的支持度求得频繁项集.本文改变过去求频繁项集的角度,从新的角
在强调新书阅览室的重要性和必要性的基础上,针对目前存在的问题提出了一些解决措施,并就如何完善新书阅览室阐述了看法。
步态识别作为一种新的生物特征识别技术,通过人走路的姿势实现对个人身份的识别和认证。算法利用步态轮廓图像边界到重心的距离矢量对步态轮廓图像进行描述,采用步态图像的高宽比进行步态的准周期性分析。利用隐马尔可夫模型进行步态时变数据匹配识别。算法在CMU数据库上面进行实验取得了较高的正确识别率。
使用不同类型的中间件实现了开放动态环境中的软件服务.客户方的应用需要采用灵活的方法来发现并绑定这些服务.本文提出一种基于移动agent的反射式异构协同机制,它通过动态加
石油人才是石油工业的人才资源,是石油工业的主力军,石油人才的培养,离不开对文献的需求。本文从石油合作教育的角度,探讨了图书馆如何参与教学改革,开发文献资源,为石油合作
概括介绍了美国,前苏联提高原油采收率技术的现状及特点,美国CO2混相驱已成为增加可采储量的主要方法,预计采收率可增加7 ̄22%,聚合物驱技术成熟,产量增加占化学驱的93%以上,效果明显,前苏联在化