基于数字指纹的大规模DNA序列索引的永存方法

来源 :第二十届全国数据库学术会议 | 被引量 : 0次 | 上传用户:cser905
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出用分布查询,信息采集和永存索引的方式提高大规模生物数据查询的速度和完整性.1)永存索引和信息采集:为每条查询建立物化表,一般的DNA查询物化表遇到的问题在于:DNA查询串长度差别非常大,而且长度较长,这个长度在20~20K之间.这使得物化表的效率较低,而且需要的存储空间巨大,E.Hunt提出的Persistent Suffix Trees也存在这个问题.本文为解决这个问题,将DNA查询串进行信息摘要,获取其数字指纹.记录每个DNA查询串只需要16字节,而且长度固定.2)分布查询是将没有被物化表记录过的查询计划分解,使之成为在若干台计算机上,采用不同方式,对若干DNA部分的分布查询.
其他文献
兴趣的激发与培养应贯穿于英语教学的始末,这是成功教学的先决条件.对此我们要勤于实践与探索,在实践中探索,在探索中创新,在创新中总结,让整个英语教学充满生机与活力,激起
在本文中采用一新的衍生马尔可夫模型,用于剪切位点的识别.衍生马尔可夫模型利用DNA碱基序列在剪切位点区域的生物特性,根据不同碱基在特殊位点处出现概率的变化,建立非自然
本文将众多的异构生物学数据库集成到一个具有统一的数据模式、遵循共同语义标准的数据仓库中,并形成统一的用户使用界面,实现生物信息智能化的多重、复合和交叉检索和基于高
会议
目前,小学生课堂上被动学习趋势已经越来越严重,为了保证学生能够自主学习,培养学生学习能力越来越成为当今教学的重中之重.
多项式最大公因子(GCD)的计算是计算机代数与数学机械化研究中的关键问题之一.实际应用领域中的计算问题对高性能的并行多项式GCD计算提出了越来越多的需求.本文通过改造多项
会议
教育改革的深化开展下,中职教育改革也如火如荼的实施,计算机课程是中职教育的基础课程,在实际的教学中为能提高教学的质量水平,这就需要采用创新的方式.传统的教学模式已经
近年来,我国小学课堂越来越重视探究式教学,但是,目前在我国的数学教学过程中,很多实施探究教学的学校也存在教师不能有效调控组织,流于形式,学生不能真正成为学习的主人,学
01CS-D600B5数字终端采用高贵的白色作为主色,并配以黑色边框进行点缀,黑白之间相得益彰,让产品充满时尚感。如果仔细观察,该终端犹如一本闭合的书,形象并富有立体感,一股书
本文针对具有稳定内存支持的双CPU系统结构,提出了一种新的实时内存数据库恢复算法.该算法用易失内存做影子区域,并且用两级存储替代了日志和检验点,消除了检验点对事务正常
会议
解放军杭州血站隶属于解放军117医院,成立于2001年,是首批通过全军采供血机构认证的单位之一。近年来,血站抓住机遇,开拓创新,发展迅速,从一个单纯的血液供应科室建设成为集