基于信息自动获取构建生物信息平台及序列比对算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:dfhjaljgjre
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪是生命科学的世纪,近年来生物信息学得到了前所未有的发展。生物信息二级数据库是生物信息学中的一个重要研究方向,由于生物信息数据的复杂性及其分析应用的复杂性,至今没有一种比较通用的构建模型能够满足一般性生物信息二级数据库系统的开发需要。序列比对是生物信息学中一个非常重要的操作,是基本的处理信息的方法。将大量累积的核酸和蛋白质序列进行比对,对发现生物序列的功能、结构和进化信息具有重要的意义。 本文对生物信息学的发展、研究内容、生物数据库做了简单的介绍,对序列比对的各种算法:点阵法、动态规划全局比对算法、Smith-Waterman算法、FASTA算法、启发式BLAST算法等做了简单描述,并分析了序列比对研究的目的及其意义。 本文利用.NET、XML和Web Services相关技术,实现了一种建立生物信息学研究平台的框架体系。该平台可自动从Intemet获取生物信息数据并建立本地二级生物信息数据库。重点介绍了用WebClient类的方法提取分析网络数据库资源并创建本地二级生物信息数据库;用ASP.NET和ADO.NET实现了对此二级数据库的查看、查询等操作;使用XML保存从Web站点上下载的数据;用Web Services技术封装序列对比算法,可从客户端直接调用。此系统在.NET技术上采用Web信息自动获取并结合Web services技术有助于二级数据库开发人员在海量的信息源中迅速找到真正需要的生物数据信息,并灵活地加以应用,从而将更多的精力集中在更纯粹的生物信息处理上来,并可以通过Web的方式向Internet用户提供方便、有效的公共生物信息技术服务平台的各类资源。 本文还在BLAST部分算法的基础上,基于十六进制编码序列和寻找最优可变窗口大小的思想,提出了一种相似核苷酸序列搜索算法SLAHAW。本算法采用十六进制编码存储序列,通过序列片断相似度得到最佳搜索窗口值,从而提高搜索速度和准确度并且节约了存诸空间。建立出实验环境和实现了相应算法,通过实验证明在序列满足相似度的情况下,SLAHAW是一种快速而有效的相似序列片断匹配算法。
其他文献
分离关注点原则是软件工程中最要的原则之一,然而随着软件复杂度的不断提高,传统的分离关注点技术只允许按照一种方式分解系统越来越显出了弊端,越来越多的关注点得不到有效分离
生物网络中基于拓扑特性识别关键基因对于深入了解生物体的致病机制至关重要。针对不完整相互作用网络(如Human网络)中,通过网络中心性识别关键基因效率低的问题,本文从多层
随着计算机硬件、软件技术的飞速发展和计算机系统在各行各业的广泛应用,数据已经成为各种机构的宝贵资源,数据库系统对于当今科研部门、政府机关、企事业单位等来说都是至关
基于角色的访问控制(Role-Based Access Control,RBAC)是目前访问控制技术的研究热点之一。它可以成功地降低大型网络应用安全管理的复杂性和花费。但目前多数对于RBAC的授权
随着网络资源数量和种类的增多,网络规模不断扩大,网络结构日益复杂,如何对大型异构网络进行简单有效的管理是当前网络管理技术面对的主要问题。传统网络管理技术依赖于底层平台
传统汽车仪表检测主要以人工方式进行:检测工人设定仪表的频率参数,人眼观察指针所指的位置以判断仪表是否合格。这种检测方式严重依赖人工,可靠性不高,效率低下,不适应现代
在Internet技术迅速发展的今天,益智游戏在儿童教育中发挥了举足轻重的作用。本论文着眼于协同益智游戏的研究,旨在有效开发儿童智力的同时,培养儿童的团结协作精神,从而促进
计算机和互联网技术正在改变着人类社会的面貌,伴随而来的是信息安全问题。目前的安全技术如加密、防病毒、防火墙、入侵检测等功能过于单一,从而无法满足安全要求。对于最常
随着多媒体技术在无线移动自组网环境中的应用需求越来越多,无线移动自组网的QoS路由协议的研究日益显示出了其重要性。 在众多的Ad hoc网络协议中,FSR路由协议以它简洁的算
随着互联网的不断发展,人们可以从中获得越来越多有价值的信息,并且这些信息的数量仍在迅速的增长。按照信息的“深度”,可将互联网分为Deep Web和Surface Web。相对于Surface W