论文部分内容阅读
随着技术手段的不断发展,以基因组学为代表的生物学研究产生的数据,正在发生爆炸性增长。这对于数据的分析、管理和整合来说,成为了全新的挑战。传统的以手工或单独程序进行数据分析的方法,已经无法满足不断增长的数据与分析需求。因此,开发大规模、整合性和自动化的分析工具,已经成为生物信息学这一交叉学科关注的热点和未来发展的必然趋势。此外,随着信息技术的发展,各种新一代的网络技术和应用层出不穷。网络是数据进行交换和共享的理想载体。对于生物学研究来说,网络的重要性表现为,如果缺少了网络,研究者几乎不可能完成任何研究工作。以Web2.0和大数据分析为代表的新一代网络技术正在改变网络本身的运作方式和人们利用网络的方式,同时也正在影响着整个生物信息学的发展方向。是否能够充分且合理地利用Web2.0和大数据分析技术的优势,将其应用到生物信息学的分析与整合之上,显著地决定了生物学研究的效率,并影响着数据增长与分析能力之间的平衡。在本研究中,我们以进化相关分析为起点,设计并实现了基于Web2.0技术的在线进化分析工具集EvoME,该名称来源于Evolution和Made Easy的组合,寓意为“让进化变得更简单”。EvoME使用Java语言和GWT框架进行开发,主要包括了Ka/Ks进化选择压力计算、进化树计算和进化树可视化三个核心功能。EvoME结合了新的交互式网页技术AJAX的优势,集成了包括KaKs Calculator、 ClustalW、PhyML、MEGA、BEAST等多种进化计算程序,为它们添加了用户友好型的任务向导,并完全自主开发了进化树可视化与注释工具EvolView,初步实现了在Web2.0框架上进化分析功能的整合与优化。在本文中,我们从技术和应用两个层面上来详尽解析EvoME系统的设计与实现,以充足的理由来证明,与传统的在线工具相比,EvoME具有技术、设计和整合上的三重优势,并验证了新一代信息技术在生物信息学上应用的可能性,展望了其良好的研究和应用前景。在未来,EvoME的功能将不只限于进化分析。在研究计划中,EvoME将实现通用化的流程自定义与控制系统,允许研究者将任意程序自由组合,构建自定义分析流程,满足多样性的分析需求;同时,EvoME也将集成大数据加速与分析功能,加速相关研究,并提出宏观性的建议和指导,为相关生物学研究提供更为有效的支持和帮助。EvoME系统的测试版网址为:http://www.evome.org