论文部分内容阅读
随着科学技术特别是计算机网络与信息技术的迅猛发展,科研环境和科研过程发生了很大的变化。由于科学研究的问题空前复杂化,科研过程中对数据和信息的获取和处理显得越来越重要。为了更好地对研究对象进行分析、发现和预测,也要求科学家之间更加密切地进行交流和合作。e-Science技术正是在这一背景下诞生的。它的出现,为各种不同类型、不同角色的研究人员能够较为有效地在浩如烟海的信息中获取和掌握所需信息、进行协作研究和资源共享、合作地使用并创造知识,提供了有力的支持。本文的工作基于东南大学计算机科学与工程系同生物医学工程系合作进行的DrSNPGrid项目,这一项目旨在结合网格计算和语义Web技术为生物医学研究者构建一个e-Science环境,使他们能合作地开展生物芯片试验,共享分布的数据、信息源,从中获取相关知识,并进一步指导SNP(Single Nucleotide Polymorphisms,单核苷酸多态性)与疾病相关性的研究。网格portal是基于Web的网格使用环境,是DrSNPGrid系统的重要组成部分。本文作者所承担就是DrSNPGrid portal的研究和开发工作,包括前期调研、总体设计、语义网格portal中信息获取及相应的个性化机制的研究、以及原型系统的部分实现。本文论述了作者在这些方面的工作,主要内容如下。本文从讨论portal及其演化发展入手,探讨了网格环境下portal的意义,总结了国际上网格portal方面的研究成果及技术路线,全面研究和分析了基于portlet面向服务的网格portal架构,在这一架构的基础上进行了DrSNPGrid portal的总体设计。为了方便用户获取相关知识来指导SNP的筛选及芯片试验,进而发现SNP与疾病的相关性,DrSNPGrid系统将网格中异质的数据、信息资源构建成一致的本体化的知识库。就该类型知识库,本文探讨了如何将语义Web技术应用到portal系统中来,方便用户在知识库中进行浏览和查询,进而提出了一种本体驱动的信息获取机制。对于浏览而言,本文的方法结合了本体可视化技术以及本体查询语言,能利用本体化的知识帮助用户找到感兴趣的信息,也能使用户依据语义关联由某一信息导航到另一信息,并且在向用户呈现信息时能考虑用户先前浏览动作的累积作用或者表现出的“隐含意图”。对于查询而言,本文提出的图形化查询界面能让用户自由的表达查询需求,并得到正确的查询表达式,而不必熟悉本体查询语言的语法规范和语义,同时,它还能让用户表达对于关系的查询。这一信息获取机制也适合于一般的语义信息portal。个性化是portal的基本特点之一。本文全面讨论了网格portal中的个性化问题,设计了多样的个性化服务来满足不同的个性化需求。特别是针对用户在知识库中获取知识时的个性化需求,提出了一种本体驱动的个性化服务机制,这一机制能让用户浏览时能最先看到他感兴趣的内容,并且使得返回给用户的查询结果也是根据与其偏好的密切程度排序过的。此外,本文针对实际应用中所要考虑的基本问题,如portal的安全管理、单点登录、访问控制及用户管理等,进行了分析并给出针对性的解决方案。在本文的最后,对portal原型系统的开发与部署方面的主要工作(包括所使用的工具、技术、方法)进行了总结与介绍。