论文部分内容阅读
随着信息技术的不断发展,Web上的信息资源正在以前所未有的速度增长。面对Web这个巨大的知识海洋,用户在寻找自己所需要的信息时往往显得束手无策。搜索引擎由于其所具有的方便、快捷的特点,逐渐成为用户在Web上进行信息检索的主要工具。首先,针对传统搜索引擎在信息检索的精度(precision)、召回率(recall)、以及使用的方便性等方面存在的不足,作者对Web信息检索系统的检索方法和基本结构进行了仔细的分析研究,并完成了下述研究工作:为了改进搜索引擎的性能,作者将Web上的资源分为了三类:网页资源、多媒体资源和网站资源。根据W3C所提供的RDF资源元数据规范,采用XML的形式给出了三类资源的元数据描述文件及其自动生成方法。用资源的元数据来代替资源进行信息存储,大大减少了搜索引擎中的数据存储量,方便了信息的检索,并且支持了对多种资源的检索。普通的搜索引擎由于其结构和所存储数据等方面的限制,使其不能很好的解决在数据采集、数据存储、信息查询以及查询结果排序等方面所存在的问题。为了从结构方面对普通搜索引擎进行改进,作者设计了基于RDF元数据搜索引擎的基本结构。普通搜索引擎在进行信息收集时一般采用集中式的信息收集方法。集中式信息收集在信息收集的速度和性能等方面都不如分布式信息收集。作者介绍了在基于RDF元数据搜索引擎中所采用的分布式信息收集方法。分布式信息收集方法和资源元数据技术相结合可以大大减少网络上的信息流量。作者在对大量用户使用搜索引擎进行信息检索的模式进行观察和分析后,提出了一种基于关键词扩展的检索模式,给出了基于资源元数据库对关键词进行扩展的方法,并且设计了采用此检索模式搜索引擎的界面。这种检索模式更加符合用户检索信息的习惯,能够引导用户准确完整的提出自己的信息需求。此外,在当前的Web应用设计开发中,主要是以网页为基本单位对信息进行组织。采用这种方法进行Web应用开发的效率低下,并且后期的修改维护工作量巨大。针对Web应用设计开发所存在的问题,作者提出了一种模块化的网页设计及浏览技术。采用这种设计技术可以对信息进行高效的组织和维护,提高了Web应用设计开发的效率。在浏览时通过让网页上比较重要的部分首先出现在用户面前,提高了网页浏览的性能对于复杂网页浏览中所存在的问题进行了分析,提出了将一个复杂网页按其内<WP=5>容组成多种模式的新思想,引入了模式化的网页浏览技术,使网页浏览速度有明显改善,有效减少了网络传输时间。论文所做的研究工作,对进一步改善Web性能和进行检索技术的优化研究,具有一定的学术意义和较好的实用参考价值。