论文部分内容阅读
随着互联网上的信息量越来越大,搜索引擎已经成为检索网络信息不可或缺的工具。然而日益增长的电子信息量使得目前的通用搜索引擎越来越不能满足用户精确检索信息的需要。 本课题研究的目的在于将语义网思想和垂直搜索技术相结合,为实现精确搜索探索新的途径。 语义网文件具有半结构化的特性,本文从这种结构特性出发详细设计了基于语义网的垂直搜索引擎的主要功能模块,达到内容级精确搜索的目的。 本文以上市公司金融年报为语义网基本内容,初步实现了一个基于小规模语义网的搜索引擎,用户在输入查询关键字之后能够得到一系列包含用户可能感兴趣的内容段,并可以针对金融年报的数据信息进行数字比较搜索。 本文的研究内容主要包括以下几个方面:(1)分析构建小型金融年报语义网的方法。 (2)研究在语义网环境中基于XML文档的搜索引擎的设计方法。(3)详细分析和设计搜索引擎的索引模块和搜索模块。 (4)通过试验分析语义网搜索引擎的优势和不足。 本文通过试验初步实现了上市公司年报语义网搜索引擎的主要模块,并对其性能进行了分析。对语义网络搜索引擎的工作原理和实现进行了探索。