论文部分内容阅读
随着网络的普及,Internet上存在越来越丰富的史学信息,历史研究工作者和历史学家们通过网络获取所需要的信息,但同时也面临着Web上信息不断地快速增长所带来的海量数据的挑战。要真正从海量数据中获得有价值的信息和知识,就必须运用现代化的信息技术手段,改变传统历史研究工作的形态,使数据和信息发挥出更大的作用。借鉴现代信息技术、智能技术和计算机技术,实现历史学研究定量化、信息化和智能化,将是历史研究工作的必由之路。搜索引擎自问世以来迅速成为人们获取网络信息不可缺少的助手,并成为互联网的主要入口。目前,用户主要使用传统搜索引擎获取Internet上史学信息,如百度、Google等。传统搜索引擎的优势是提供统一的界面,用户仅需要通过关键词就可以进行查询,大大降低了用户的使用难度。使用传统搜索引擎搜索史学信息,优点是具有很高的查全率,缺点是检索结果过于庞大,用户难以快速准确地找到自己所需要的信息。尤其是针对历史方面的研究,这种知识具有很强的领域性,传统的通用搜索引擎会得到很多无关的信息,为用户自身领域知识的学习带来麻烦。在辛亥革命百年之际,本文以辛亥革命史为研究对象,设计并实现了一种基于本体的搜索引擎。围绕着基于本体的搜索引擎的设计与实现,本文完成了如下工作:(1)在Nutch的基础上对与辛亥革命相关的网络数据进行爬取,为辛亥革命的研究提供网络数据支持。(2)构建辛亥革命本体库,为辛亥革命的研究提供领域知识基础。(3)辛亥革命本体的检索,作为对网络数据检索的补充,使得搜索结果更加的精确。(4)辛亥革命本体的推理,揭示更深层次的关系,为更专业化的用户服务。(5)本体检索和推理结果的可视化,提供更加直观的搜索结果。(6)对日志信息进行分析,找到用户关注的热点以及热点变化。