基于Nutch技术的辛亥革命本体搜索引擎的设计与实现

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:x111678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的普及,Internet上存在越来越丰富的史学信息,历史研究工作者和历史学家们通过网络获取所需要的信息,但同时也面临着Web上信息不断地快速增长所带来的海量数据的挑战。要真正从海量数据中获得有价值的信息和知识,就必须运用现代化的信息技术手段,改变传统历史研究工作的形态,使数据和信息发挥出更大的作用。借鉴现代信息技术、智能技术和计算机技术,实现历史学研究定量化、信息化和智能化,将是历史研究工作的必由之路。搜索引擎自问世以来迅速成为人们获取网络信息不可缺少的助手,并成为互联网的主要入口。目前,用户主要使用传统搜索引擎获取Internet上史学信息,如百度、Google等。传统搜索引擎的优势是提供统一的界面,用户仅需要通过关键词就可以进行查询,大大降低了用户的使用难度。使用传统搜索引擎搜索史学信息,优点是具有很高的查全率,缺点是检索结果过于庞大,用户难以快速准确地找到自己所需要的信息。尤其是针对历史方面的研究,这种知识具有很强的领域性,传统的通用搜索引擎会得到很多无关的信息,为用户自身领域知识的学习带来麻烦。在辛亥革命百年之际,本文以辛亥革命史为研究对象,设计并实现了一种基于本体的搜索引擎。围绕着基于本体的搜索引擎的设计与实现,本文完成了如下工作:(1)在Nutch的基础上对与辛亥革命相关的网络数据进行爬取,为辛亥革命的研究提供网络数据支持。(2)构建辛亥革命本体库,为辛亥革命的研究提供领域知识基础。(3)辛亥革命本体的检索,作为对网络数据检索的补充,使得搜索结果更加的精确。(4)辛亥革命本体的推理,揭示更深层次的关系,为更专业化的用户服务。(5)本体检索和推理结果的可视化,提供更加直观的搜索结果。(6)对日志信息进行分析,找到用户关注的热点以及热点变化。
其他文献
车载网络是近年来快速发展的一个研究领域,其广泛应用使道路上行驶的车辆之间不再是一个个的独立个体,而是整体通过车载网络有机结合在一起的自治系统。车载网络通过车辆节点
近年来,随着科技的发展,医疗技术也在快速的发展。数字化医学图像采集设备不断更新,CT、MR等设备的普及,使得医院每天产生大量的医学影像数据,医生的工作量越来越大,在紧张与高强度
近年来,随着数字音乐创作、收集以及存储技术的快速发展,许多机构积累了大量的音乐音频数据。随着英特网多媒体资料的蓬勃发展,如何对这些音频资源进行有效地组织和管理,使得
咳嗽作为呼吸系统疾病最常见的症状,其频率、强度、种类、持续时间等参数为临床提供了重要信息。现阶段在对咳嗽评估时通常只是根据病人的主诉,缺少客观测量及定量评估的标准
当前,World Wide Web已经成为世界上最大的、类型最齐全的共享信息的载体。在互联网为用户提供丰富、快捷的信息的同时,也造成了信息过载的问题。World WideWeb中的网页信息
群搜索算法是一种新兴的群智能优化算法,源于对群居动物如狮子、鱼、鸟的觅食行为的模拟。该算法基于PS模型,并在此基础上引入了游荡者策略和动物视觉搜索机制,实现简单,且拥
论文综述了虚拟手术系统的结构和构成模块。在此基础上,对构成虚拟手术系统的关键技术进行了深入研究和探索。
智能手机及车载传感设备的普及为大规模信息收集提供了极大的便利,涌现出大量创新性的应用和服务。移动群智感知MCS是以人为中心的感知,利用移动用户携带的智能感知设备感知
伴随着3G在全球已经规模的进入商用阶段,紧跟着高速分组接入(HSPA)技术的问世,大大提高了数据的传输速率。为了更进一步满足无线移动带宽的需要,3GPP又开始了通用移动通信系统(U
计算机行业的发展已逐渐把我们的社会转向了一个信息化、智能化、多元化的社会,无论是在生活、工作还是科学研究方面都渗透着计算机的影响。正是因为计算机的出现,我们的生活