基于Linux多功能信息检索代理的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qq540531049
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索是我们在使用计算机工作中非常重要的一项应用,它的功能和使用情况体现了一个计算机工作者的工作效率。本文参考windows操作系统下的百度硬盘搜索,完成了linux操作系统下的多功能信息检索代理的设计和实现,实现了基于全文检索的本地文件搜索和基于WEB的电子词典查找功能。本文首先对Linux下现有桌面搜索软件以及常用电子词典做以对比,阐述信息检索对Linux操作系统用户的意义,并分别介绍了该代理使用到的各种技术。然后分别对本地全文检索、Web电子词典和代理服务器端的设计与实现进行了详细的阐述。全文检索部分主要实现了本地文档的索引的建立、分词、倒排以及快照的组织以及快速查找算法,该部分的重点在于海量关键词的查找,倒排信息的组织查找,快照信息的组织及查找。Web词典接口查询算法部分通过http协议查找在线词典库,根据StarDict字典的格式,设计了单词搜索算法,并完成了与本系统的接口,重点在于充分利用web在线词典库的现有资源。WEB代理服务器端算法主要使用伯克利套接字搭建Web服务器接收用户请求;采用线程池技术来处理海量用户请求;应用层协议采用HTTP1.1协议,HTTP请求头信息的处理。
其他文献
无线传感器网络作为一种新型的数据采集和处理手段越来越受到人们普遍的重视。作为一种全新的计算模式,无线传感器网络利用众多分布在物理环境中具有感知、计算和通信能力的
语义Web是当前web的扩展,它已经成为当今科学活动中必不可少的部分。其中的语义信息与人们广为接受的本体相关联,更有助于计算机之间以及计算机与人之间的协同工作,它可以用RDF
随着信息技术在海洋相关行业的广泛应用,信息安全在海洋业务的应用中起着更加举足轻重的作用。信息安全问题严重威胁海洋业务系统的安全和正常运行,并影响着海洋信息化的实现
随着非线性动力系统领域研究的深入,各国学者陆续发现新的混沌系统,但对混沌系统族群的演化和形成问题的研究较少。目前,对混沌同步和混沌保密通信系统的研究,集中在有限几个信道
随着科学技术的迅猛发展,各项识别技术被人们广泛关注。人脸作为区分人类特征的重要标志,其关注度近年来显著提高。人脸识别技术具有高稳定性、较强的直观性以及快捷安全的特
随着科技和社会的快速发展,学术领域也趋于信息化。互联网检索成为广大学者获得相关信息的重要途径。因此,如何在电子知识库中快速、准确的寻找到自己所需要的科技论文成为众
人脸识别技术作为生物识别技术的研究内容之一,是模式识别、人工智能及计算机视觉等领域中的一个前沿课题。同利用指纹、手形、视网膜、签名、声音、虹膜等其他特征进行识别
随着互联网技术的发展、智能终端的普及以及多种社交平台的出现,人们会参与到不同种类的社交网络中,这导致只研究一个社交网络向用户进行实体(用户、商品、位置等)推荐的方法
知识编译作为自动推理技术的一个方面,通常用来处理命题逻辑知识库,其基本思想是将给定的知识库转换成范式的形式,从而提高对命题的查询效率。最初,这种技术被广泛用来处理命
随着人们对互联网深层信息需求的扩大,对Deep Web数据的研究日益增加,Deep Web数据集成已经成为当前信息领域的研究热点问题,而模式匹配作为数据集成的前提和基础,更是广泛应