基于Sphinx构建Web站内全文搜索系统的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:lxfsb001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对传统的信息检索技术的研究反映了人们很早就开始注意对信息搜集与使用的研究。随着人类社会进入信息时代,信息以爆炸般的速度增长,各种信息充斥了人们的生活空间。在这种情况下,如何快速有效找到有用的信息成为一个重要课题。 对于一个拥有大量数据的网站来说,定制自己的站内检索机制是克服通用搜索引擎索引范围不全、更新周期慢、不能定制等缺点的最佳方法。随着网站内容的不断丰富,站内搜索逐渐成为继通用搜索和行业搜索之后的又一个热点,其应用价值日益引起IT界的重视和关注。 本文在研究Web搜索引擎的基本原理、核心技术和处理流程的基础上,结合站内搜索的个性化需求,设计并实现了一个高效的Web站内全文搜索系统。不仅完成了整个站内搜索引擎框架的设计,而且给出了系统主要部分的实现。 本文论述了国内外搜索引擎的技术发展现状,并对目前常见的站内搜索技术进行了分析比较。之后在对Sphinx全文检索软件包进行介绍的基础上,结合目前很多网站的构建都是采用广为流行的基于开放源代码的LAMP(Linux+Apache+MySQL+PHP)技术实现的现状,借助第三方的Sphinx软件包和LibMMSeg软件包设计并实现了一个高效的Web站内全文搜索系统。这种通过集成Sphinx来为基于LAMP技术的网站提供站内搜索的方法具有很好的通用性,借助该方法,我们不仅可以在网站构建时就直接实现站内搜索引擎,而且也能在不对现有网站的原有架构进行修改的情况下便捷地为网站提供一个性能优越的站内搜索引擎。
其他文献
视网膜色素变性(RP)是一种进行性的视网膜退化疾病,具有家族遗传性,以感光细胞的功能丧失和逐渐凋亡为主要病因,在人群中的发病率为1/3000~1/7000。RP具有高度遗传异质性,目前已有
功能化磁粒因其独特性质近年来受到广泛关注。通过共聚、表面改性等途径,将非磁性的功能材料修饰到Fe3O4磁性核心的表面,在保护磁核心的同时,赋予其表面多种反应性官能团。而且
研究表明,多输入多输出(Multiple Input-Multiple Output,MIMO)系统能充分利用空间资源,在不增加系统带宽和天线总发射功率的情况下,可有效对抗无线信道的衰落,从而提高系统
学位
学位
氨氧化作用作为硝化过程的第一步,是氮素生物地球化学循环的关键步骤,氨氧化细菌中的变形菌纲β和γ亚群一直被认为是氨氧化作用的主要承担者。然而,近年来在环境基因组学研究上
红树林是生物多样性高度浓缩的海岸生态关键区域。由于土壤营养贫瘠,红树林生态系统的建设与维护问题至今仍处于瓶颈。深圳湾红树林位于亚热带海岸潮间带,其沉积物和海水的总磷
鳞甲目(Pholidota)是脊椎动物(Vetebrate)哺乳纲(Mammalia)下的一个分类阶元,由几种已灭绝的化石穿山甲和8种现存穿山甲组成。马来穿山甲(Manis javanica)是其中的物种之一。 
目的 估算北京市2018-2019流行季流感的发病率和住院率.方法 基于北京市昌平区和怀柔区的流感样病例(influenza like illness,ILI)监测、流感病原学监测、住院严重急性呼吸道
随着科学迅猛发展,人类基因组已经被逐渐破译,构成生命的图谱会呈现在人类面前,采取基因制造药物治疗更多的疾病已经不是一种向往。当代人类的计算机科学也在日新月异的变化,生物
研究植物致病性细菌生物学特性是了解植物细菌性病害发生机理、建立有效的检测和控制的基础。菌株ABB是1株新分离的可引起红掌细菌性叶斑病的植物致病菌,本论文主要开展其鉴定