Sphinx站内搜索技术在论坛产品中的应用研究

被引量 : 0次 | 上传用户:anran520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,信息咨询、社交类门户、论坛已成为当今资讯的主流载体。门户论坛产品的市场需求量在日益增加,目前较流行的有disuz、 phpwind等。Phpwind是阿里巴巴公司近几年主推的一款集应用、论坛、社交、门户为一体的软件产品。本文作者经历了该论坛产品的多个版本开发与维护。过去老版本的phpwind论坛产品在高负载多并发压力下进行站内搜索的性能效率非常低下,如客户使用phpwind论坛产品建站后遇到日发帖量猛增等突发情况时经常造成服务器瘫痪等严重后果。所以这些弊端造成了该论坛产品发展的巨大瓶颈,在市场激烈竞争中也一度处于略势。如何解决该论坛产品在大数据量高访问负载压力下又能提供快速精准的搜索服务;方便快捷地定位用户所需要的资讯内容的同时又能彻底释放站内搜索业务所带来的负载压力是本论文需要重点解决的问题之一。另外针对过去论坛产品不能进行站内准确定位查询也是本文需要重点解决的问题。1.文本主要的研究成果:本文通过在phpwind论坛产品内部集成了全文搜索技术sphinx的应用并结合搜索体系架构方案图解决了老phpwind论坛产品在垂直搜索时性能效率低下等问题。通过内置多条件下分类信息联动查询算法解决了老phpwind论坛产品在繁多商品信息数据负载压力下不能准确定位查询的问题。2.本文的创新点:本文在phpwind论坛产品中集成分布式sphinx搜索引擎技术解决了在高负载压力下进行搜索业务难与防止单点终端服务器挂机突发情况等诸多问题。同时本文还设计了论坛内存索引处理机制与队列控制技术在增加索引处理与响应时间方面具有一定意义。3.需求分析设计所达到的效果:通过单点sphinx终端技术结合搜索体系新架构图实现了在MYSQL下的百万级数据量论坛站内查询时,响应与返回数据结果时间控制在毫秒级,采用分布式sphinx搜索引擎技术做到了同样在百万级数据量站内进行查询响应与返回数据结果时间控制在微妙级。最后通过在论坛产品中新增分类信息联动查询算法实现了在多条件下进行准确定位查询的效果,同时也解决了老phpwind论坛产品搜索形式单一的问题。
其他文献
本实验应用体外培养方法制备细粒棘球绦虫六钩幼排泄分泌(ES)抗原,应用酶联免疫吸附试验(ELISA)首次对六钧蚴ES抗原的反应原性进行了初步分析。以5μg/ml包被反应板分别与已知阳性、阴性血清;人工
在现阶段我国国民经济和社会发展过程中,我国中小企业在解决居民就业、促进经济增长、缓解国民经济震荡风险、促进技术更新和技术进步等方面有着举足轻重的作用,是我国经济发
目的本研究测定了课题组前期合成、表达的CecropinA-thanatin杂合肽对临床分离的革兰氏阳性菌、革兰氏阴性菌的体外抑菌活性,并通过动物实验,对该杂合肽不同剂量、不同给药途径
切向气流作用下,连续波激光对纤维增强树脂基复合材料的辐照效应研究目前还不够深入。本文对该问题开展实验、理论和数值模拟研究,将空气气流、氮气气流和无气流状态下的辐照效
疲劳驾驶是造成交通事故的重要原因之一。基于机器视觉技术通过对驾驶人面部表情特征的分析可实现疲劳状态的有效估计。由于该方法具有非侵入、准确、实时的特点而成为疲劳驾
乡级土地利用总体规划是统筹城乡发展、协调各业用地的重要依据,是调控用地总量、结构和布局的重要手段,对当地社会、经济发展起到重要作用。乡级土地利用总体规划是现行五级规
目的调查妊娠期甲状腺疾病的患病率,初步探讨妊娠期甲状腺疾病与不良妊娠结局的相关性。方法选择2010年10月至2012年12月期间,在首都医科大学附属北京友谊医院产科门诊进行产前
主要探讨了低容重高强度轻骨料混凝土配合比的设计,着重强调了配制低容重高强度轻骨料混凝土时原材料的选取和配合比的确定,力争以最低的容重设计出符合要求的强度最高的混凝
目的观察特异性CCR3拮抗剂GW766994是否通过拮抗趋化因子CCL11的作用影响阿尔茨海默病(AD)的病理变化。方法在原代海马神经元培养物中应用Western blot、ELISA和体视学细胞计
对近几年的氢化物发生.原子荧光光谱分析法的微量测试应用进行了综述,同时对今后分析测定方法进行了展望.