论文部分内容阅读
随着网络的发展和信息化进程的加快和深入,越来越多的电子商务网站的出现成为一种新的趋势,而且随着这样的网站的规模越来越大,网站的数据量也越来越多,致使用户要在这些数据中找出自己感兴趣和满意的信息就越来越困难。这样,人们检索信息的需求就不仅仅满足于通用的搜索引擎,更需要针对特定领域设计出个性化搜索引擎。
本文主要研究应用于易货交易网站内的个性化站内搜索引擎相关的技术和方法,此种易货网站的注册用户特点是均为有行业背景的企业用户。针对用户对搜索引擎个性化服务的需要,作者阐述了一种个性化站内搜索引擎的实现思想:利用隐式搜集和显式搜集相结合的方法来搜集用户信息,显式搜集体现在基于企业注册用户的注册详细信息的行业背景计算相关词权重;隐式搜集体现在采用Ajax技术跟踪搜集用户行为信息,根据用户的历史记录建立用于存储用户兴趣信息的用户个性化信息文件。在计算关键词与文档相关度方面,对于空间向量模型进行改进,在用户个性化信息文件的基础上计算关键词和文档的相关度,使得查询结果更加符合用户实际需求,提高系统的商品成交量。通过分析国内外关于个性化搜索的著作,在Lucene原有基础排序算法的基础上,结合PageRank算法的思想和根据用户个性化重新计算关键字权重值,提出一种更加适合本论文实际应用的个性化排序算法,反馈给用户符合其用户需求的排序结果,提高用户对个性化搜索引擎的满意度和体验度。
最后,利用Eclipse开发平台,结合几种开源API,实现了个性化站内搜索引擎的设计与应用。为了使系统界面更加友好、访问速度更快,系统界面设计采用了Ajax技术及DWR框架。作者通过对比通用搜索引擎和个性化搜索引擎的实验,验证了采用个性化排序计算的搜索引擎具有更高的匹配度和查准率。同时分析其中可能存在的问题,并指出以后继续研究和改进的方向。