个性化站内搜索引擎的设计与应用—基于华贸易货交易平台

来源 :东华大学 | 被引量 : 0次 | 上传用户:leeyongfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展和信息化进程的加快和深入,越来越多的电子商务网站的出现成为一种新的趋势,而且随着这样的网站的规模越来越大,网站的数据量也越来越多,致使用户要在这些数据中找出自己感兴趣和满意的信息就越来越困难。这样,人们检索信息的需求就不仅仅满足于通用的搜索引擎,更需要针对特定领域设计出个性化搜索引擎。   本文主要研究应用于易货交易网站内的个性化站内搜索引擎相关的技术和方法,此种易货网站的注册用户特点是均为有行业背景的企业用户。针对用户对搜索引擎个性化服务的需要,作者阐述了一种个性化站内搜索引擎的实现思想:利用隐式搜集和显式搜集相结合的方法来搜集用户信息,显式搜集体现在基于企业注册用户的注册详细信息的行业背景计算相关词权重;隐式搜集体现在采用Ajax技术跟踪搜集用户行为信息,根据用户的历史记录建立用于存储用户兴趣信息的用户个性化信息文件。在计算关键词与文档相关度方面,对于空间向量模型进行改进,在用户个性化信息文件的基础上计算关键词和文档的相关度,使得查询结果更加符合用户实际需求,提高系统的商品成交量。通过分析国内外关于个性化搜索的著作,在Lucene原有基础排序算法的基础上,结合PageRank算法的思想和根据用户个性化重新计算关键字权重值,提出一种更加适合本论文实际应用的个性化排序算法,反馈给用户符合其用户需求的排序结果,提高用户对个性化搜索引擎的满意度和体验度。   最后,利用Eclipse开发平台,结合几种开源API,实现了个性化站内搜索引擎的设计与应用。为了使系统界面更加友好、访问速度更快,系统界面设计采用了Ajax技术及DWR框架。作者通过对比通用搜索引擎和个性化搜索引擎的实验,验证了采用个性化排序计算的搜索引擎具有更高的匹配度和查准率。同时分析其中可能存在的问题,并指出以后继续研究和改进的方向。
其他文献
并行计算将成为计算机发展的一种趋势,因为传统的CPU串行计算已不能满足发展的要求。特别是在科学计算领域,许多计算都需要大量的计算。在以往的研究中,大部分的计算都需要在
随着计算机网络技术特别是Internet和Web技术的发展,网络已经成为信息交换的重要途径。基于B/S模式的Web应用已经逐渐取代C/S模式的应用。由于相应的业务需求不同,企业往往需
基于逆向工程的三维重建技术是人工智能、机器视觉和虚拟现实等前沿领域的热点和难点,也是人类在基础研究和应用研究中面临的重大挑战之一。三维重建技术是图像处理的一个重
无线传感器网络是一种由大量的节点组成的分布式无线自组织网络,其目的是协作地感知、采集和处理网络覆盖区中各种监测对象的信息,并发送给监测终端。与其他网络相比,无线传
传统的基于分布式以太网结构的汽车检测控制系统存在结构复杂、投资成本高、不易大规模推广等不足,采用以太网通信容易受病毒侵扰,其实时性和可靠性也难以得到保证。针对以上
传感器网络是一种无线网络,它们广泛应用于环境监控、目标跟踪、建筑物安全监测、农业精细化耕种、活火山监测、运输业监控、人类活动监控以及其他监控领域。传感器网络的数据
万维网产生之后,将遍布全球各地的计算机联系到一起,这些计算机中的数据资源组成了规模庞大的数据库。面对如此庞大的数据库,寻找真正想要的信息无异于大海捞针。如何发现大
随着软件系统需求的不断变化,软件系统也需要随之更新。对于静态体系结构的软件系统而言,软件扩展、更新和维护需要系统停止运行,这将为软件系统带来高额的代价。在运行时可以动
数据仓库查询一直是数据库领域的研究重点。近年的研究发现列存储体系仅从磁盘或内存中读取与查询相关的列,相对于行存储来说,更适合OLAP、数据仓库等查询密集型应用。作为一
作为网络应用服务中最关键的设备,服务器的安全、高效运行显得至关重要,目前,服务器管理方式主要有人工管理、监控软件管理、KVM管理、专有工具管理等,以上几种方式均存在着