面向电子商务搜索引擎的多属性排序技术研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:zeroxu001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,电子商务的规模正在急剧的扩大,需要依靠专门的商品搜索引擎来帮助用户检索和筛选商品信息。商品搜索引擎会对查询结果进行排序,而排序结果的质量直接关系到用户的消费体验和效率。目前,常见的商品排序方式为基于单个商品消费属性(比如价格、销售量等)对查询结果进行排序,形式比较单调,不能满足用户逐渐增长的多样化和个性化的消费需求。本文开始探讨基于多个商品属性对查询结果进行排序的可能性。常见的方法为构造聚合函数,将多属性问题转换为单属性问题,然后进行排序。然而由于所有用户使用同一个聚合函数,排序结果不能体现用户对商品不同属性的个性化偏好,导致出现排序结果单一问题;同时也缺乏在客观上对商品本身价值的衡量,导致排序结果具有一定的不合理性;而且随着电子商务中用户与商品数量的急剧增长,在排序的性能方面也面临着很大的挑战。为了应对上述问题,本文以实现对查询结果基于多商品属性的个性化排序为目标展开了研究。首先,本文拟构建基于商品属性的用户偏好模型,通过分析用户在电子商务网站上的购物行为信息,挖掘出用户对商品不同消费属性的偏好,使排序结果能满足用户个性化的消费需求。其次,提出了基于用户偏好的Skyline排序,Skyline排序基于用户偏好模型构建的个性化权重向量,实现对查询结果基于多属性的排序;基于Skyline查询机制增加商品本身在各属性值上的优劣这一客观因素对排序结果的影响,提高了排序的合理性。而且为了求取Skyline查询机制中各类商品的Skycube,本文还提出了一种更加优秀的Skycube计算方法CSBSC.最后,本文将上述方案中需要较高计算能力和存储空间消耗的商品Skycube计算部分放到Hadoop平台上进行,而且实现了CSBSC算法的MapReduce版本CSBSC-MR,并对其在MapReduce框架下的执行过程做了进一步的优化,提高了计算的性能。本文在上述研究工作的基础上构建了一个基于Skyline的商品排序系统SLine系统,以实现对商品查询结果基于多商品属性的个性化排序,SLine系统最终会被部署到东南大学云计算中心。本文最后采用合成基准测试数据集和从京东商城抓取的真实数据分别对CSBSC算法和SLine系统进行了性能验证和测试。
其他文献
从改革开放到现在,我国的年度数据只有30多个。对于很多经济研究来说这样的数据量是远远不够的,所以对于季度、月度等子年度时间序列的研究显得特别重要。子年度数据所包含的
党的十八大报告指出,除了要对人的基本需求之外,还要对人的尊严、情感和思想予以关注。这意味着人文关怀已受到越来越多的重视。人除了有理性思维之外,还具备丰富的情感,人的
经济全球化深刻地改变着整个世界的面貌,作为多边贸易体制的代表,WTO对国际贸易的发展产生了深刻影响。但由于WTO“多哈回合谈判”步履维艰,为了进一步发展区域经济,全球范围
当前,在世界范围内服务经济日益成为经济发展的主导,我国服务业同样呈现出快速发展的态势。与此相对应的是,服务经济已经步入了品牌竞争的时代。烟草商业企业作为一种传统的
改革开放三十多年来,尤其加入世界贸易组织以来,出口不断增长,成为我国经济发展的最重要依靠力量。而近些年,伴随着愈发多变的国际政治、经济环境,中国与出口国在贸易上的冲
针对分布式存储系统中如何实现数据在物理存储上的均匀分布和高效定位的问题,对多种哈希算法展开研究,提出了衡量分布式存储系统哈希算法优劣的标准;从散列分布性、哈希冲突
<正>改革开放以来,佛山用3倍的建设用地增加率换取30倍的经济增长,2008年全市实现生产总值4333亿元,同比增长15.2%。但同年全市土地开发强度已达33%。同时因城乡规划的滞后,
光纤激光器相较于传统激光器拥有巨大优势。为了研制具有更佳输出特性的光纤激光器,文章提出一种全固态掺镱正方晶格光子晶体光纤,利用全矢量有限元法对光纤结构和特性进行模
介绍了涟钢2 800m3高炉无料钟炉顶齿轮箱采用的闭路循环水冷系统,并与开路冷却模式的冷却效果、水量消耗、运行成本、管道系统等进行了对比分析,归纳了闭路循环冷却模式的特
过去十多年来,随着中国经济的飞速发展以及世界经济一体化进程的不断加快,中国企业“走出去”的步伐也不断加快。从对外进出口贸易到现在的对外直接投资,中国融入国际分工的