酒店搜索推荐的设计与分析

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:bell0521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的发展,人们从信息匮乏时代来到了信息过载时代,用户很难从海量的信息中快速获得对自己有用的信息,对信息的利用率反而下降了。因此过滤信息的能力成为了衡量一个信息系统好坏的重要指标。一个具好的信息系统,会从海量信息中过滤出用户最关注的信息,这将大大增加系统工作的效率,并节省用户寻找信息的时间。推荐系统正是在这种背景下应运而生,作为传统搜索引擎的一个补充,在解决信息过载问题中发挥着重要的作用。以某旅游垂直搜索网站为实例展开面向酒店搜索的推荐技术研究。在深入分析了各种常用推荐系统后,结合酒店搜索的特点,设计了一种基于酒店相似度的酒店推荐系统。系统的设计思路是根据用户最近的访问酒店推测出用户的兴趣,然后推荐相似的酒店。系统包括离线模块和线上模块,离线模块根据点击日志和酒店信息计算酒店相似性表,线上模块根据用户的最近访问历史计算出推荐结果并负责收集用户反馈和记录系统状态。为了对系统进行离线评测和研究,同时设计了一种基于用户访问时间序列的推荐评测系统,并定义了命中率和命中率精度两个精确度指标作为主要的评测指标。该评测系统把每个用户的点击详情日志看成访问序列,用最近访问历史、当前访问酒店和目标酒店组成的时间窗口在访问序列上滑动来模拟回放用户的访问和推荐过程,并进行相关统计,计算出评测指标。该评测系统被用来研究基于内容、协同过滤等多种相似性算法对系统的影响,并探究影响推荐效果的各种因素和改进系统的方法。经过研究,发现使用基于协同过滤的Amazon相似性算法和点击详情转化率相似性算法的效果最好,归一化相似性是必要的,应该经常更新酒店相似性表。使用最佳训练集长度、过滤坏数据、组合使用多推荐引擎可以有效改进系统效果。综合使用这些改进方法之后,相对于原始系统,命中率提高了7%,命中率精度提高了15%。
其他文献
目的观察平郁石乳方联合化疗治疗三阴乳腺癌术后的临床疗效。方法:将137例三阴乳腺癌术后患者随机分类法分为2组:1对照组67例,AC-T化疗;2联合治疗组70例,平郁石乳方联合AC-T
<正>什么是细节描写?一般地说,对那些细微、具体可感并具有典型意义的东西,特别是能展示人物思想及其性格特征的语言、行动、心理活动等的描写,称之为细节描写。现代文学作品
本文以"数学建模和3D打印"课程为例,将数学教育与新兴科技相结合,培养学生的设计思维,提高学生的动手能力,通过教学案例及学生作品的分析将3D建模和数学"强关联"起来,对中小
<正>费孝通在《乡土中国》的开篇即谈到:"从基层上看去,中国社会是乡土性的。"(1)"乡土"是中国人的"根",两千多年的农耕传统和儒家特有的伦理秩序相结合,形成了中国特有的文
Armchair graphene nanoribbons with different proportions of edge oxygen atoms are analyzed in this study using the crystal orbital method,which is based on dens
1 临床资料本院1996-05/2002-06住院的重型肝炎患者死亡50(男39,女11)例,年龄19~64岁.
目的探讨1.5T动态增强磁共振成像(MRI)在前列腺癌诊断中的价值。方法抽取2012年1月‐2015年4月该院收治的100例前列腺疾病患者作为本次研究对象,其中,前列腺癌患者50例(观察组),
目的研究缺血预处理(IPC)对实验性冠脉急性缺血再灌注期间血小板聚集率的影响及腺苷的作用. 方法建立兔在体心脏缺血预处理模型(n=14),用智能血液凝仪测定血小板聚集率,高效
目的: 研究胆囊癌中VEGF-C的表达情况及其临床意义. 方法: 应用免疫组化Envision二步法测定52例胆囊癌(gallbladder carcinoma, GBC)和18例慢性结石性胆囊炎VEGF-C表达. 结果