论文部分内容阅读
随着科技的发展和人们生活水平的提高,旅行已经成为越来越多的人生活中至关重要的一环,虽然现在有关旅行的应用系统很多,但真正能够满足用户实际需求的却很少,例如通过搜索引擎或者旅行网站搜索的结果往往是旅行公司的商业推广或者旅游景点的过度宣传。如何让游客在一个陌生的城市中快捷方便地找到热门旅游景点并规划好游玩路线,这是智慧旅游时代自助旅游者的迫切需求。本文总结了国内外关于空间数据挖掘和旅游推荐的相关技术和方法,并在此基础上提出了一种基于空间数据挖掘的热门景点和线路推荐方法。由于大部分旅行者都有拍照的习惯并且喜欢在社交媒体上分享这些照片,本文首先从大型图片分享网站Flickr上挖掘了大量带有空间地理信息和文本Tag的Geo图片,通过 P-DBSCAN(A Parallel of Density-Based Spatial Clustering of Applications with Noise, 一种并行的基于密度的聚类算法)聚类算法对这些用户上传的携带空间地理信息的图片进行空间聚类得到图片所在的景点集,然后根据文本Tag将这些聚类得到的景点与真实的景点进行对应,并构建景点数据库。然后,计算游客对不同景点的游览次数来找出热门景点,根据游客的旅行历史和背景信息等利用协同过滤算法计算用户相似度,并以此为依据进行个性化景点推荐,在推荐的同时考虑天气和时间等因素。最后,对游客的旅行历史进行分析可以提取出游客的旅行轨迹,使用序列模式挖掘算法分析出热门旅行路线,再根据游客的旅行历史和当前的搜索文本来进行个性化的线路推荐。本文在聚类的过程中采用了 P-DBSCAN算法,通过实验证明P-DBSCAN算法在密度分布不均的情况下聚类效果明显优于DBSCAN算法。而在推荐过程中引用了 Apache Mahout提供的一个协同过滤算法的推荐引擎Taste,并在Android设备上展示最终推荐结果。