基于空间数据挖掘的热门景点及线路推荐研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:liangzhenghai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展和人们生活水平的提高,旅行已经成为越来越多的人生活中至关重要的一环,虽然现在有关旅行的应用系统很多,但真正能够满足用户实际需求的却很少,例如通过搜索引擎或者旅行网站搜索的结果往往是旅行公司的商业推广或者旅游景点的过度宣传。如何让游客在一个陌生的城市中快捷方便地找到热门旅游景点并规划好游玩路线,这是智慧旅游时代自助旅游者的迫切需求。本文总结了国内外关于空间数据挖掘和旅游推荐的相关技术和方法,并在此基础上提出了一种基于空间数据挖掘的热门景点和线路推荐方法。由于大部分旅行者都有拍照的习惯并且喜欢在社交媒体上分享这些照片,本文首先从大型图片分享网站Flickr上挖掘了大量带有空间地理信息和文本Tag的Geo图片,通过 P-DBSCAN(A Parallel of Density-Based Spatial Clustering of Applications with Noise, 一种并行的基于密度的聚类算法)聚类算法对这些用户上传的携带空间地理信息的图片进行空间聚类得到图片所在的景点集,然后根据文本Tag将这些聚类得到的景点与真实的景点进行对应,并构建景点数据库。然后,计算游客对不同景点的游览次数来找出热门景点,根据游客的旅行历史和背景信息等利用协同过滤算法计算用户相似度,并以此为依据进行个性化景点推荐,在推荐的同时考虑天气和时间等因素。最后,对游客的旅行历史进行分析可以提取出游客的旅行轨迹,使用序列模式挖掘算法分析出热门旅行路线,再根据游客的旅行历史和当前的搜索文本来进行个性化的线路推荐。本文在聚类的过程中采用了 P-DBSCAN算法,通过实验证明P-DBSCAN算法在密度分布不均的情况下聚类效果明显优于DBSCAN算法。而在推荐过程中引用了 Apache Mahout提供的一个协同过滤算法的推荐引擎Taste,并在Android设备上展示最终推荐结果。
其他文献
当传统的C/S网络结构已经不能满足大众对文件下载的需求时,P2P在这种环境下运应而生,而P2SP技术是在吸收P2P、传统C/S结构两者优点的基础上发展而来,由于P2SP优点众多,已经从
车载网络是一种新的无线传感器网络,是智能交通系统的重要组成部分,在交通领域中发挥了重大的作用,尤其是在缓解道路拥塞、预防交通事故发生、车辆辅助驾驶以及车辆控制方面,有着
射频识别(RFID, radio frequency identification)是一种利用无线射频信号进行目标自动识别的技术,它具有无需人工干预、识别速度快、非接触识别等优点,随着射频识别技术的逐步发
随着计算机产业及互联网的不断发展,各行各业积累了海量的数据信息,图作为最通用的数据结构之一,在描述数据的属性及结构特征等方面具有显著的优势:一方面它可以描述生物、化学等
随着计算机网络和多媒体技术的迅速发展,数字图片等多媒体数据呈爆炸式的增长。处理和使用这些数据成为一个难题。图片检索、图片分割、物体检测以及协同图片分割等一系列的处
相似连接具有广泛的应用,如,合并检测,模糊的关键字匹配,数据融合,数据清理等。相似性度量方法有许多种,如Jaccard距离、Cosine距离、编辑距离。文章主要集中于字符串编辑距离相似
近年来,嵌入式以太网技术的不断发展使得嵌入式系统的应用领域日益广泛,同时也对嵌入式以太网的性能提出了更高的要求。尤其是在涉及到图像、视频、音频等大数据量传输的应用中
Android系统由于免费、开源、可移植等优点,在移动市场发展迅猛,成为占有率最高的操作系统。Android流行的同时,伴随着层出不穷的恶意软件。恶意软件可以窃听通话、窃取信息
目前,全球范围内的垃圾邮件问题日益严重,不仅严重占用网络资源,威胁网络安全,更对人们的日常生活造成了严重困扰,给传统反垃圾邮件过滤技术带来了巨大挑战。云计算的出现和发展,打
图像分割是图像处理与计算机视觉领域中的基本技术之一,图像分割是指利用图像的灰度、颜色、纹理、形状等将一幅图像分割成若干个独立的有共同像素属性的对象,其实质是一个按