论文部分内容阅读
智慧旅游作为互联网应用的一种发展,极大的丰富了旅游信息和涉及的领域。本文针对旅游大数据的跨媒体特性,基于文本深度表示模型和卷积神经网络对旅游景点的文本和图像信息进行了建模与表达,提出了旅游跨媒体数据的语义学习与分析方法,基于深度特征和主题语义对旅游文本和图像进行关联,基于深度神经网络学习旅游用户和旅游文本之间的语义信息。论文完成的主要工作如下:(1)实现了跨媒体旅游大数据的信息获取。对于互联网中旅游信息相关的网站,结合旅游主题相关度、时空特征和网页结构特征进行旅游数据的信息获取,并展示获取的旅游文本和旅游图像。基于旅游主题、时空特征和网页结构的信息获取算法(TD-IA)获取的旅游网页数量准确率达到95%。(2)实现了跨媒体旅游大数据的语义表征。对于互联网中获取的旅游文本和旅游图像,基于旅游语料数据利用文本深度表示模型和卷积神经网络对旅游文本和图像进行语义特征提取,得到旅游文本和图像对应的深度特征向量语义表征。基于深度特征和旅游主题语义分类的旅游图像的搜索方法(DF-TC)正确率有所提高。(3)实现了跨媒体旅游大数据的语义学习和统一建模。对于旅游文本和旅游图像的语义深度特征,基于旅游潜在语义主题进行语义学习,运用融合旅游数据主题的语义分析对跨媒体数据的训练集进行统一建模,实现跨媒体旅游大数据的统一表达。提出了基于深度神经网络构建旅游用户语义特征和旅游景点语义特征的语义学习算法。基于旅游潜在语义主题学习的跨媒体搜索算法(CMS-WCTS)准确率有所提高。基于深度神经网络的旅游用户语义学习算法(DNN-TUSL)的准确率达73%以上。(4)实现了跨媒体旅游大数据的搜索系统。对于旅游跨媒体数据进行预处理,基于旅游潜在主题语义学习实现了对旅游大数据的跨媒体搜索,验证了本文提出的算法可以对旅游文本和图像进行表示,可以得到更好的跨媒体搜索结果。本文针对互联网跨媒体旅游大数据,实现了基于旅游潜在主题和深度神经网络的语义学习与建模,实现了旅游大数据的跨媒体搜索。