论文部分内容阅读
随着旅游市场的快速发展,人们对智能旅游服务的需求大幅增长。互联网的普及使每个人都能很轻易地从各种旅游网站获取相关资讯。然而,不断增长的旅游数据使游客在出游决策时面临着严重的信息过载;与此同时,旅游运营商需要准确把握旅游景点的显著特征并为用户提供精准的旅游产品和服务,才能在激烈的市场竞争中占据更大份额。因此,对互联网上海量的旅游景点相关信息进行提炼和总结,从而为游客和旅游运营商提供决策支持成为了当前旅游业的迫切需求。近年来,基于主题挖掘方法对旅游景点文本进行分析,进而抽取出景点所对应的主题特征为旅游景点的刻画提供了一个良好的思路和实践可能。然而,现有研究忽略了一个重要事实,即旅游景点在不同季节情境下会呈现出不同的属性特征。事实上,旅游景点文本数据不同于一般的文本文档,其通常蕴含着较强的季节倾向。如何在旅游景点的主题挖掘中考虑季节情境信息,对旅游景点属性进行更精确和全面的刻画,仍有待探索。因此,本文提出了用季节情境信息来改善旅游景点主题特征的创新理念。基于旅游景点特征的季节性,研究季节情境因素在旅游景点主题分布中的有效表达方式及对文档、主题和词之间关系的影响机理。在此基础上研究在LDA模型中考虑季节情境的合理途径,构建融入季节情境的季节-主题模型(Season-Topic-LDA,简称STLDA),该模型在LDA三层结构中的文档层和主题层之间添加了一个季节层,形成了文档-季节-主题-词的四层贝叶斯分层结构,使旅游景点主题的产生依赖于季节,从而得到在不同季节情境下旅游景点对应的不同的主题特征及更为精确的旅游景点主题的概率分布。进一步研究进行三参数学习的改进的吉布斯抽样(Gibbs Sampling)算法用于所提出模型的求解。最后,为了验证STLDA模型的有效性,基于现实世界的旅游景点文本数据进行了一个全面的实证研究。实验分析结果表明,与传统的LDA模型相比,本文所提出的STLDA模型能够有效挖掘出季节感知的主题,使得旅游景点的主题表示更加具有代表性和全面性。基于此研究挖掘旅游景点在不同季节的旅游亮点,传播最具当季特色的旅游景点主题形象,提高公众对于不同季节适游、可游的旅游资源和产品的认识,对促进各地旅游经济的发展无疑具有重大的现实意义。