基于旅游主题的地理情感时空分析研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:hongniba3493
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现阶段,旅游业和社交媒体都处于迅猛发展时期,两者之间的关系也越来越密切。与此同时,自然语言处理技术的创新与应用也为二者的相互融合提供了有力的技术支持。本文从游客情感角度出发,利用自然语言处理技术从三个时段共21天的微博数据中获取到游客情感信息,通过GIS时空分析方法探索游客情感空间分布和时空变化特征。同时,在此基础上还引入了旅游子主题和旅游城市两个层面,分别分析游客情感。此外,为了解释造成这些情感分布和变化特征的原因,本文还从多个领域选取相关数据,以山东省景区为研究对象,对可能影响景区情感的因素进行了研究分析。具体研究内容与结论如下:(1)从每日三千万左右的原始微博数据中选取仅占1%的带有签到位置的微博数据,经过各种数据清洗和预处理后,共剩余4571542条数据;使用Fast Test文本分类模型从中筛选出了1221141条旅游相关数据;经过再次筛选后,共有1177388条数据使用BTM主题模型聚类出46个子主题,并使用讯飞情感分析工具计算出这些数据的情感得分。(2)选取了主题显著性和数据量都较高3个旅游子主题,对其从统计、空间和时空三方面进行旅游地理情感分析。发现不同主题的微博数量和情感均值均有明显差异;主题15的情感地域性分布差异明显大于其他两个主题;不同主题在工作日和小长假期间的情感空间分布不同,主题15和主题28的分布差异大于主题9;三个主题在2018年小长假七日间的情感空间分布状态多种多样,没有明显的分布规律,但同一个主题在不同日期间以及不同主题在不同日期间,仍有整体上相似的情感空间分布状态等结论。(3)根据旅游城市排名选取了两年间均排前三名的城市,发现北京市、上海市和重庆市三座城市的各区县微博数量分布差异化明显;但三座城市各区县间的旅游情感值均值却没有显著性变化;三座城市的网格情感在空间上都存在低值聚类模式,且重庆市的低值聚类程度比北京市和上海市更高;北京市和重庆市在2016年是随机分布模式,到了2018年则出现了低值聚类现象,且重庆市的聚类程度略高于北京市;北京市2018年小长假七日间的高值异常值和低值聚类分布较为集中,主要在丰台区、朝阳区和海淀区附近等结论。(4)以山东省内有微博数据的4A、5A级景区为研究对象,发现景区具有非均衡集中分布特征,且各景区间的情感值分布具有空间正相关性。然后从自然环境、社会经济等五方面选取22种可能的影响因素,利用相关性分析(相关性系数和地理探测器)和回归建模分析(逐步线性回归和地理加权回归)等方法对其进行分析。分析结果表明,景区空气质量状况和植被覆盖度等多种因素在一定程度上会对景区情感产生影响。
其他文献
海岸湿地是地球表层最富有生产力的生态系统之一,对海岸带湿地进行土地覆被监测具有重要意义。海岸湿地地区常年多云多雾,传统的光学遥感往往不能获取高质量的影像,合成孔径雷达(Synthetic Aperture Radar,SAR)能够不受天气条件的限制,是海岸湿地土地覆被监测的理想手段。本文以黄河三角洲为研究区域,基于深度学习的方法开展高分极化SAR海岸湿地的分类研究。遥感影像数据为2016年9月14
学位
十九大报告指出,金融是国家重要的核心竞争力,金融强则经济强。目前我国正面临着经济转型升级的攻关期,我们必须坚持以供给侧结构性改革为主线,加快经济发展的变革速度。习近平总书记提出金融工作的主要任务是服务实体经济、防控金融风险、深化金融改革,这三项任务也是三位一体的有机结合。习近平总书记的重要讲话,指明了金融工作的大政方针、主要任务和改革方向。随着国家黄蓝两大战略的实施,东营市金融业发展迅猛,各类金融
学位
信息技术和互联网的迅速发展改变了旅游领域,旅游住宿数据呈指数级增长,推荐系统成为克服旅游住宿领域“信息过载”问题的实用工具。然而,由于旅游领域的性质,旅游住宿推荐系统也面临着挑战:一是在海量旅游住宿数据中,用户和酒店的交互信息稀缺,存在严重的数据稀疏性和冷启动问题,二是当用户身份标识不可见时,传统推荐算法不再适用,往往需要基于用户行为序列数据进行会话推荐。深度学习技术的出现为推荐系统的研究带来了新
学位
发热呼吸道症候群(Febrile respiratory syndrome,FRS)是由多种病原体构成的具有一组相似临床病征的呼吸系统传染病临床症状。近年来,发热呼吸道症候群的病原体不断变化,发病率逐渐升高,严重的威胁着人类健康,对社会经济造成严重危害,因此构建发热呼吸道症候群时空病原谱对于我国发热呼吸道症候群流行病学特征研究及其预防、控制都有着重要作用与意义。但是,限于发热呼吸道症候群病毒的检测
学位
GNSS反演大气可降水量(PWV)具有精度高、时空分辨率高和不受天气影响等优点。在水汽反演的过程中,大气加权平均温度(Tm)是一个非常重要的参数。对于固定的地基GNSS站点而言,现有Tm全球模型和区域模型的适用性存在一定的局限性和不确定性。本文基于单站建模方法,分别利用欧洲中期天气预报中心(ECWMF)数据和无线电探空数据,构建了单站大气加权平均温度模型,并对其精度进行了验证和分析。主要研究内容和
学位
城市交通流量短时预测是智慧交通发展中的重要一步。本文基于北京市出租车GPS轨迹数据,对城市交通流进行了时空特性分析,利用深度神经网络建立了两种短时交通流时空预测模型,主要研究内容包括:(1)城市交通流时空特性分析。时间层面,按分钟和日粒度进行交通流量统计和Pearson相关系数分析。发现城市交通流在时间上具有临近性、周期性和趋势变动性,且工作日和非工作日具有显著的差异。每天的交通流量变化从细节上看
学位
随着北斗、伽利略等全球导航卫星系统的发射,基于全球卫星导航系统进行高精度导航定位已广泛应用于各领域。在海洋应用中,由于海上通信链路的问题,利用GNSS进行高精度定位和导航仍是一个挑战。DGNSS和RTK都需要在陆地上的基站和海上的移动站之间进行数据通信,而远海数据通信一般都由海洋通信卫星服务商提供,通信成本高,普通的用户无法承担。低成本的北斗短报文服务为陆地基站与海上流动站之间的数据通信提供了另外
学位
IGS RTS实时数据产品的公布,使得GNSS RT-PPP技术进入了新的发展和应用阶段。然而,RTS产品是通过网络传输的形式播发给用户,在此过程中,RTS数据不可避免会产生中断与不连续的问题,对用户RT-PPP处理的连续性与定位精度产生严重影响。本文针对上述问题开展系统研究,主要内容和结论总结如下:(1)卫星钟差预报算法。对GNSS卫星钟差预报算法和参数估计方法进行总结,对各模型应用于卫星钟差预
学位
海岸带是一种特殊的生态系统,具有高生产力、高经济价值的特点。随着经济和人口的不断增长,海岸带正面临着巨大压力,严重影响了可持续发展的战略方针。因此,把握海岸带的动态变化规律,对海岸带的可持续利用和发展具有十分重要的意义。传统遥感分类使用单时相遥感数据,分类效率高、可操作性强。但是,海岸带地物类型丰富、分布错综复杂,仅靠单时相遥感影像难以实现高精度分类。需要利用多时相的遥感信息,通过分析地物在“繁盛
学位
社交媒体的地理位置大大丰富了地理知识发现的手段,但社交媒体的地理位置标记是稀疏的,仅约1%-10%的社交媒体数据附带地理位置。除了用户主动标记的位置,社交用户的文本、社交网络也隐藏着许多地理位置指示信息。为了从文本、社交网络挖掘潜在的地理位置指示信息,推断社交媒体数据地理位置,本文基于深度学习方法对文本级、用户级两个层次的社交媒体数据建立地理位置探测模型。主要研究内容包括:(1)文本级的社交媒体地
学位