论文部分内容阅读
摘要:通过微博文本采集了網上游客对召稼楼游览的博文,设定9个主类目、25个次类目对所有文本进行分类及态度的判别。再使用RostCM软件对文本进行分类和词频分析,找出召稼楼旅游中游客关注度最高的内容,以此了解游客对召稼楼这一景点的印象内容的聚焦点以及景点在游客心目中的优劣程度。主要目标在于为召稼楼旅游开发提供可靠的形象完善依据,并进一步完善有关乡村旅游的大数据挖掘研究。
一、选题背景
目前,利用微博等网络平台的文本数据进行旅游形象的研究已经比较普遍。这类研究的关注点基本集中在城市旅游上,而鲜少应用于乡村旅游。召稼楼作为上海代表性的乡村旅游景点是上海市民近郊游的主要选择地,上海市民的互联网应用水平较高,越来越多的上海居民乐意在网络上展示自身的旅游活动和感受。通过分析样本,可以发现上海地区乡村旅游的产业特性,并有助于改善游客乡村旅游体验。
二、文献综述
(一)旅游地形象研究
自Hunt于1971年首次提出旅游目的地形象这一概念以来,旅游地形象一直是旅游界研究的热点问题。[1]学者热衷于研究旅游行为之间的互动效果,并在此基础上,对目的地形象的概念和维度进行拓展。
从旅游者角度看,Reynolds等认为“旅游者会从之前所有已有的印象中有选择地对特定印象进行重组。印象的形成需经过旅游者的修饰与表达”。[2]这一观点认为旅游者并不是被动地接受旅游形象,而是对旅游形象的进一步塑造起推动作用。Chen和Tsai认为旅游者的情感印象将对旅游目的地的选择产生影响,通过旅游者感知价值、感知质量等因素,间接作用于其未来的推荐与重游行为。
从目的地角度看,Dredge和Jenkins讨论了目的地识别与区域旅游政策问题。[3]旅游开发对于地方形象具有极强的依赖性,为了吸引旅游者增加市场份额,旅游活动经营者都会致力于地方形象的提炼与传播。如何在客源市场地区建立独特的旅游地形象,与旅游规划与政策制定紧密相关。Gartner等认为旅游目的地形象是旅游目的地品牌打造的核心所在,并在品牌资产评估中起重要作用。[4]
(二)大数据视角下的乡村旅游形象研究
国内旅游形象研究比国外晚了20多年,研究重点多关注于旅游形象的策划与设计上。纵观国内旅游地形象建设方面的研究,较多的是以具体案例来研究“城市”的旅游形象和景区形象,对于“乡村”形象的相关研究较少。大数据视角下的乡村形象研究则更少。
大数据视角下的乡村旅游研究较多使用定量研究方法,如谷文林对2014年江苏省农家乐乡村旅游相关微博的数据进行抓取处理来研究农家乐乡村旅游的时空分布规律,分析农家乐乡村旅游的热点问题。[5]李世霞与田至美利用百度指数来进行网络关注度因素分析。[6]曾媛等采用SWOT分析方法分析大数据和我国乡村旅游电子商务系统之间的关系和发展现状。[7]
(三)旅游形象测量方法综述
李玺总结旅游形象测量存在两种形式:结构化测量与非结构化测量。[8]前种通过调查量表的形式对游客的旅游形象要素或属性评价进行调查,对所获数据进行定量分析;后者则通过访谈、网络文本收集游客对旅游目的地形象的感受和评价,运用深度挖掘数据手段来获取游客对目的地形象属性与特征的感知。
姚长宏将旅游地形象感知主体分为本地居民(R)、旅游介体(M)、现实游客(T)和潜在游客(P)等4个群体,再设定旅游吸引物(A)、旅游服务(Q)、自然环境(N)、社会环境(S)等4个方面的主要内容进行问卷调查,并设立指标体系。[9]这属于结构化测量。
肖亮等采用内容分析法对41个网站的文本进行分析,得到台湾旅游地形象的主题,然后釆用对应分析法比较不同网站传播的台湾旅游形象。[10]谷文林使用新浪微博的数据采集工具Web Crawler抓取微博,再使用ICTCLAS算法进行数据处理,最后将分析结果可视化显示。这种属于非结构化测量,而本文的测量方法也归于这一类。[11]
三、研究设计
(一)研究地选择
关于乡村旅游的定义,王小兰认为乡村旅游是以乡村社区为主要活动场所,以乡村古文化、乡村民俗文化、乡村聚落、乡村田园景观、乡村自然生态环境为吸引物,融观赏、考察、学习、娱乐、购物、度假为一体的旅游形式。[12]
上海的城市化水平较高,对于农耕文化式的乡村概念越来越陌生,乡村更多以一种广义的“古镇”形态存在。本文选择已入选“中国传统村落名录”的上海市闵行区浦江镇革新村为研究对象。革新村是具有深厚积淀的历史名村,兴起于明嘉靖、万历年间,距今已有600多年历史。目前革新村以坐落于村内的召稼楼为主体结构,因召稼楼知名度高,故文题及文中均以召稼楼为统称。
召稼楼是目前上海市境内规模最大的古建筑集群之一,2005年召稼楼被列入上海市历史文化风貌保护区,同时也是国家3A级旅游景区。召稼楼传承了上海五百年的历史和文化,是上海传统古镇旅游的代表。因其知名度和关注度在上海所有古镇中较高,微博上的发文量也较多,选择其为研究对象可以较为全面和准确地获得游客对上海乡村旅游形象的感知情况。
(二)研究步骤
1.样本采集平台选择
新浪微博是一个开放性的社交网络平台,它涵盖了各种不同性别、年龄、身份、地域等多样化的样本人群。选择新浪微博为样本采集平台,一是降低了数据采集难度,二是确保了数据的多样性和丰富度。
2.数据采集方法
本文使用八爪鱼数据采集软件来实现微博数据的一次性大批量抓取。八爪鱼是一款操作简便的免费软件,它的图形化采集设计界面,对使用者来说无专业门槛限制。采集步骤如图1所示,具体提取数据内容包括用户名、正文内容、图片、转发数、评论数、点赞数、发文时间和发文设备。时间设定在2014年12月1日至2015年12月1日一年时间内。因为微博的搜索限制,采集分为两次进行。第一次使用普通检索方式采集微博发文的50页搜索结果,第二次使用高级检索方式将剩余时间段内的微博进行补充采集。 3.内容分析法
结合旅游六要素(吃、住、行、游、购、娱)、微博的使用特点(人们喜欢用微博记录旅行状态和感官体验),使用Rost CM对所有微博内容的词频进行分析,该软件功能强大,由武汉大学信息管理学院博士生导师沈阳教授团队设计开发,操作简便且用户可以免费使用。
首先,将微博内容划分为9大类,25个次类目(表1)。对每一条微博内容首先进行次类目判断,涉及到的任何次类目都需再进行态度判断,共有三种倾向。若态度为“正面”编码为“1”,态度为“负面”编为“-1”,态度为“中立”则编为“0”,未涉及到的次类目则空缺不填。
为了确保编码的一致性,分类的准确性和稳定性,还需对样本进行再次检验和调整。然后使用Excel对数据进行描述性统计,了解各类目每个次类目的频次分布,以及态度倾向程度。
4.高频特征词分析
将微博文本内容按照类目的设定,分别复制该类目下所有的文本内容,使用Rost CM软件进行词频分析,将召稼楼的主要地名、建筑名、店铺名、食品名等加入“分词自定义词表”。使用软件进行中文词分词统计,经筛选后,获得有意义的特征词和频数,以此更为具体地表述游客眼中召稼楼的旅游形象主题及重视程度。
四、研究结果分析
(一)旅游形象属性的频次统计
1.数据体例及术语说明
第一次数据采集971条,剔除无关、重复数据后剩余750条有效数据。
样本总体(包含未涉及到的单元格在内)为25*750=18 750个,其中有效数据(即涉及到的单元格)为1 170个。每个分类有效数据是涉及到的正面、负面、中立三类数据之和,每个主类目下的分类总体数为“分类种类×750”,如景观类目,其分类总体为1 500(表4)。
2.各类目占比细分情况
通过Excel对主次类目三种态度出现的频次进行统计后发现,在所有主类目中,提及最多的是景观和餐饮类目(表2),在有效数据中分别占29%和26.1%。其次是环境(13.25%)和旅行意向(12%),占比最低的是住宿0.4%,说明住宿是召稼楼旅游中关注度最低的方面,故后文不再对其进行数据分析。
在景观主类目中,中立态度最多,占分类有效数据的55.2%(表2)。其中,在分类有效数据中提及建筑景观(53.7%)的多于自然景观(46.3%),两者占比较接近(表3)。
在环境主类目中,正面态度最多,占分类有效数据的61.7%(表2)。其中,在分类有效数据中提及人员情况(44.2%)和气候条件(35.7%)最多,物价水平(16.2%)次之,最不关心的是空气质量(2.6%)和卫生情况(1.3%)(表3)。
在留影主类目中,中立态度最多,占分类有效数据的84.6%(表2)。其中,在分类有效数据中显示游客更偏爱不含代表性背景的留影,占比70.5%(表3)。
在餐饮主类目中,正面态度最多,占分类有效数据的60.3%(表2)。在分类有效数据中提及特色餐饮的最多,达到82.3%,饭店美食仅占17.7%,差距悬殊(表3)。
在交通主类目中,中立态度最多,占分类有效数据的55.8%(表2)。在分类有效数据中提及公共交通(46.5%)和自驾(30.2%)最多,骑行次之(23.3%),乘坐旅游巴士的基本没有(表3)。
在游览活动主类目中,正面态度最多,占分类有效数据的39.3%(表2)。在分类有效数据中购物商品(58.9%)和民俗体验(41.1%)两者的占比较接近(表3)。
在旅游意向主类目中,正面态度最多,占分类有效数据的47.1%(表2)。在分类有效数据中游览计划(47.9%)和游览感受(52.1%)两者的占比较接近(表3)。
在文化宣傳主类目中,正面态度最多,占分类有效数据的80%(表2)。在分类有效数据中提及历史文化的最多,达到84%,而新闻宣传(4%)和影视宣传(12%)都较少(表3)。
3.主类目态度分布情况
在所有的负面态度中,景观(27.2%)和旅行意向(24.7%)比重最高,其次是餐饮(17.3%)和环境(11.1%)。在所有的中立态度中,景观(35.5%)和餐饮(20.3%)比重最高,其次是留影(12.5%)和旅行意向(10.2%)。在所有的正面态度中,餐饮(32.7%)和景观(23.1%)比重最高,其次是环境(16.9%)和旅行意向(11.7%)。
所有正面态度数占有效数据总和的48%,中立为45%,负面为6.9%。由此可知游客对召稼楼的整体态度更偏向正面态度(表2)。
分析主类目在有效数据中的态度分布时可以发现(图2),排名前五位的依次是景观中立态度(16%)、餐饮正面态度(15.7%)、景观正面态度(11.1%)、餐饮中立态度(9.1%)和环境正面态度(8.1%)。
4.次类目态度分布情况
在所有的负面态度中,排名前五的次类目依次是游览感受(24.7%),建筑景观(21.0%),特色餐饮(12.3%),购物商品(9.9%)。在所有的中立态度中,排名前五的次类目依次是建筑景观(19.2%),自然景观(16.3%),特色餐饮(15.4%),不含代表性背景的留影(9.1%),游览计划(7.8%)。在所有的正面态度中,排名前五的次类目依次是特色餐饮(28.5%),自然景观(11.7%),建筑景观(11.4%),游览感受(7.1%),人员情况(6.4%)和气候条件(6.4%)并列第五。
分析次类目在有效数据中的态度分布时可以发现,排名前五位的依次是特色餐饮正面(13.7%),建筑景观中立(8.6%),自然景观中立(7.4%),特色餐饮中立(6.9%)和自然景观正面(5.6%)(图3)。
(二)高频特征词分析 在Rost CM软件添加自定义词表233项,并使用该软件进行分词,输出排名前300的词频列表。剔除出现频次小于5次的词频,剩下139个词语。
首先,对词性进行判断,发现主要以名词为主,其后是形容词和动词等。其次,对词频进行主题归类,主要分为5类:第一类包括地理位置、交通、道路、距离等相关词汇;第二类包括景观、景点等相关词汇;第三类餐饮、美食等相关词汇;第四类包括人文情怀、感受、时间、历史文化、游览行为等相关词汇;第五类为其他无法归类和判断的词汇。
从第一类的特征词使用频率来看,“上海”“闵行”“浦江”频数最高,这和召稼楼的地理位置相匹配。“下沙”和“周浦”是距离召稼楼较近的周边集镇,“地铁”一词提及数较高得益于召稼楼地理位置优越,临近地铁8号线,游客可以方便抵达。
第二类特征词中,“召稼楼”作为旅游名片出现的频次最高,同时也是所有类别中频次最高的。同义词“召楼”位列第二,“召稼”位列第七,说明游客也会使用简写称谓。其中“礼园”是召稼楼景区中被提及最多的专有景点名词。召稼楼是城隍爷的出生地,所以“城隍”也是被较多提及的词汇。“朱家角”是上海另一个知名的古镇景点,说明游客会将召稼楼与之比较。
第三类特征词中,“小吃”的频数最高,被称为“召楼三宝”的召楼羊肉、召楼拆蹄(手撕走油红烧蹄膀)、召楼大曲分别位列第2、第8、第10位,均在榜上。“老八样”饭店是景区内知名度较高的饭店之一,“青桔一碗面”和“江阿姨”油墩子都是游客偏爱的特色美食。
第四类特征词中,关于时间的词汇较多。“一日”游、“周末”游、“半日”游等词汇表明召稼楼在游客心目中较为适合在周末进行半日或一日的短途旅游。此外“元朝初”和“历史”两词代表了召稼楼的历史气息。“江南”也是关注度较高的词汇,显示召稼楼具有江南风情特色(表5)。
五、研究结论和展望
(一)研究结论及建议
以召稼楼为例,在大数据视角下进行内容挖掘,结合主次类目态度倾向频次分析和四大类特征词词频分析,探索了召稼楼旅游形象的属性与特征,对上海地区的具有代表性的乡村旅游有了一个初步认识。根据实证研究得到如下结论并提出相应建议:
1.餐飲是被提及最多的主类目之一,游客对餐饮的正面评价较高。餐饮主类目中特色餐饮受到突出关注也是被给予了最多的正面评价,“召楼三宝”得到较高的关注和好评。由此可见,近年召稼楼在特色餐饮方面的努力得到了游客的认同,建议继续发挥美食特色,这也是古镇营收中占比较多的部分。但同时应致力于开发更多饮食新品类,不要裹足不前。对现有的知名餐饮品牌加大宣传力度,开发相关产品,打通销路。
2.住宿是召稼楼旅游中关注度最低的方面,这主要是因为召稼楼的交通非常方便。从交通主类目中发现选择公共交通的最多,在词频数中也可以看出“地铁”出现次数较多,所以召稼楼发展住宿业目前并不乐观,这或许是位于上海的古镇所特有的一种情况。相对于国内地处偏远的古镇而言,上海古镇因交通发达而丧失了住宿这一块主要的经济收入,这对古镇的整体开发是一大短板,必须开发其他特色收入以弥补空缺。
3.召稼楼建筑景观较多遭到游客不满。召稼楼的古建筑是在修旧如旧的原则下修建的,原生态的建筑保留较少,而新修的所谓复原建筑和国内其他古镇的风格并没有太大差别,所以给游客留下“千镇一面”的感觉。游客对建筑景观丧失了新鲜度,自然多有抱怨。建议复建的建筑在恢复古镇的外立面的基础上,对建筑内部要加强创意设计以挽留游客。
4.召稼楼的历史底蕴较高,得到了广大游客的认同,但是相关文化活动并未取得较好效果。究其原因,一是宣传力度不够,虽然召稼楼近几年开展了很多文化活动,但并没有被游客注意到。二是活动内容及形式仍比较陈旧单一,很难吸引游客注意。建议未来在文化创意方面多下功夫,充分利用召稼楼独有的历史文脉并带动整个上海的文化传承。
5.召稼楼较多作为游客周末短途旅游的选择,这个发现也是意料之中。因为除了美食以外,很少有能使游客驻足的体验活动,这也是为什么调查中发现游客对召稼楼民俗体验方面关注度表现很低的原因。建议开发时间长度在1~2日的短期体验项目,可以更多地留住游客的脚步。
总体来说,目前召稼楼游客的游览感受负面态度较高,召稼楼在游客心目中的整体评价并不乐观。虽然如此,通过本次调查可以发现召稼楼存在开发潜能,比如在美食和历史文化方面还有许多开发亮点。
(二)研究展望
今后,在网络文本分析的数据源方面,可增加对旅游官方网站、旅游企业网站、旅游电子商务网站、旅游博客网站和旅游微博数据的研究;在数据类型方面,可从文本数据拓展到对网站图片、音频、视频等多媒体内容的分析,使研究更加深入;在数据挖掘手段方面,尝试使用更多的数据挖掘软件和方法,如在国外被广泛应用的catpac、worder、hamlet等软件,同时完善内容分析法的使用,提高数据挖掘的信度和效度;在数据统计方面,运用因子分析、T检验、对应分析和聚类分析等,提高对研究结果分析、阐释的科学性;在研究维度方面,可对同一网络数据源在一段时期内旅游形象的变化趋势、不同国家或地区游客对同一旅游地形象感知的差异性以及旅游形象与旅游动机、旅游满意度、旅游体验和重游意愿的关系等内容进行研究;在形象设计的实施阶段通过问卷与访谈结合的形式实时对旅游形象进行调整,以期达到更好的效果。
参考文献:
JDHunt. Image-A Factor in Tourism, Unpublished Doctoral Dissertation[M].Fort Collins: Colorado State University, 1971.
TJ Reynolds, L Jamieson.Image Representations: An Analytic Framework[M]. Lexington MA: Lexington Books,1985.
D Dredg, J Jenkins.Destination Place Identity and Regional Tourism Policy[J]. Tourism Geographies,2003,5(4):383-407.
M Konecnik, WC Gartner. Customer-Based Brand Equity for a Destination[J]. Annals of Tourism Research, 2007, 34(2):400-421.
[11]谷文林,任敏.大数据时代乡村旅游数据挖掘与分析[J].江西农业学报,2015(8):143-146+150.
李世霞,田至美.基于百度指数的旅游目的地网络关注度影响因素分析——以青岛为例[J]. 首都师范大学学报(自然科学版), 2014(1): 56-59.
曾媛,等.大数据时代背景下我国乡村旅游电子商务系统发展的SWOT分析[J]. 南方农业学报, 2014(8): 1498-1506.
李玺,叶升,王东. 旅游目的地感知形象非结构化测量应用研究——以访澳商务游客形象感知特征为例[J].旅游学刊, 2011(12):57-63.
姚长宏. 旅游地形象感知偏差测评模型研究[J].旅游学刊,2009(1):29-32.
肖亮,赵黎明. 互联网传播的台湾旅游目的地形象——基于两岸相关网站的内容分析[J]. 旅游学刊,2009(3):75-81.
王小兰. 复杂社会网络结构条件下微信营销在乡村旅游营销中的应用研究[J]. 全国商情(经济理论研究), 2014(17):79-81.
责任编辑:王世燕
一、选题背景
目前,利用微博等网络平台的文本数据进行旅游形象的研究已经比较普遍。这类研究的关注点基本集中在城市旅游上,而鲜少应用于乡村旅游。召稼楼作为上海代表性的乡村旅游景点是上海市民近郊游的主要选择地,上海市民的互联网应用水平较高,越来越多的上海居民乐意在网络上展示自身的旅游活动和感受。通过分析样本,可以发现上海地区乡村旅游的产业特性,并有助于改善游客乡村旅游体验。
二、文献综述
(一)旅游地形象研究
自Hunt于1971年首次提出旅游目的地形象这一概念以来,旅游地形象一直是旅游界研究的热点问题。[1]学者热衷于研究旅游行为之间的互动效果,并在此基础上,对目的地形象的概念和维度进行拓展。
从旅游者角度看,Reynolds等认为“旅游者会从之前所有已有的印象中有选择地对特定印象进行重组。印象的形成需经过旅游者的修饰与表达”。[2]这一观点认为旅游者并不是被动地接受旅游形象,而是对旅游形象的进一步塑造起推动作用。Chen和Tsai认为旅游者的情感印象将对旅游目的地的选择产生影响,通过旅游者感知价值、感知质量等因素,间接作用于其未来的推荐与重游行为。
从目的地角度看,Dredge和Jenkins讨论了目的地识别与区域旅游政策问题。[3]旅游开发对于地方形象具有极强的依赖性,为了吸引旅游者增加市场份额,旅游活动经营者都会致力于地方形象的提炼与传播。如何在客源市场地区建立独特的旅游地形象,与旅游规划与政策制定紧密相关。Gartner等认为旅游目的地形象是旅游目的地品牌打造的核心所在,并在品牌资产评估中起重要作用。[4]
(二)大数据视角下的乡村旅游形象研究
国内旅游形象研究比国外晚了20多年,研究重点多关注于旅游形象的策划与设计上。纵观国内旅游地形象建设方面的研究,较多的是以具体案例来研究“城市”的旅游形象和景区形象,对于“乡村”形象的相关研究较少。大数据视角下的乡村形象研究则更少。
大数据视角下的乡村旅游研究较多使用定量研究方法,如谷文林对2014年江苏省农家乐乡村旅游相关微博的数据进行抓取处理来研究农家乐乡村旅游的时空分布规律,分析农家乐乡村旅游的热点问题。[5]李世霞与田至美利用百度指数来进行网络关注度因素分析。[6]曾媛等采用SWOT分析方法分析大数据和我国乡村旅游电子商务系统之间的关系和发展现状。[7]
(三)旅游形象测量方法综述
李玺总结旅游形象测量存在两种形式:结构化测量与非结构化测量。[8]前种通过调查量表的形式对游客的旅游形象要素或属性评价进行调查,对所获数据进行定量分析;后者则通过访谈、网络文本收集游客对旅游目的地形象的感受和评价,运用深度挖掘数据手段来获取游客对目的地形象属性与特征的感知。
姚长宏将旅游地形象感知主体分为本地居民(R)、旅游介体(M)、现实游客(T)和潜在游客(P)等4个群体,再设定旅游吸引物(A)、旅游服务(Q)、自然环境(N)、社会环境(S)等4个方面的主要内容进行问卷调查,并设立指标体系。[9]这属于结构化测量。
肖亮等采用内容分析法对41个网站的文本进行分析,得到台湾旅游地形象的主题,然后釆用对应分析法比较不同网站传播的台湾旅游形象。[10]谷文林使用新浪微博的数据采集工具Web Crawler抓取微博,再使用ICTCLAS算法进行数据处理,最后将分析结果可视化显示。这种属于非结构化测量,而本文的测量方法也归于这一类。[11]
三、研究设计
(一)研究地选择
关于乡村旅游的定义,王小兰认为乡村旅游是以乡村社区为主要活动场所,以乡村古文化、乡村民俗文化、乡村聚落、乡村田园景观、乡村自然生态环境为吸引物,融观赏、考察、学习、娱乐、购物、度假为一体的旅游形式。[12]
上海的城市化水平较高,对于农耕文化式的乡村概念越来越陌生,乡村更多以一种广义的“古镇”形态存在。本文选择已入选“中国传统村落名录”的上海市闵行区浦江镇革新村为研究对象。革新村是具有深厚积淀的历史名村,兴起于明嘉靖、万历年间,距今已有600多年历史。目前革新村以坐落于村内的召稼楼为主体结构,因召稼楼知名度高,故文题及文中均以召稼楼为统称。
召稼楼是目前上海市境内规模最大的古建筑集群之一,2005年召稼楼被列入上海市历史文化风貌保护区,同时也是国家3A级旅游景区。召稼楼传承了上海五百年的历史和文化,是上海传统古镇旅游的代表。因其知名度和关注度在上海所有古镇中较高,微博上的发文量也较多,选择其为研究对象可以较为全面和准确地获得游客对上海乡村旅游形象的感知情况。
(二)研究步骤
1.样本采集平台选择
新浪微博是一个开放性的社交网络平台,它涵盖了各种不同性别、年龄、身份、地域等多样化的样本人群。选择新浪微博为样本采集平台,一是降低了数据采集难度,二是确保了数据的多样性和丰富度。
2.数据采集方法
本文使用八爪鱼数据采集软件来实现微博数据的一次性大批量抓取。八爪鱼是一款操作简便的免费软件,它的图形化采集设计界面,对使用者来说无专业门槛限制。采集步骤如图1所示,具体提取数据内容包括用户名、正文内容、图片、转发数、评论数、点赞数、发文时间和发文设备。时间设定在2014年12月1日至2015年12月1日一年时间内。因为微博的搜索限制,采集分为两次进行。第一次使用普通检索方式采集微博发文的50页搜索结果,第二次使用高级检索方式将剩余时间段内的微博进行补充采集。 3.内容分析法
结合旅游六要素(吃、住、行、游、购、娱)、微博的使用特点(人们喜欢用微博记录旅行状态和感官体验),使用Rost CM对所有微博内容的词频进行分析,该软件功能强大,由武汉大学信息管理学院博士生导师沈阳教授团队设计开发,操作简便且用户可以免费使用。
首先,将微博内容划分为9大类,25个次类目(表1)。对每一条微博内容首先进行次类目判断,涉及到的任何次类目都需再进行态度判断,共有三种倾向。若态度为“正面”编码为“1”,态度为“负面”编为“-1”,态度为“中立”则编为“0”,未涉及到的次类目则空缺不填。
为了确保编码的一致性,分类的准确性和稳定性,还需对样本进行再次检验和调整。然后使用Excel对数据进行描述性统计,了解各类目每个次类目的频次分布,以及态度倾向程度。
4.高频特征词分析
将微博文本内容按照类目的设定,分别复制该类目下所有的文本内容,使用Rost CM软件进行词频分析,将召稼楼的主要地名、建筑名、店铺名、食品名等加入“分词自定义词表”。使用软件进行中文词分词统计,经筛选后,获得有意义的特征词和频数,以此更为具体地表述游客眼中召稼楼的旅游形象主题及重视程度。
四、研究结果分析
(一)旅游形象属性的频次统计
1.数据体例及术语说明
第一次数据采集971条,剔除无关、重复数据后剩余750条有效数据。
样本总体(包含未涉及到的单元格在内)为25*750=18 750个,其中有效数据(即涉及到的单元格)为1 170个。每个分类有效数据是涉及到的正面、负面、中立三类数据之和,每个主类目下的分类总体数为“分类种类×750”,如景观类目,其分类总体为1 500(表4)。
2.各类目占比细分情况
通过Excel对主次类目三种态度出现的频次进行统计后发现,在所有主类目中,提及最多的是景观和餐饮类目(表2),在有效数据中分别占29%和26.1%。其次是环境(13.25%)和旅行意向(12%),占比最低的是住宿0.4%,说明住宿是召稼楼旅游中关注度最低的方面,故后文不再对其进行数据分析。
在景观主类目中,中立态度最多,占分类有效数据的55.2%(表2)。其中,在分类有效数据中提及建筑景观(53.7%)的多于自然景观(46.3%),两者占比较接近(表3)。
在环境主类目中,正面态度最多,占分类有效数据的61.7%(表2)。其中,在分类有效数据中提及人员情况(44.2%)和气候条件(35.7%)最多,物价水平(16.2%)次之,最不关心的是空气质量(2.6%)和卫生情况(1.3%)(表3)。
在留影主类目中,中立态度最多,占分类有效数据的84.6%(表2)。其中,在分类有效数据中显示游客更偏爱不含代表性背景的留影,占比70.5%(表3)。
在餐饮主类目中,正面态度最多,占分类有效数据的60.3%(表2)。在分类有效数据中提及特色餐饮的最多,达到82.3%,饭店美食仅占17.7%,差距悬殊(表3)。
在交通主类目中,中立态度最多,占分类有效数据的55.8%(表2)。在分类有效数据中提及公共交通(46.5%)和自驾(30.2%)最多,骑行次之(23.3%),乘坐旅游巴士的基本没有(表3)。
在游览活动主类目中,正面态度最多,占分类有效数据的39.3%(表2)。在分类有效数据中购物商品(58.9%)和民俗体验(41.1%)两者的占比较接近(表3)。
在旅游意向主类目中,正面态度最多,占分类有效数据的47.1%(表2)。在分类有效数据中游览计划(47.9%)和游览感受(52.1%)两者的占比较接近(表3)。
在文化宣傳主类目中,正面态度最多,占分类有效数据的80%(表2)。在分类有效数据中提及历史文化的最多,达到84%,而新闻宣传(4%)和影视宣传(12%)都较少(表3)。
3.主类目态度分布情况
在所有的负面态度中,景观(27.2%)和旅行意向(24.7%)比重最高,其次是餐饮(17.3%)和环境(11.1%)。在所有的中立态度中,景观(35.5%)和餐饮(20.3%)比重最高,其次是留影(12.5%)和旅行意向(10.2%)。在所有的正面态度中,餐饮(32.7%)和景观(23.1%)比重最高,其次是环境(16.9%)和旅行意向(11.7%)。
所有正面态度数占有效数据总和的48%,中立为45%,负面为6.9%。由此可知游客对召稼楼的整体态度更偏向正面态度(表2)。
分析主类目在有效数据中的态度分布时可以发现(图2),排名前五位的依次是景观中立态度(16%)、餐饮正面态度(15.7%)、景观正面态度(11.1%)、餐饮中立态度(9.1%)和环境正面态度(8.1%)。
4.次类目态度分布情况
在所有的负面态度中,排名前五的次类目依次是游览感受(24.7%),建筑景观(21.0%),特色餐饮(12.3%),购物商品(9.9%)。在所有的中立态度中,排名前五的次类目依次是建筑景观(19.2%),自然景观(16.3%),特色餐饮(15.4%),不含代表性背景的留影(9.1%),游览计划(7.8%)。在所有的正面态度中,排名前五的次类目依次是特色餐饮(28.5%),自然景观(11.7%),建筑景观(11.4%),游览感受(7.1%),人员情况(6.4%)和气候条件(6.4%)并列第五。
分析次类目在有效数据中的态度分布时可以发现,排名前五位的依次是特色餐饮正面(13.7%),建筑景观中立(8.6%),自然景观中立(7.4%),特色餐饮中立(6.9%)和自然景观正面(5.6%)(图3)。
(二)高频特征词分析 在Rost CM软件添加自定义词表233项,并使用该软件进行分词,输出排名前300的词频列表。剔除出现频次小于5次的词频,剩下139个词语。
首先,对词性进行判断,发现主要以名词为主,其后是形容词和动词等。其次,对词频进行主题归类,主要分为5类:第一类包括地理位置、交通、道路、距离等相关词汇;第二类包括景观、景点等相关词汇;第三类餐饮、美食等相关词汇;第四类包括人文情怀、感受、时间、历史文化、游览行为等相关词汇;第五类为其他无法归类和判断的词汇。
从第一类的特征词使用频率来看,“上海”“闵行”“浦江”频数最高,这和召稼楼的地理位置相匹配。“下沙”和“周浦”是距离召稼楼较近的周边集镇,“地铁”一词提及数较高得益于召稼楼地理位置优越,临近地铁8号线,游客可以方便抵达。
第二类特征词中,“召稼楼”作为旅游名片出现的频次最高,同时也是所有类别中频次最高的。同义词“召楼”位列第二,“召稼”位列第七,说明游客也会使用简写称谓。其中“礼园”是召稼楼景区中被提及最多的专有景点名词。召稼楼是城隍爷的出生地,所以“城隍”也是被较多提及的词汇。“朱家角”是上海另一个知名的古镇景点,说明游客会将召稼楼与之比较。
第三类特征词中,“小吃”的频数最高,被称为“召楼三宝”的召楼羊肉、召楼拆蹄(手撕走油红烧蹄膀)、召楼大曲分别位列第2、第8、第10位,均在榜上。“老八样”饭店是景区内知名度较高的饭店之一,“青桔一碗面”和“江阿姨”油墩子都是游客偏爱的特色美食。
第四类特征词中,关于时间的词汇较多。“一日”游、“周末”游、“半日”游等词汇表明召稼楼在游客心目中较为适合在周末进行半日或一日的短途旅游。此外“元朝初”和“历史”两词代表了召稼楼的历史气息。“江南”也是关注度较高的词汇,显示召稼楼具有江南风情特色(表5)。
五、研究结论和展望
(一)研究结论及建议
以召稼楼为例,在大数据视角下进行内容挖掘,结合主次类目态度倾向频次分析和四大类特征词词频分析,探索了召稼楼旅游形象的属性与特征,对上海地区的具有代表性的乡村旅游有了一个初步认识。根据实证研究得到如下结论并提出相应建议:
1.餐飲是被提及最多的主类目之一,游客对餐饮的正面评价较高。餐饮主类目中特色餐饮受到突出关注也是被给予了最多的正面评价,“召楼三宝”得到较高的关注和好评。由此可见,近年召稼楼在特色餐饮方面的努力得到了游客的认同,建议继续发挥美食特色,这也是古镇营收中占比较多的部分。但同时应致力于开发更多饮食新品类,不要裹足不前。对现有的知名餐饮品牌加大宣传力度,开发相关产品,打通销路。
2.住宿是召稼楼旅游中关注度最低的方面,这主要是因为召稼楼的交通非常方便。从交通主类目中发现选择公共交通的最多,在词频数中也可以看出“地铁”出现次数较多,所以召稼楼发展住宿业目前并不乐观,这或许是位于上海的古镇所特有的一种情况。相对于国内地处偏远的古镇而言,上海古镇因交通发达而丧失了住宿这一块主要的经济收入,这对古镇的整体开发是一大短板,必须开发其他特色收入以弥补空缺。
3.召稼楼建筑景观较多遭到游客不满。召稼楼的古建筑是在修旧如旧的原则下修建的,原生态的建筑保留较少,而新修的所谓复原建筑和国内其他古镇的风格并没有太大差别,所以给游客留下“千镇一面”的感觉。游客对建筑景观丧失了新鲜度,自然多有抱怨。建议复建的建筑在恢复古镇的外立面的基础上,对建筑内部要加强创意设计以挽留游客。
4.召稼楼的历史底蕴较高,得到了广大游客的认同,但是相关文化活动并未取得较好效果。究其原因,一是宣传力度不够,虽然召稼楼近几年开展了很多文化活动,但并没有被游客注意到。二是活动内容及形式仍比较陈旧单一,很难吸引游客注意。建议未来在文化创意方面多下功夫,充分利用召稼楼独有的历史文脉并带动整个上海的文化传承。
5.召稼楼较多作为游客周末短途旅游的选择,这个发现也是意料之中。因为除了美食以外,很少有能使游客驻足的体验活动,这也是为什么调查中发现游客对召稼楼民俗体验方面关注度表现很低的原因。建议开发时间长度在1~2日的短期体验项目,可以更多地留住游客的脚步。
总体来说,目前召稼楼游客的游览感受负面态度较高,召稼楼在游客心目中的整体评价并不乐观。虽然如此,通过本次调查可以发现召稼楼存在开发潜能,比如在美食和历史文化方面还有许多开发亮点。
(二)研究展望
今后,在网络文本分析的数据源方面,可增加对旅游官方网站、旅游企业网站、旅游电子商务网站、旅游博客网站和旅游微博数据的研究;在数据类型方面,可从文本数据拓展到对网站图片、音频、视频等多媒体内容的分析,使研究更加深入;在数据挖掘手段方面,尝试使用更多的数据挖掘软件和方法,如在国外被广泛应用的catpac、worder、hamlet等软件,同时完善内容分析法的使用,提高数据挖掘的信度和效度;在数据统计方面,运用因子分析、T检验、对应分析和聚类分析等,提高对研究结果分析、阐释的科学性;在研究维度方面,可对同一网络数据源在一段时期内旅游形象的变化趋势、不同国家或地区游客对同一旅游地形象感知的差异性以及旅游形象与旅游动机、旅游满意度、旅游体验和重游意愿的关系等内容进行研究;在形象设计的实施阶段通过问卷与访谈结合的形式实时对旅游形象进行调整,以期达到更好的效果。
参考文献:
JDHunt. Image-A Factor in Tourism, Unpublished Doctoral Dissertation[M].Fort Collins: Colorado State University, 1971.
TJ Reynolds, L Jamieson.Image Representations: An Analytic Framework[M]. Lexington MA: Lexington Books,1985.
D Dredg, J Jenkins.Destination Place Identity and Regional Tourism Policy[J]. Tourism Geographies,2003,5(4):383-407.
M Konecnik, WC Gartner. Customer-Based Brand Equity for a Destination[J]. Annals of Tourism Research, 2007, 34(2):400-421.
[11]谷文林,任敏.大数据时代乡村旅游数据挖掘与分析[J].江西农业学报,2015(8):143-146+150.
李世霞,田至美.基于百度指数的旅游目的地网络关注度影响因素分析——以青岛为例[J]. 首都师范大学学报(自然科学版), 2014(1): 56-59.
曾媛,等.大数据时代背景下我国乡村旅游电子商务系统发展的SWOT分析[J]. 南方农业学报, 2014(8): 1498-1506.
李玺,叶升,王东. 旅游目的地感知形象非结构化测量应用研究——以访澳商务游客形象感知特征为例[J].旅游学刊, 2011(12):57-63.
姚长宏. 旅游地形象感知偏差测评模型研究[J].旅游学刊,2009(1):29-32.
肖亮,赵黎明. 互联网传播的台湾旅游目的地形象——基于两岸相关网站的内容分析[J]. 旅游学刊,2009(3):75-81.
王小兰. 复杂社会网络结构条件下微信营销在乡村旅游营销中的应用研究[J]. 全国商情(经济理论研究), 2014(17):79-81.
责任编辑:王世燕