论文部分内容阅读
〔摘 要〕运用数据挖掘技术得到旅游文本属性与特征已成为旅游研究的重要领域,对旅游微博发文主题的研究有助于旅游机构形象塑造及内容传播推广,对旅游机构的微博信息供给及旅游形象的提升具有一定意义。本研究首先对内容分析法在旅游研究的运用状况及国内外旅游微博相关方面的研究进行梳理;其次,以国家旅游局新浪微博的网络文本内容为研究对象,借助Rost word parser词频分析软件提取网络文本的高频特征词并进行筛选;再次,采用内容分析法,结合社会网络及共词分析法,得到网络文本高频词之间的社会网络联系;最后,探索高频词的属性及其之间的联系特征,在国家旅游局新浪微博的内容分析基础上,提炼出其微博内容分为人文景观、自然景观、游客出行、旅游政务信息4个主题。
〔关键词〕旅游;微博;内容分析法
DOI:10.3969/j.issn.1008-0821.2016.04.015
〔中图分类号〕F590.3 〔文献标识码〕A 〔文章编号〕1008-0821(2016)04-0085-05
〔Abstract〕Tough the network and application of data mining technology in acquiring attributes and characteristics of tourism text have been important for tourism research.Study in tourism microblog subjects helps travel agencies to build image and promote content communication,which benefits the information supply and tourism image promotion of travel agencies.This study reviewed the application of content analysis method in previous researches concerning tourism microblog at home and abroad.Extracting and screening high frequency characteristic words in microblog of China National Tourism Administration by the frequency analysis software Rost word parser,the study investigated social network connections among network text words of high frequency with the method of content analysis and co-word analysis.According to the characteristics and connections among them,findings showed that four subjects can be refined from Sina microblog of China National Tourism Administration,human landscape,natural landscape,tourists trip and tourism government information.
〔Key words〕tourism;microblog;content analysis method
社会化网络媒体使旅游业焕发出新的生机与活力,论坛、社区、博客等网络媒体是旅游业发展的催化剂。当旅游相遇微博,迸发出了前所未有的正能量,旅游微博在目前旅游业发展中备受瞩目,吸引了大量旅游机构的关注。旅游微博其低廉的成本、跨越时空的便利、广泛的参与及为决策提供有效信息供给等独特优势日臻显现,是旅游网络运营的全新平台[1-2]。旅游微博是旅游机构构建自身形象的一种有力工具[2],它借助语言、图片、视频等形式来实现旅游形象的塑造。尤其是在Web2.0环境下,关于旅游机构的大量信息在微博平台上交汇,越来越多的游客通过微博获取旅游信息,旅游机构微博直接影响游客的感知、评价及行为决策,进而引起游客的流动。随着旅游微博对旅游业的影响越来越大,旅游机构旅游微博的研究引起了国内外学者的关注。旅游机构可利用其传播信息快捷、便利的优势,实现与游客双向互动传播[3],因而成为旅游机构信息传播的重要平台[4],微博在一定程度上改变了人们搜索获取信息的方式[5-6],游客由被动推介变为主动接收。
旅游微博在一定程度上有利于解决旅游业长期以来存在的信息不对称问题[7],实现旅游机构与游客共享旅游信息[8]。旅游微博的在线评论对游客出游决策具有重要影响,会影响游客对旅游目的地的选择[2,9-10],据《2012-2013年中国在线旅游预订行业发展报告》显示,中国在线旅游预订网民的渗透率为22.4%,而且社会化媒体为在线旅游预订注入新的市场活力,19.4%的用户在旅行过程中或结束后会到新浪网络和腾讯网络分享旅行见闻,旅游机构网络形象对消费者行为的影响日益增强。而且旅游微博的内容、发布时间和版面设置影响游客的决策。随着旅游电子商务的快速发展,旅游微博已经成为游客获取信息的重要途径,影响游客的决策。目前,国内学者也刚开始涉及对旅游微博信息供给内容的研究,尤其是对大数据背景下的旅游微博数据搜集及挖掘尚未实质涉入。
内容分析法在旅游概念方面[11-15]、旅游感知方面[14-16]、旅游动机与行为方面[17-19]、旅游形象方面[20-25]、旅游安全方面[26-29]等领域都有所运用。其网络数据主要来源于网络论坛[18,23]、博客[25]、搜索引擎[21]、普通网页[19,20]。目前尚未有学者采用内容分析法对旅游微博进行研究。本研究通过内容分析法,结合社会网络和共词分析法对旅游微博的内容进行分析以获取旅游机构微博发文主题及特征,对旅游机构微博的建设及游客的信息获取内容提供了科学依据,对旅游机构的微博信息供给及旅游形象的提升具有一定意义。 1 研究方法
内容分析法是一种对内容进行客观、系统、量化分析的一种科学研究方法,以便从数据及其背景中得出可重复的有效推论[30],其能通过系统客观地分析信息的特有属性来获得推论[31]。通过内容分析是用一种系统、客观、量化的方式对内容做出分析[32-33],可以进行系统客观和定量分析[34]。内容分析法将非正式事物其正式化并系统化,从内容观察法中得出的结论[35],是研究传播的信息内容为主的方法。该方法能将文献里的文字内容变更为数据反映的分析结果,揭示事物运动、变化、发展的规律及趋势透过现象看本质。
内容分析法不仅需要聚焦于显性内容,同时也需要阐述内容与内容背后的抽象理论概念和揭示文本中隐含的信息,用来厘清文献中本质性的事实和趋势,分解出有效信息并加以分析。其基本操作是把媒介上的文字、非量化的信息转化为定量的数据,建立有意义的类目分解交流内容,并以此来分析信息的某些特征。内容分析法被大量应用在揭示文献内容的本质,并受到学者的推崇,使其应用范围大为拓展。
任何文本或者任何可以转换成为文本的传播内容都可以进行内容分析[36],网络信息内容分析是目前内容分析法的主要研究发展方向,对网站文本内容进行分析是网络信息内容分析的主要方式[37]。网络信息内容分析是通过提炼网络文本信息内容开展相关主题的研究,将网络传播研究与内容分析法相结合,对网络文本内容进行客观、系统、定量描述的研究方法。近年来,内容分析法运用在情报学、新闻学、社会学、工商管理等研究领域得到很好的运用。
本研究使用内容分析法对微博文本中出现的高频词汇进行语义网络分析,通过共现分析构建出高频词语义之间关系。不同词语之间共现次数表示之间交互的亲密程度,线条越粗表示两者联系越紧密,相反联系越小。通过不同词语之间的关系分析得到旅游微博文本中重要的文本信息,并通过语义的社会网络关系得到微博发文的主题及语义之间关系。
2 研究样本及数据选取
2.1 研究样本选取
本文以国家旅游局新浪微博“中国旅游”为例,2011年4月2日,国家旅游局官方资讯微博在新浪落户,“中国旅游”新浪微博是国家旅游局信息中心是国家旅游局联合各省、市、自治区旅游局,共同打造的一个官方旅游资讯发布平台,服务广大游客,宣传中国旅游打造的一个官方旅游资讯发布平台,将合力打造全国覆盖面最广、影响力最大的旅游资讯发布平台。该微博是为游客提供旅游资讯和权威出行提示的重要窗口,也是游客与官方零距离互动、沟通的平台。《2013年新浪政务微博报告》显示,国家旅游局官方微博在国内政务旅游微博中排名第一,因此选取国家旅游局新浪微博“中国旅游”为研究样本具有一定的代表性。
2.2 数据选取
本研究按以下两个条件进行筛选:第一,时间限制,选择2011年4月2日至2014年6月2日时间段的“中国旅游”新浪微博内容。第二,内容限制,选取该时间段内微博文本内容,通过以上条件筛选得到2 300余个有效网络文本。
2.3 高频特征词选取
使用ROST Content Mining软件对保存后的“中国旅游”微博文档进行词频分析,对文本样本进行分词之后进行词频统计,使用词频分析功能生成词语频数表,并过滤无实际意义的词,按照词汇频数从高到低选取102个有效高频词。以选取的高频词作为分析“中国旅游”微博发文主题的样本。
3 旅游微博内容主题分析
旅游微博发文主题的社会网络联系如图1所示。
通过对“中国旅游”微博发文内容的高频词间社会网络联系可见:文化、历史、自然、文化、遗产、遗迹、文物、建筑等词汇涉及旅游人文景观;水乡、古镇、自然、秀丽、景区、自然、森林等词汇涉及旅游自然景观,出行、游客、文明、游客、天气、旅游、游客、享受等词汇涉及游客出行;旅游局、交易会、旅游、报道、新浪、旅游、优惠、门票、免费、开放等词汇涉及旅游政务信息。可将“中国旅游”微博发文基本内容归纳为4类主题,即人文景观、自然景观、游客出行、旅游政务信息,较为全面地概括“中国旅游”新浪微博的基本内容。
3.1 人文景观
由图1可知,“中国旅游”微博高频词一部分以“文化、历史、自然、文化、遗产、遗迹、文物、建筑” 等词语为中心呈现分布。该区域周边分布有“艺术、传统、民族、悠久、保护、特色”等词语。通过共现联系及词频可见,主要以文化—历史、自然—文化、文化—遗产、历史—遗迹的联系为主,并通过与“中国旅游”微博发文内容相结合分析,微博原文代表性描述有:
3.1.1 文化—历史
西夏陵又称西夏王陵、西夏帝陵,是西夏历代帝王陵墓所在地,有“东方金字塔”之称。坐落在银川市西郊贺兰山东麓,距市区大约35公里,营建年代约自11世纪初至13世纪初。是我国最大的西夏文化遗址,也是宁夏最重要的一处历史遗产和最具神秘色彩的文化景观。
3.1.2 文化—遗产
中国大陆首部聚焦世界文化遗产“土楼建筑与客家文化”的少儿读物长篇动漫剧集同名有声漫画书《牛牛和妞妞·土楼探险》系列图书最近面世。《牛牛和妞妞·土楼探险》再现了客家土楼的历史与艺术风貌,展示了客家人善良、勇敢等优秀品质,使小读者了解祖国的山水风光、风土人情和传统文化。
3.1.3 历史—遗迹
樟脚村,位于惠安、泉港、仙游交界处。近年,樟脚村由于集合了百座色彩斑斓的古民居、金钟潭火山岩遗迹等历史人文景点,成为闻名遐迩的“油画村”、“摄影村”,采风的画家、摄影师不计其数,甚至建立了摄影基地。
3.2 自然景观
由图1可知,“中国旅游”微博高频词一部分以“水乡、古镇、自然、秀丽、景区、自然、森林”等词语为中心呈现分布。该区域周边分布有“保护区、资源、风光、避暑、景点”等词语。通过共现联系及词频可见,主要以水乡—古镇、自然—秀丽、景区—自然、自然—森林的联系为主。并通过与“中国旅游”微博发文内容相结合分析,微博原文代表性描述有:
〔关键词〕旅游;微博;内容分析法
DOI:10.3969/j.issn.1008-0821.2016.04.015
〔中图分类号〕F590.3 〔文献标识码〕A 〔文章编号〕1008-0821(2016)04-0085-05
〔Abstract〕Tough the network and application of data mining technology in acquiring attributes and characteristics of tourism text have been important for tourism research.Study in tourism microblog subjects helps travel agencies to build image and promote content communication,which benefits the information supply and tourism image promotion of travel agencies.This study reviewed the application of content analysis method in previous researches concerning tourism microblog at home and abroad.Extracting and screening high frequency characteristic words in microblog of China National Tourism Administration by the frequency analysis software Rost word parser,the study investigated social network connections among network text words of high frequency with the method of content analysis and co-word analysis.According to the characteristics and connections among them,findings showed that four subjects can be refined from Sina microblog of China National Tourism Administration,human landscape,natural landscape,tourists trip and tourism government information.
〔Key words〕tourism;microblog;content analysis method
社会化网络媒体使旅游业焕发出新的生机与活力,论坛、社区、博客等网络媒体是旅游业发展的催化剂。当旅游相遇微博,迸发出了前所未有的正能量,旅游微博在目前旅游业发展中备受瞩目,吸引了大量旅游机构的关注。旅游微博其低廉的成本、跨越时空的便利、广泛的参与及为决策提供有效信息供给等独特优势日臻显现,是旅游网络运营的全新平台[1-2]。旅游微博是旅游机构构建自身形象的一种有力工具[2],它借助语言、图片、视频等形式来实现旅游形象的塑造。尤其是在Web2.0环境下,关于旅游机构的大量信息在微博平台上交汇,越来越多的游客通过微博获取旅游信息,旅游机构微博直接影响游客的感知、评价及行为决策,进而引起游客的流动。随着旅游微博对旅游业的影响越来越大,旅游机构旅游微博的研究引起了国内外学者的关注。旅游机构可利用其传播信息快捷、便利的优势,实现与游客双向互动传播[3],因而成为旅游机构信息传播的重要平台[4],微博在一定程度上改变了人们搜索获取信息的方式[5-6],游客由被动推介变为主动接收。
旅游微博在一定程度上有利于解决旅游业长期以来存在的信息不对称问题[7],实现旅游机构与游客共享旅游信息[8]。旅游微博的在线评论对游客出游决策具有重要影响,会影响游客对旅游目的地的选择[2,9-10],据《2012-2013年中国在线旅游预订行业发展报告》显示,中国在线旅游预订网民的渗透率为22.4%,而且社会化媒体为在线旅游预订注入新的市场活力,19.4%的用户在旅行过程中或结束后会到新浪网络和腾讯网络分享旅行见闻,旅游机构网络形象对消费者行为的影响日益增强。而且旅游微博的内容、发布时间和版面设置影响游客的决策。随着旅游电子商务的快速发展,旅游微博已经成为游客获取信息的重要途径,影响游客的决策。目前,国内学者也刚开始涉及对旅游微博信息供给内容的研究,尤其是对大数据背景下的旅游微博数据搜集及挖掘尚未实质涉入。
内容分析法在旅游概念方面[11-15]、旅游感知方面[14-16]、旅游动机与行为方面[17-19]、旅游形象方面[20-25]、旅游安全方面[26-29]等领域都有所运用。其网络数据主要来源于网络论坛[18,23]、博客[25]、搜索引擎[21]、普通网页[19,20]。目前尚未有学者采用内容分析法对旅游微博进行研究。本研究通过内容分析法,结合社会网络和共词分析法对旅游微博的内容进行分析以获取旅游机构微博发文主题及特征,对旅游机构微博的建设及游客的信息获取内容提供了科学依据,对旅游机构的微博信息供给及旅游形象的提升具有一定意义。 1 研究方法
内容分析法是一种对内容进行客观、系统、量化分析的一种科学研究方法,以便从数据及其背景中得出可重复的有效推论[30],其能通过系统客观地分析信息的特有属性来获得推论[31]。通过内容分析是用一种系统、客观、量化的方式对内容做出分析[32-33],可以进行系统客观和定量分析[34]。内容分析法将非正式事物其正式化并系统化,从内容观察法中得出的结论[35],是研究传播的信息内容为主的方法。该方法能将文献里的文字内容变更为数据反映的分析结果,揭示事物运动、变化、发展的规律及趋势透过现象看本质。
内容分析法不仅需要聚焦于显性内容,同时也需要阐述内容与内容背后的抽象理论概念和揭示文本中隐含的信息,用来厘清文献中本质性的事实和趋势,分解出有效信息并加以分析。其基本操作是把媒介上的文字、非量化的信息转化为定量的数据,建立有意义的类目分解交流内容,并以此来分析信息的某些特征。内容分析法被大量应用在揭示文献内容的本质,并受到学者的推崇,使其应用范围大为拓展。
任何文本或者任何可以转换成为文本的传播内容都可以进行内容分析[36],网络信息内容分析是目前内容分析法的主要研究发展方向,对网站文本内容进行分析是网络信息内容分析的主要方式[37]。网络信息内容分析是通过提炼网络文本信息内容开展相关主题的研究,将网络传播研究与内容分析法相结合,对网络文本内容进行客观、系统、定量描述的研究方法。近年来,内容分析法运用在情报学、新闻学、社会学、工商管理等研究领域得到很好的运用。
本研究使用内容分析法对微博文本中出现的高频词汇进行语义网络分析,通过共现分析构建出高频词语义之间关系。不同词语之间共现次数表示之间交互的亲密程度,线条越粗表示两者联系越紧密,相反联系越小。通过不同词语之间的关系分析得到旅游微博文本中重要的文本信息,并通过语义的社会网络关系得到微博发文的主题及语义之间关系。
2 研究样本及数据选取
2.1 研究样本选取
本文以国家旅游局新浪微博“中国旅游”为例,2011年4月2日,国家旅游局官方资讯微博在新浪落户,“中国旅游”新浪微博是国家旅游局信息中心是国家旅游局联合各省、市、自治区旅游局,共同打造的一个官方旅游资讯发布平台,服务广大游客,宣传中国旅游打造的一个官方旅游资讯发布平台,将合力打造全国覆盖面最广、影响力最大的旅游资讯发布平台。该微博是为游客提供旅游资讯和权威出行提示的重要窗口,也是游客与官方零距离互动、沟通的平台。《2013年新浪政务微博报告》显示,国家旅游局官方微博在国内政务旅游微博中排名第一,因此选取国家旅游局新浪微博“中国旅游”为研究样本具有一定的代表性。
2.2 数据选取
本研究按以下两个条件进行筛选:第一,时间限制,选择2011年4月2日至2014年6月2日时间段的“中国旅游”新浪微博内容。第二,内容限制,选取该时间段内微博文本内容,通过以上条件筛选得到2 300余个有效网络文本。
2.3 高频特征词选取
使用ROST Content Mining软件对保存后的“中国旅游”微博文档进行词频分析,对文本样本进行分词之后进行词频统计,使用词频分析功能生成词语频数表,并过滤无实际意义的词,按照词汇频数从高到低选取102个有效高频词。以选取的高频词作为分析“中国旅游”微博发文主题的样本。
3 旅游微博内容主题分析
旅游微博发文主题的社会网络联系如图1所示。
通过对“中国旅游”微博发文内容的高频词间社会网络联系可见:文化、历史、自然、文化、遗产、遗迹、文物、建筑等词汇涉及旅游人文景观;水乡、古镇、自然、秀丽、景区、自然、森林等词汇涉及旅游自然景观,出行、游客、文明、游客、天气、旅游、游客、享受等词汇涉及游客出行;旅游局、交易会、旅游、报道、新浪、旅游、优惠、门票、免费、开放等词汇涉及旅游政务信息。可将“中国旅游”微博发文基本内容归纳为4类主题,即人文景观、自然景观、游客出行、旅游政务信息,较为全面地概括“中国旅游”新浪微博的基本内容。
3.1 人文景观
由图1可知,“中国旅游”微博高频词一部分以“文化、历史、自然、文化、遗产、遗迹、文物、建筑” 等词语为中心呈现分布。该区域周边分布有“艺术、传统、民族、悠久、保护、特色”等词语。通过共现联系及词频可见,主要以文化—历史、自然—文化、文化—遗产、历史—遗迹的联系为主,并通过与“中国旅游”微博发文内容相结合分析,微博原文代表性描述有:
3.1.1 文化—历史
西夏陵又称西夏王陵、西夏帝陵,是西夏历代帝王陵墓所在地,有“东方金字塔”之称。坐落在银川市西郊贺兰山东麓,距市区大约35公里,营建年代约自11世纪初至13世纪初。是我国最大的西夏文化遗址,也是宁夏最重要的一处历史遗产和最具神秘色彩的文化景观。
3.1.2 文化—遗产
中国大陆首部聚焦世界文化遗产“土楼建筑与客家文化”的少儿读物长篇动漫剧集同名有声漫画书《牛牛和妞妞·土楼探险》系列图书最近面世。《牛牛和妞妞·土楼探险》再现了客家土楼的历史与艺术风貌,展示了客家人善良、勇敢等优秀品质,使小读者了解祖国的山水风光、风土人情和传统文化。
3.1.3 历史—遗迹
樟脚村,位于惠安、泉港、仙游交界处。近年,樟脚村由于集合了百座色彩斑斓的古民居、金钟潭火山岩遗迹等历史人文景点,成为闻名遐迩的“油画村”、“摄影村”,采风的画家、摄影师不计其数,甚至建立了摄影基地。
3.2 自然景观
由图1可知,“中国旅游”微博高频词一部分以“水乡、古镇、自然、秀丽、景区、自然、森林”等词语为中心呈现分布。该区域周边分布有“保护区、资源、风光、避暑、景点”等词语。通过共现联系及词频可见,主要以水乡—古镇、自然—秀丽、景区—自然、自然—森林的联系为主。并通过与“中国旅游”微博发文内容相结合分析,微博原文代表性描述有: