论文部分内容阅读
随着客观世界各领域信息化的不断发展,多元化数据的指数级增长趋势愈加明显,大数据(big data)概念应运而生,它代表着人类认知过程的进步,是继云计算、物联网等技术之后的又一次伟大变革。大数据中有相当一部分源于人类的生产和生活,而传感技术的进步使得理解人类的活动成为了可能,人们开始尝试使用计算机技术理解和运用人类社会的自然语言,情感计算应时而生,其相关理论及技术得到不断提升和完善。
旅游是人类的一种生活方式,情感贯穿于旅游活动的始终。旅游前游客通过搜索目的地信息进行旅游决策、旅游预订,旅游中游客可以基于地理位置分享即时的情感(积极或消极情感体验),旅游后游客会对旅游整个过程进行满意或失望的评述(博客、旅游虚拟社区)。这些基于Web2.0,通过移动互联网进行信息的发布,用户创造内容构成了旅游大数据的主要数据源,在情感计算等技术的支撑下,挖掘旅游大数据所包含的情感成为了旅游研究的新方向。
一、大数据视角下旅游情感研究的路径
对于大数据的分析和应用,需要不同领域专家建构分析模型,这些模型能够为情感理论的拓展和情感实践的延展分析提供有效的分析工具。总结来说,大数据视角下的情感研究遵循“数据——情感计算——情感分析模型——理论和实践工程”的路径展开。
1. 大数据:旅游情感研究的数据源
大数据是连接物理空间(physical space)、信息空间(cyberspace)和人类社会(human society)三元世界的纽带,其数据源涵盖科学研研究、社交网络、电子商务、物联网、移动通信等多个领域,蕴含巨大的社会价值。尤其是Web2.0 环境下,搜索引擎、社交媒体、电商平台迅猛发展,非结构化数据、异构内容、个性化内容呈指数级增长,用户自生成内容(UGC)成为了一种新兴的网络信息资源创作与组织模式,其内容涵盖娱乐、商业、社交、兴趣、舆论等类型。旅游大数据源包括Facebook、Twitter、微博、旅游虚拟社区等社交媒体产生的各类的短评和游记,在旅游电商平台(OTA)购物后留下的评论信息等多种类型。这些UGC内容中蕴含着丰富的情感信息,为深入挖掘用户情感提供了海量数据。以文本形式呈现的UGC成为了情感分析和观点挖掘(sentiment analysis and opinion mining)的重要来源,尤其是UGC用户创造的大量主观文本和复杂交互式文本,具有更多的主观能动性、多样性和情感的复杂性。
2. 情感计算:旅游情感研究的推动力
近年来,“情感”也引起了学者们越来越多的关注,尤其是在大数据背景下,越来越多的学者开始尝试利用不断发展的计算机技术对情感进行量化研究。其中,“情感计算”概念的提出对于情感研究来说具有里程碑式的意义,其目的是赋予计算机识别、理解、表达和适应人的情感的能力,使逻辑计算与感性情感实现有机融合,使计算机具有更高的、全面的智能。通过强大的存储和计算能力,计算机可获取各种设备上的海量情感信号,建立情感数据库,标注情绪并提取反映情感状态的特征,训练识别情感的模型,进而映射外在情感表现,理解并反馈情感状态,进而达到情感交流的目的,即情感信号的获取、情感状态的识别、情感理解和反馈以及情感表达。国内外也已经有了很多的关于情感计算的模型和软件,这些都为情感分析提供了有力的工具,推动着基于大数据的情感计算和分析。
3. 情感分析模型:理解情感行为的钥匙
情感研究的终极目标是理解人类的情感体验和情感行为,量化后的情感数据为进一步的研究提供了基础性资料,因此在游客情感计算的基础上,更为重要的任务是构建游客情感分析的框架和模型,这是游客情感研究的核心所在。情感分析模型是在情感计算基础上是对数据的深层次挖掘。不同领域的专家利用量化的情感数据,根据研究和应用目的,构建领域内的情感分析模型,这些模型包括游客情感体验时空分析模型,游客情感—满意度分异模型,游客情感的影响因素分析模型等,通过这些应用和理论模型的分析,可以揭示游客情感体验的规律,分析影响因素,最终理解游客的情感行为。
二、大数据游客情感体验研究的展望
1. 游客情感计算及其模型的进一步优化
在计算机科学、心理学、生理学、神经科学、认知科学等学科的共同推动下,情感计算取得了较为丰硕的成果。但情感计算是一个高度综合化的领域,如何提高计算机感知情境、进一步理解人类情感和意图仍是情感计算面临的巨大挑战。情感是一个多成分的复合过程,包括内在体验、外显表情和生理激活三种成分,且情感状态与情感信号之间存在复杂的映射,虽然多模态信息融合技术可使计算机同步分析视频、音频、生理指标等多种信息,但情感的變化受到具体情境和个人因素的影响,因此如何针对不同情境和不同群体进行情感计算建模,如何处理个性和共性之间的矛盾成为情感计算亟待解决的问题。尤其是针对UGC文本的“情感分析技术”,主要涉及两种方法,分别为基于机器学习的方法和基于情感词典的方法。针对游客这一类特殊群体的情感计算不仅具有一般的共性特征,同时也有其特殊之处,因此专门针对游客情感计算的机器学习和情感词提取以及计算规则的研究是游客情感计算的核心所在。同时,不同语境之下情感词具有不同的情感意义,因此精确提取情感词的特征仍有待进一步优化,如机器学习算法的精进,情感词典的自动构建等仍需要进一步的深化研究。
2. 构建基于大数据的情感——满意度分析模型
情感要素不仅影响游客目的地选择决策,而且影响游客在旅游体验过程中的满意度判断。情感对于分析满意度必不可缺,因而构建情感——满意度的判断模型势在必行,可以利用大数据直接进行满意度的分析,省时省力。通过对微博、游客点评、游记、评论等旅游大数据的分析,研究游客在旅游活动过程中体验到了哪些类别的情感(积极或消极),其典型情感与游客之间以及满意度之间的关系,构建情感满意度分析方法和模型。
3. 情感时空的纵深拓展
流动性是旅游活动的一个重要特征,尤其是游客情感贯穿于旅游活动的始终,并随旅游者的时空转移而不断发生变化,产生诸如愉悦、兴奋、惊奇、疑惑、忧愁、恐惧、愤怒等多种情感,这些情感会随着旅游的动态过程而呈现出多样化和易变性的特点。游客情感研究的传统方法——“感官日志”法,无论对研究者还是被调查者来说均是一种毅力的挑战,但微博、游记等社会化媒体数据,具有典型的时空特征。通过挖掘上述旅游大数据,可以分析不同时空尺度下游客情感体验的波动规律,不同主题类型旅游目的地(景区)游客情感体验的变化,不同游客群体的情感时空对比,研究游客时空情感变化的影响因素及其变化机制。
4. 情感研究的隐私保护
大数据蕴藏着巨大的社会价值,但对其挖掘和分析人存在一个不可避免的挑战,这就是个人隐私。在旅游领域,对承载着游客丰富个人情感的旅游大数据的分析,可能会遇到更多的隐私问题。首先,游客情感数据本身的非公开性。其次,游客在旅游过程中的表演性行为问题,即语言、文字、图片、视频等并未展示游客的真实情感,那么如何探析这些情感的真实性,如何让游客不认为研究者在窥探其隐私的情况下,剖析非语言行为和难以被表达的情感。最后,获取情感数据的原则和监管机制的构建,即如何在保密的原则下,严谨、客观地获取数据,如何归属个人数据的法律责任,如何监督个人数据的使用,制定完善的监管机制成为未来的重要挑战。
旅游是人类的一种生活方式,情感贯穿于旅游活动的始终。旅游前游客通过搜索目的地信息进行旅游决策、旅游预订,旅游中游客可以基于地理位置分享即时的情感(积极或消极情感体验),旅游后游客会对旅游整个过程进行满意或失望的评述(博客、旅游虚拟社区)。这些基于Web2.0,通过移动互联网进行信息的发布,用户创造内容构成了旅游大数据的主要数据源,在情感计算等技术的支撑下,挖掘旅游大数据所包含的情感成为了旅游研究的新方向。
一、大数据视角下旅游情感研究的路径
对于大数据的分析和应用,需要不同领域专家建构分析模型,这些模型能够为情感理论的拓展和情感实践的延展分析提供有效的分析工具。总结来说,大数据视角下的情感研究遵循“数据——情感计算——情感分析模型——理论和实践工程”的路径展开。
1. 大数据:旅游情感研究的数据源
大数据是连接物理空间(physical space)、信息空间(cyberspace)和人类社会(human society)三元世界的纽带,其数据源涵盖科学研研究、社交网络、电子商务、物联网、移动通信等多个领域,蕴含巨大的社会价值。尤其是Web2.0 环境下,搜索引擎、社交媒体、电商平台迅猛发展,非结构化数据、异构内容、个性化内容呈指数级增长,用户自生成内容(UGC)成为了一种新兴的网络信息资源创作与组织模式,其内容涵盖娱乐、商业、社交、兴趣、舆论等类型。旅游大数据源包括Facebook、Twitter、微博、旅游虚拟社区等社交媒体产生的各类的短评和游记,在旅游电商平台(OTA)购物后留下的评论信息等多种类型。这些UGC内容中蕴含着丰富的情感信息,为深入挖掘用户情感提供了海量数据。以文本形式呈现的UGC成为了情感分析和观点挖掘(sentiment analysis and opinion mining)的重要来源,尤其是UGC用户创造的大量主观文本和复杂交互式文本,具有更多的主观能动性、多样性和情感的复杂性。
2. 情感计算:旅游情感研究的推动力
近年来,“情感”也引起了学者们越来越多的关注,尤其是在大数据背景下,越来越多的学者开始尝试利用不断发展的计算机技术对情感进行量化研究。其中,“情感计算”概念的提出对于情感研究来说具有里程碑式的意义,其目的是赋予计算机识别、理解、表达和适应人的情感的能力,使逻辑计算与感性情感实现有机融合,使计算机具有更高的、全面的智能。通过强大的存储和计算能力,计算机可获取各种设备上的海量情感信号,建立情感数据库,标注情绪并提取反映情感状态的特征,训练识别情感的模型,进而映射外在情感表现,理解并反馈情感状态,进而达到情感交流的目的,即情感信号的获取、情感状态的识别、情感理解和反馈以及情感表达。国内外也已经有了很多的关于情感计算的模型和软件,这些都为情感分析提供了有力的工具,推动着基于大数据的情感计算和分析。
3. 情感分析模型:理解情感行为的钥匙
情感研究的终极目标是理解人类的情感体验和情感行为,量化后的情感数据为进一步的研究提供了基础性资料,因此在游客情感计算的基础上,更为重要的任务是构建游客情感分析的框架和模型,这是游客情感研究的核心所在。情感分析模型是在情感计算基础上是对数据的深层次挖掘。不同领域的专家利用量化的情感数据,根据研究和应用目的,构建领域内的情感分析模型,这些模型包括游客情感体验时空分析模型,游客情感—满意度分异模型,游客情感的影响因素分析模型等,通过这些应用和理论模型的分析,可以揭示游客情感体验的规律,分析影响因素,最终理解游客的情感行为。
二、大数据游客情感体验研究的展望
1. 游客情感计算及其模型的进一步优化
在计算机科学、心理学、生理学、神经科学、认知科学等学科的共同推动下,情感计算取得了较为丰硕的成果。但情感计算是一个高度综合化的领域,如何提高计算机感知情境、进一步理解人类情感和意图仍是情感计算面临的巨大挑战。情感是一个多成分的复合过程,包括内在体验、外显表情和生理激活三种成分,且情感状态与情感信号之间存在复杂的映射,虽然多模态信息融合技术可使计算机同步分析视频、音频、生理指标等多种信息,但情感的變化受到具体情境和个人因素的影响,因此如何针对不同情境和不同群体进行情感计算建模,如何处理个性和共性之间的矛盾成为情感计算亟待解决的问题。尤其是针对UGC文本的“情感分析技术”,主要涉及两种方法,分别为基于机器学习的方法和基于情感词典的方法。针对游客这一类特殊群体的情感计算不仅具有一般的共性特征,同时也有其特殊之处,因此专门针对游客情感计算的机器学习和情感词提取以及计算规则的研究是游客情感计算的核心所在。同时,不同语境之下情感词具有不同的情感意义,因此精确提取情感词的特征仍有待进一步优化,如机器学习算法的精进,情感词典的自动构建等仍需要进一步的深化研究。
2. 构建基于大数据的情感——满意度分析模型
情感要素不仅影响游客目的地选择决策,而且影响游客在旅游体验过程中的满意度判断。情感对于分析满意度必不可缺,因而构建情感——满意度的判断模型势在必行,可以利用大数据直接进行满意度的分析,省时省力。通过对微博、游客点评、游记、评论等旅游大数据的分析,研究游客在旅游活动过程中体验到了哪些类别的情感(积极或消极),其典型情感与游客之间以及满意度之间的关系,构建情感满意度分析方法和模型。
3. 情感时空的纵深拓展
流动性是旅游活动的一个重要特征,尤其是游客情感贯穿于旅游活动的始终,并随旅游者的时空转移而不断发生变化,产生诸如愉悦、兴奋、惊奇、疑惑、忧愁、恐惧、愤怒等多种情感,这些情感会随着旅游的动态过程而呈现出多样化和易变性的特点。游客情感研究的传统方法——“感官日志”法,无论对研究者还是被调查者来说均是一种毅力的挑战,但微博、游记等社会化媒体数据,具有典型的时空特征。通过挖掘上述旅游大数据,可以分析不同时空尺度下游客情感体验的波动规律,不同主题类型旅游目的地(景区)游客情感体验的变化,不同游客群体的情感时空对比,研究游客时空情感变化的影响因素及其变化机制。
4. 情感研究的隐私保护
大数据蕴藏着巨大的社会价值,但对其挖掘和分析人存在一个不可避免的挑战,这就是个人隐私。在旅游领域,对承载着游客丰富个人情感的旅游大数据的分析,可能会遇到更多的隐私问题。首先,游客情感数据本身的非公开性。其次,游客在旅游过程中的表演性行为问题,即语言、文字、图片、视频等并未展示游客的真实情感,那么如何探析这些情感的真实性,如何让游客不认为研究者在窥探其隐私的情况下,剖析非语言行为和难以被表达的情感。最后,获取情感数据的原则和监管机制的构建,即如何在保密的原则下,严谨、客观地获取数据,如何归属个人数据的法律责任,如何监督个人数据的使用,制定完善的监管机制成为未来的重要挑战。