面向社交媒体的用户交互意图分析

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lt5185
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交媒体(微博、Twitter、Facebook等)深入发展和普及,人们越来越依赖于社交媒体分享个人经历、发表观点、表达意愿,并由此产生了海量用户生成内容。其中,交互意图广泛存在于社交媒体的用户讨论中,对社交媒体中用户交互行为的意图进行挖掘和分析可以有效支持舆情监控和辅助决策,在诸多领域具有十分重要的研究意义和应用价值。本论文工作聚焦社交媒体中的用户交互意图挖掘问题,利用智能分析技术手段,研究基于言语行为理论的用户交互意图分类及其识别方法,并以新浪微博数据为例,对所提出的交互意图识别方法进行有效性验证。论文工作包括三个方面:  1.用户交互意图分类体系构建与基于行为标记语词典的意图识别方法。针对现有用户意图类别定义分散、依赖特定领域的问题,参考言语行为分类框架,提出社交媒体中的用户交互意图分类体系;在此基础上,提出了一种基于行为标记语词典、结合外部信息源的用户交互意图识别方法,通过为每个意图类别构建其行为标记语词典,基于词典对用户交互意图进行分类。实验表明,所提出的行为标记语词典构建方法,能够较为准确地从大规模文本中挖掘行为标记语,用于用户交互意图识别。  2.基于词典自动标注语料与基于泛化特征的交互意图识别方法。为解决大规模语料标注的困难性,提出一种基于行为标记语词典自动标注语料的方法;在此基础上,从词项和短语中挖掘相关语法、语义及社交媒体特征,并结合学习算法对用户交互意图进行分类识别。实验表明,所提出的自动标注方法能有效提高大规模语料标注的精度,同时通过对所提炼特征的有效挖掘,能有效提升用户交互意图识别的效果。  3.基于对话序列的分层隐马尔可夫(Hidden Markov Model,HMM)交互意图识别模型。考虑到上下文信息对用户交互意图的影响,并结合句子和篇章不同层次的处理,提出一种基于分层HMM的交互意图识别模型,在句子级交互意图识别的基础上,建立对完整微博(包括原创帖子、转发和回复)表达中的主旨交互意图进行分析识别。实验表明,所提出的分层HMM交互意图识别模型,能有效结合不同层次的信息,在句子级和微博级,提升用户交互意图识别的效果。
其他文献
随着计算机、通信、网络、控制等技术的发展,在网络平台上构筑而成的网络控制系统(Networked Control System,NCS)已经成为自动化领域研究的热点。网络控制系统是一种通过网络
时间序列数据挖掘是数据挖掘领域中的一个重要的研究课题,有其自身的特点和难点。粗糙集理论作为一种强有力的数据分析和知识获取工具,正被越来越多的学者尝试应用到时间序列数
近年来,随着智能优化,智能计算的发展,混合进化算法以其全局搜索能力强、算法性能高等优点受到越来越多学者的关注。本文首先对混合进化算法的原理、机制、算法流程、框架及应用
针对动态环境下机器人路径规划研究更具有实际意义,本文利用粒子群优化算法(PSO)与人工势场法(APF)的混合优化策略,通过在栅格地图中实时动态更新环境信息,实现了动态环境中的路
位标器是一种应用于导引头上的两轴框架式天线稳定平台,其作用是实现天线对目标回波信号的稳定跟踪,保证导引头能够实时截获目标。随着导弹武器整体性能的不断提高,位标器稳
在生物特征识别技术中,人脸识别和人体检测是最自然、直接和友好的手段。理论上,人脸识别和人体检测的研究涉及多个学科领域,已经成为模式识别和人工智能领域中极富挑战性的
学位
文物是人类在其历史发展过程中遗留下来的遗物、遗迹。由于文物的历史价值和科研价值使得文物保护至关重要。本课题以博物馆微环境中有机气体浓度、温湿度监测为背景,研究开发
混沌是一种特殊复杂的非线性系统,普遍存在于自然界中。它已在生物学、物理学、化学、工程学和信息学等领域得到了广泛的应用。由于混沌系统具有内在的随机性和对初值的极端敏
乙烯生产最重要的指标是乙烯收率,裂解深度值及其变化直接关系到生产的稳定和整体经济效益,对整个生产过程至关重要。针对目前国内还无法在线获取准确的关键指标——裂解深度的
本文基于粗糙集理论,以不完备信息系统为对象,研究基于粗糙集理论的不完备信息系统的知识获取的理论与方法以及相关应用。主要内容如下:  首先,介绍了粗糙集理论的发展和国际