论文部分内容阅读
随着计算机和网络技术的不断深入发展,如今的互联网已经迈进了社交媒体(social media)时代。用户既可以在社交媒体上对新闻时事、社会现实、消费产品等话题发表客观或主观的看法,又可以把身边的实时见闻、个人的生活琐事等发表在社交媒体上面。深入挖掘社交媒体中潜在的有用信息,对热点事件发现、舆情监控、商品口碑反馈等方面有重要应用。本文主要处理社交媒体中的热点发现及热点相关文本的情感分类问题,前两章对该问题的研究现状和基本技术进行了详细的介绍,然后针对现有研究的不足之处,在第三到五章分别针对热点发现任务、消息级情感分类任务和评价对象明确的情感分类任务提出了解决方法:(1)面向热点发现任务,提出了基于融合特征和绝对距离的在线热点发现算法。在对热点相关文本的表示中,本文使用规则方法和Kleinberg算法进行热点词汇的发现与选择,然后通过融合特征来对文本进行表示。同时,本文提出基于绝对距离的在线热点发现算法,能够及时有效地发现社交媒体中出现的热点。(2)面向消息级文本情感分类任务,针对文本情感表达中的情感偏移现象,提出了基于反转算法的对偶模型,提高了消息级文本情感分类的准确率。首先提出了一种文本情感反转算法,对原始文本构造一一对应的情感反转文本;然后本文提出了独立对偶训练模型和联合对偶训练模型,来对原始文本和反转文本进行建模表示学习;最后通过集成算法,对独立对偶模型和联合对偶模型进行综合考虑来获取更好的效果。本文提出的对偶模型在相关标准数据集上获得了明显的效果提升。(3)面向评价对象明确的文本情感分类任务,提出了评价对象独立表示的双边注意力神经网络模型。针对评价对象中往往包含多个词的现象,使用独立表示模块对评价对象进行表示学习;同时为了更好地获取评价对象上下文的语义和情感表示,本文提出了双边注意力机制,使情感指示词在表示中起到更重要的作用。本文提出的模型在标准数据集上取得目前最好的效果。