论文部分内容阅读
近年来,社交网站、微博、微信、博客、论坛等社会媒体作为人们用来分享意见、经验和观点的平台,受到网民的热烈追捧,浏览社会媒体传播的信息已经成为网民日常生活不可或缺的部分。社会媒体的发展给网络用户提供了越来越多的功能和自由,使得网民能够很方便的提供信息、发布信息、参与各类话题事件的交流讨论。但是,由于信息内容的多样性、来源的不确定和消息传递的快捷性,使得网络信息中混杂了大量的不实信息,不实信息对社会媒体的带来了很大的负面影响,而且很多由不实信息中的事件的重要性,严重影响了社会舆论导向,给社会的稳定和发展带来了很大的危害。因为不实消息的内容的纷繁芜杂,网络语言的不正规性,以及网民对不同信息的不同反应,使得通过计算机算法很难去对不实信息的研究有较好的方法,也很难获得用户对某类不实信息的情感反馈和舆论导向。 本文基于在微博平台上,提出通过研究不实信息用户评论的方法,以达到对不实信息进行辅助判断和评论情感的分类。对手动收集的不实信息,在进行情感标注的基础上,按照社会影响和用户特征等方面进行分类研究,统计和分析了不同类话题的不实信息的用户情感分布和情感时间变化情况。在实验中通过对微博不实信息和真实信息的评论集合建立模型,进行特征选择,使用机器学习的方法得到有效的训练模型,能够对不实信息和真实信息做出辅助的分类判断;通过使用CRFs分类方法,以及大量的实验和工作找到合适的分类模板模型和测试方法,对不实信息中的参与的评论进行情感特征学习,能够有效对参与用户的情感做出较准确判断。本工作对不实信息下的用户情感的分布和时间变化的特点进行了较为全面的总结和分析,提出了辅助的判断不实信息的模型,并对不实信息下用户的情感分类找到一种合适的预测模型,对未来在不实信息方面的研究工作有一定的帮助作用。