论文部分内容阅读
随着计算机网络技术的迅速发展,社交网络以它的实时性和高覆盖率受到了网民的高度关注和喜爱,其中所包含的信息量也在飞速增长。为了有效的利用这些海量信息,越来越多的研究开始面向社交网络中的信息抽取与分析。然而,当前基于社交网络的信息抽取与分析的研究存在两个问题:一是海量、散乱的信息无法满足研究者的常规的输入和检索需求;二是传统的研究只是针对历史的内容或是当前的信息,无法做到前瞻性和预测性。本文针对以上问题,通过对基于社交网络的信息抽取与分析技术的研究,针对如何来探索未来一段时间社交网络中流行词汇或者事情的需求,提出了基于微博的流行词预测系统,该系统以Twitter为信息来源,对Twitter中的信息进行了抽取和分析,同时,根据文本信息计算未来可能在社交网络上爆发的事件和词汇,分析用户信息和他们之间的行为关系,计算这些事件和词汇的传播趋势。通过实验表明了该系统的有效性和准确性达到了设计要求。