论文部分内容阅读
社交网络已被广泛地用于通过基于互联网的文本消息和图像在公共领域表达意见。Twitter的情感分析为组织提供了实时监控与他们相关的产品和事件的公众感觉的能力,成为公众情绪监测的有效途径。情感分析的第一步是数据的文本预处理。现有的关于Twitter情感分析的研究主要集中在新情感特征的提取上,而忽略对预处理方法的深入研究。在本文中,我们研究了基于支持向量机(SVM)、朴素贝叶斯、最大熵和基于人工神经网络的监督分类器在Twitter数据上的特征提取及分类方法。我们还提出了基于Mapreduce的主成分分析(MPC