论文部分内容阅读
对具有长度短、结构复杂以及变形词多等特点的短文本倾向性分类进行深入研究,目的是提高倾向性分类的准确性和效率。以HowNet的情感词典为基础,提出一个微博新词发现算法,构建微博情感词典。在对文本进行分句、分词、标注、情感处理等后,构建一个自动机来计算短文本情感倾向性。为了客观评价该方法,选择基于HowNet的分类方法、基于SVM的分类方法进行比较性实验。实验结果表明提出的方法在一般文本分类上与SVM效果类似,在短文本上则具有明显的优势。同时该方法在效率上也具有突出优势。