论文部分内容阅读
为了尽量减少科技产品领域虚假评论造成的影响以及提高虚假评论识别的准确率,基于该领域中文虚假评论制造及内容特点,提出了一种基于行为和内容的虚假评论识别方法.基于评论者发表评论数量、频率、长度建立了网络水军特征程度模型;提出了长度程度、专业程度、情感密度、格式规范程度、情感失衡程度等内容特征计算方法;最后,提出了以内容特征为向量,行为特征为调节参数的非监督聚类的科技产品虚假评论判别方法.利用领域评论数据集进行相应实验,结果表明所提出方法具有较高的准确率,且对同领域下不同主题的适应性较强.