基于KNN和Bayes算法的组合分类器的垃圾评论识别研究

来源 :经济数学 | 被引量 : 0次 | 上传用户:gxblackjack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
产品垃圾评论在一定程度上影响了评论信息的参考价值,本文旨在建立识别模型将垃圾评论从评论文本中剔除,保留真实的产品评论。首先,分析了产品评论的特点,从数据搜集、文本预处理、互信息检验、文本表示4个模块提取了14个特征。然后,利用高互补性建立了基于KNN和Bayes算法的组合分类器模型。最后,利用交叉验证对iPhone6Plus的产品评论进行检验,得到评价指标分别为:正确识别率75.3%、召回率82.1%以及F1值77.5%.
其他文献
目的:探讨SIRT4对胃癌细胞增殖及细胞周期的作用及其机制。方法:用慢病毒构建过表达SIRT4的胃癌细胞株SGC-7901和MNK45,通过体外细胞增殖活力实验和平板克隆实验研究过表达SI
库存管理是供应链管理的重要内容之一,是实现价值链增值的重要环节,对供应链的协调发展起着至关重要的作用。但是在当今全球化市场环境中,客户需求日益呈现出不确定性、多样
研究了 Ba Ti O3基抗还原陶瓷材料的结构和介电性质 ,讨论了 Zr O2 、Mn O和 BT系中摩尔比 m对瓷料抗还原性能和介电性能的影响 .通过调整上述参量并加入适量的添加剂 ,获得
随着计算机技术和网络技术的不断发展,船舶交通管理系统正向着数字化不断发展,出现了以交管雷达为核心的功能越来越强大的交管系统。在某些方面,交管雷达的可靠性比船用雷达
当今全球经济一体化,各类信息的提供、获取、服务为各类综合电信运营商提供了一个前所未有的挑战与机会。随着3G牌照的发放,各企业之间的最终的竞争必将体现为核心能力的竞争
本文提出了余华创作过程中所遭遇的困境这个命题,分析了余华遭遇这些困境的原因,并对他试图突破创作瓶颈的努力做了分析。很多研究者在一些文章中提到或者谈到余华的创作瓶颈
《夜谭随录》是清代满族作家和邦额所著的一部志怪传奇小说集。书中描写了独特的塞外风光和异域的风土人情,反映了满族人民的社会生活和文化风尚,内容新奇、丰富。作者同情下
本文以银耳(Tremella fuciformis)菌丝和香灰(Hypoxylon sp.)菌丝为材料,从三个方面研究了这两种菌丝之间的相互作用关系:(1)利用光学显微镜、扫描电子显微镜观察它们的菌丝
国内关于大学生职业价值观的研究比较丰富,然而关于公务员尤其是港澳地区公务员的文献还比较少。本文把心理学的研究方法应用在澳门公务员的职业价值观结构的研究上,探讨澳门
随着世界上聚酯工业的迅猛发展,由此产生的废聚酯日益增多,废聚酯的回收再利用对缓解世界石油危机、减少废弃物对环境的污染具有重要的意义。化学回收方法是最终解决废聚酯回