基于图书特征及词典的豆瓣图书垃圾评论识别

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:jyc894784116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和便利,现如今国内外点评网站和各类商务网站高速发展,各类评论信息正在不断影响着人们的生活。豆瓣网就是很知名的网络社区,越来越多互联网用户会在豆瓣网上发表对电影、图书和音乐等的评论,同时越来越多的人们会在看电影前、看书前或者是听音乐前看看豆瓣上的评分和评论去决定是否去看或听。所以此时垃圾评论的识别就至关重要,因为垃圾评论会影响人们对这个事物真实的看法。文中引入了语义分析、图书特征词典和垃圾评论词典。语义分析有利于检测垃圾评论附加功能,同时会使用权重比例过滤模型检测垃圾评论。实验结果表明,文中
其他文献
随着互联网的急速发展,盗版,不健康,暴力等视频在网络上肆意流窜,如何快速、有效、准确地对视频数据进行管理,已然成为迫切需要解决的问题。在视频处理过程中,首先是对镜头进行分割,然后再进行视频帧的分析处理。然而许多视频内容的复杂性比较高,不一定能得到比较好的分割结果。鉴于此,提出一种基于互信息量和自回归模型的自适应阈值镜头分割算法。该算法首先以非均匀分块加权HSV直方图为基础,通过计算两帧的互信息量求
定义了最小超球面密度的概念,提出了一种基于最小超球面密度的孤立点检测算法(minimum hyper sphere density,MHSD)。该算法根据数据的 k 近邻和反 k 近邻获得数据的有效近邻
为了弥补传统K-means算法聚类效果严重依赖于初始聚类中心这一不足,提出了OICCK-means算法.将不加权算术平均组对法(UPGMA)进行改进,通过该算法将密集区域的数据合并得到可以反
围绕群体行为的特征提取问题展开研究,提出了一种基于融合运动特征和外观特征的群体行为识别方法。为了更有效地描述识别信息,首先将各行人目标看成网络的节点,利用协方差跟踪获得目标的运动轨迹,同时利用格兰杰因果关系检验来衡量行人之间的相互作用;然后利用此因果关系来构建成双因果网络和成群因果网络,将其作为运动特征,并结合外观特征来描述群体行为。最后,采用改进萤火虫算法的支持向量机(SVM)进行群体行为识别。
移动对象索引技术是有效管理海量移动对象数据的支撑.目前的移动对象索引方法如FNR-tree、NDTR-tree等均采用基于磁盘的索引结构,忽略了移动对象在城市道路上密度分布不均衡
目前基于卷积神经网络的学习方法需要大量的有标注的数据。而实际应用中,标记大量的数据是非常困难的。为了解决此问题,提出了一种基于卷积神经网络的无监督特征提取方法。该方法结合了局部保持投影(LPP)算法和卷积神经网络,LPP算法可以很好地保留图像局部结构。文中采用LPP算法来进行卷积核的学习。构建的网络结构简单有效,识别效率优于有监督的卷积神经网络。实验结果表明,该方法在真实条件下的人脸数据集Yale
目前国网公司在处理语言通信业务时,其行政话机都是通过人工查询通信录,并以手工方式进行拨号通话,效率很低,给用户带来了很多的不便。针对上述情况,文中提出了一种面向智能
衣服与人体的精确匹配是虚拟试衣系统中的关键问题之一.与以往的3D模型匹配、2D图像匹配等方法不同,提出了一种新型的基于2D图像变换的更具有人体贴合性的虚拟试衣算法.算法
粗糙集是一种处理不确定、不完全理论的经典理论,属性约简是粗糙集理论的核心知识之一。为适应大数据的发展,对广泛应用于数据不确定性、不完备性处理的属性约简算法相应改进,提
针对经典池化方式不能提取有效特征值的问题,提出了根据池化域的大小、池化域中的元素值和网络的训练次数调整池化结果的自适应池化法,并搭建了基于自适应池化的卷积神经网络