用户信誉度与用户生成内容质量评估模型研究

被引量 : 0次 | 上传用户:dickensking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0的到来促进了户成内容的繁荣发展,在促进知识传播与解决信息不对等的同时,同时也产了户恶意破坏他编辑的内容、伪造虚假评论、不尊重版权上传他成果等问题。这些问题的产使得对户信誉度与户成内容质量的评估成为必须。本先阐述了数据的获取、预处理与特征的抽取。我们以英维基百科作为知识分享类站的代表进研究,下载了英维基百科的数据,针对维基百科的章与作者的特点,我们抽取了量特征。我们随机抽取了3个类作为三个数据集,以数据集下的章与章的作者作为研究对象,并对章质量与作者的信誉度进标注,得到标准数据集。我们以亚马逊评论作为商务评论站的代表进研究,下载了亚马逊的评论数据,并随机的选取电产品下的评论与评论者作为研究对象,先对数据集进预处理解决数据稀疏性问题,针对亚马逊评论和评论者的特点,抽取了量特征,并通过标注对评论与评论者进标注,得到标准数据集。在维基百科中,我们提出了双翼因图模型,该模型利我们所抽取的特征集,将作者的信誉度与章质量的估测结合在统的模型中解决。我们通过L-BFGS算法对模型进学习,从获得各个因的权重,并在测试集上对章质量与作者的信誉度进估测以验证模型的正确性,我们选取了个模型作为基准法与我们的法进较,实验显我们的法在准确率和综合评价指标F1上都有较提。在亚马逊评论中,我们提出了评论因图模型,来检测评论中的虚假评论者与虚假评论,该模型将检测虚假评论者和虚假评论结合在统的模型中解决。我们通过L-BFGS算法对模型进学习,获得各个因的权重,并在测试集中检测虚假评论与虚假评论者以验证模型的正确性,我们还选取了个模型作为基准法与我们的法进较,我们的法在准确率和F1上都有较提。章最后总结了本主要作,并提出今后研究向的重点。
其他文献
目前钢管桁架拱和实腹式钢拱已经在大跨度工程中有比较广泛的应用。人们对它们的平面外稳定理论研究甚少,平面外稳定设计方法尚未完全建立。本文全面系统的研究了桁架拱和带支
随着消费对经济增长影响提升,通过内需拉动经济成为中国经济发展最重要的方向。$$中共中央政治局12月13日召开的分析研究2019年经济工作会议备受关注,在提出“坚持稳中求进”“
报纸
期刊
随着近年来我国集装箱港口运输领域的迅猛发展,桥吊的起升高度和运行速度逐步提高,一味沿袭以往在吊具上架上安装电缆储缆筐的方式已很难适用。实践证明,该方式只适用于起升高度
现代国家的筑建历经民族国家、官僚国家以及民主国家三大阶段。由于“民族—官僚—民主”的不断推进,国家的民主化程度日渐加深,国家的现代化历程也日益加速。同时,在现代国家的
背景与目的:当机体受到创(烧)伤、手术、休克等打击时,会产生一系列防御反应,由于创伤本身及机体的过度性防御可能造成全身性的损伤,以心、脑、肾、肝等重要远隔脏器的损伤较重
煤炭的消费增速在发展的过程中存在着周期性的波动变化,而且我国的煤炭波动和经济波动存在协同的关系。根据周期性的推演,我国煤炭的需求量要在2015年前后才会到达下一个上升
20世纪后期,历史研究的重点继续是从分析的社会科学转移到更加强调文化因素的方面来,但是面临着迅速变化的世界局面,却具有其更加繁富且已改变了的焦点。历史学家并未受到后
前言颅内海绵状血管瘤(cerebral cavernous malformation,CCM)是中枢神经系统血管畸形的一种,约占中枢神经系统血管畸形的9%左右,人群发生率为0.45%-O.9%,作为神经外科常见的