【摘 要】
:
随着移动互联网时代的到来,App软件行业开始呈现“井喷式”发展,而市场竞争也日益激烈,作为App质量评判之一的评论板块充斥着大量虚假评论,因此亟需有效识别过滤App虚假评论
论文部分内容阅读
随着移动互联网时代的到来,App软件行业开始呈现“井喷式”发展,而市场竞争也日益激烈,作为App质量评判之一的评论板块充斥着大量虚假评论,因此亟需有效识别过滤App虚假评论来维护消费者及开放商权益,维持市场合理有序健康发展。本文利用真实场景下国内某款App的用户数据,从统计模型和算法模型两个维度出发,建立多种分类模型并对其进行综合评价,旨在提供一种高效的App虚假评论识别方法。本文的主要工作概述如下:1.App用户数据的预处理。首先对App用户数据进行脱敏化处理,再对脱敏数据进行缺失值处理、异常值处理以及数据变换等清洗操作,形成可供建模分析的有效高质量数据集。2.App用户数据的描述性统计分析。利用密度图、箱线图、散点图以及列联表检验等方法来初步探索App用户数据的特征规律,为后续影响因素分析以及模型建立提供指导依据。3.构建App虚假评论识别的logistics回归模型。首先对数据集进行多重共线性检验,其次利用岭回归和lasso方法修复多重共线性问题,分别建立L1正则化、L2正则化logistics回归模型进行比较,最后利用lasso方法得到变量筛选后的模型系数结果进行App虚假评论识别的影响因素分析。4.构建App虚假评论识别的算法模型。利用支持向量机、随机森林、梯度提升树、BP神经网络等算法模型建立多种App虚假评论识别模型,并使用网格搜索法优化各模型参数,同时利用模型组合的方式将已建立的多种识别模型整合起来,以期相互之间能够取长补短提高整体性能,最后建立综合评价指标体系来分析各模型的优劣,得到梯度提升树模型具有最佳识别性能。本文从用户行为层面着手,将多种分类模型应用于App虚假评论识别研究中,并建立相关评价指标对模型进行比较和优化,旨在为App开发商提供一种有效识别虚假评论的方法,以维护市场经济秩序以及广大消费者权益,具有一定的现实意义与实用性。
其他文献
双轴晶体通过锥形折射产生了空心光束的现象,在十九世纪初就进入了公众的视线,现在随着激光技术的发展以及人造合成晶体等技术的应用,锥形折射对激光束模式的会聚和变形引起
目的:了解新疆乌鲁木齐农村老年人的养老服务中的心理服务需求现状及其影响因素,为构建完善的农村养老服务体系提供理论支持。方法:采用横断面研究,于2019年1月~12月以多阶段分层随机整群抽样法,对年龄≥60岁的1652名乌鲁木齐农村老年人进行问卷调查。问卷的内容包含:(1)农村老年人一般资料调查问卷;(2)老年人基本养老服务需求问卷;(3)老年人心理服务认知和心理服务需求量表;(4)社会支持评定量表
近年来,常州市坚持系统化思维、全局性站位,倾力打造"全要素、全市域、智能化、大联动"的网格化社会治理模式。为进一步提升网格化治理效能、推进市域社会治理现代化,建议:一
传统的信息扶贫行动常采取自上而下的模式,易忽视贫困人口自身的信息需求,信息利用和信息转化效率较低。参与式发展理论则注重贫困人口在发展项目中的全面介入,强调以贫困人
面对宏观经济格局的急速变化形势,各行业供给侧的能力建设面临着新的挑战。当前,房地产开发行业链条面临下行且严峻的困境,因此作为开发整体过程中最重要的供给侧组成方——
本篇论文讨论了一类非面传递的弧正则地图。论文中将这类地图记为M2。一般的,一个地图M的自同构是保持地图各个组成部分间的关联关系的旗集上的置换。所有这些置换在置换复合
目的:对新疆煤矿工人的职业倦怠情况进行现况调查,构建职业倦怠影响因素间的结构方程模型(SEM),探讨重要候选基因脑源性神经营养因子(BDNF)和糖皮质激素受体(NR3C1)基因位点多态性与职业倦怠之间的相关性,为完善职业倦怠影响因素的评价方案提供科学依据。方法:利用整群随机抽样法,抽取2019-2020年6家新疆煤矿企业共1650名煤矿工人进行职业倦怠、付出-回报失衡、工作内容、职业发展性、抑郁、
地图是从一个图Γ到一个曲面S的嵌入,使得每个S(V∪E)的连通分支都同胚于一个开圆盘。研究地图的数学理论称为地图论或称拓扑图论,它是组合学的一个分支。依照将点,线,面分
艾里光束在非线性机制作用下的传输与交互表现出了很多的奇异性质。本论文将利用分步傅里叶法,主要研究光伏光折变晶体中艾里光束的传输、调控及其相互作用过程,探寻非线性机
电火花加工(EDM)利用可控电火花来腐蚀工件中的金属,这种方法现在已成为高功率应用的成熟加工工艺。近年来,电火花加工技术越来越多地应用于高精度加工和机械零件的制造中,成