基于用户评论的在线产品质量风险评估与预警研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:sttyuanchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自经济全球化以来,网络普及切实的影响着人们的日常生活,利用网络等线上渠道消费也成为了极为普通的事情。天猫、京东等在线产品销售网站的出现方便了消费者,使消费者可以足不出户的获取自己所需的来自全球的商品,但是在线商品鱼龙混杂,销售网站中存在着较多假冒伪劣、以次充好的商品,产品质量问题频发。针对该问题,本文在前人研究的基础上,提出了一种以并行化大数据框架Spark为载体、以基于MinHash加权改进的贝叶斯分类器为模型、以最广大消费者最直接的用户评论为基础的质量风险评估与预警方法。本文所改进的风险评估模型性能优良,效率高、成本低、取得的效果较好,在准确识别潜在风险的同时又能评估风险等级,并进行相应的舆情预警,使政府监管者和相关从业者都能尽早、尽快的发现风险并作出应对,防患于未然。本文的主要研究内容如下:为获取一线消费者最直接的用户评论,本文基于MyEclipse平台,采用JAVA语言自主开发“用户评论采集”程序从“天猫”、“京东”、“亚马逊”等主流在线产品销售平台中获取对应产品的用户评论信息,对比分析了进行在线产品质量风险评估、预警时常用的分类、挖掘算法如贝叶斯算法、SVM算法以及BP算法等。提出了一种基于相关性分析加权改进的贝叶斯分类模型。文中深入研究、总结了已有的贝叶斯分类算法,发现已存的贝叶斯分类器并不适用于在线产品质量风险评估与预警工作。在线产品的特征属性之间彼此相关、相互影响,很少两两独立存在,而函数可以用来完成相关性分析,即量化爬取数据集的特征属性和风险等级(即决策类别)之间的相互作用,并计算出一个特定系数用于对特征属性加权,完成对模型的改进使之更适用于在线产品的风险评估与预警。为应对大数据级别的评论样本量,引入大数据处理框架Spark。本文中从Spark的诞生背景与发展史开始,介绍了其基本结构与工作原理,并分析了 Spark所特有的基于内存运算的全新的存储方式RDD及其后续衍生出的作用各异的生态系统组分 Spark SQL、Spark Streaming、MLlib、GraphX 等。最后在 Ubuntu 16.04上进行实证研究,实现了改进后的风险评估模型在Spark中的并行化运行,使之能够高效的完成大数据下的在线产品风险评估工作。本文以对“防紫外线服”为例来进行了实证研究,依次探究了用户商品评论挖掘、爬取数据的初步处理(如中文分词、数据去噪等)、用户关注的重点风险属性的提取以及对评论集的降维、改进模型的训练应用的全过程,完成了“防紫外线服”这一在线产品的风险评估与预警工作,并从效率和准确率上对模型进行了对比分析。随后分析了本文的研究对政府监管者和相关经营者这两种不同人员的意义所在,并给出了一些针对性的意见。经实证,本文提出的风险评估与预警模式效率高、成本低、取得的效果较好,有很高的实践应用价值。
其他文献
以发电机氢冷系统为研究对象,结合氢冷系统的组成和塘寨电厂2#机的安装经验,总结出氢压下降的原因,从而提出舛氢冷系统施工过程中的重点质量控制。
本试验研究了日粮中添加木醋液对于肉仔鸡生长性能、胴体性能、免疫器官发育、肉质指标、血液生化指标、肠道菌群数量、粪便中有机酸和臭气化合物含量的影响。本试验选取480
目的研究铁调素及其相关因素对骨髓增生异常综合征(MDS)患者铁过载水平的评估价值。方法选取64例MDS患者,采用ELISA法对患者的外周血和骨髓铁调素水平进行测定;Real—TimePCR法测
本文应用胃癌单克隆抗体MG9对230例手术或活检标本进行免疫组化染色以观察MG9在胃癌和大肠癌中的抗原表达与分布。结果43例胃癌标本40例(92.04%)呈阳性表达,16例大肠癌中14例(87.5%)呈阳性表达,二者与其它病的阳
<正>"2019(横琴)经济发展与创新大会暨第九届诺奖得主中国行"活动在珠海国际会展中心举办。2018年诺贝尔经济学奖得主保罗·罗默、交通银行首席经济学家连平、北京大学汇丰金
近年来,读后续写引起了二语习得领域的广泛关注。王初明教授论证了读后续写的理论依据乃认知心理学的互动协同理论,并且通过一系列的实证研究证明读后续写对于二语写作的促学效果,以及揭示了读后续写为什么促学背后的机理。此后,一系列的研究关于读后续写对于写作各个维度,比如词汇,句法,篇章,写作思维等的促学一一开展起来。其中读后续写任务对于写作复杂度方面的影响还较为有限。鉴于此,本文旨在探讨读后续写所蕴含的协同
通过分析冷冲模磨削加工中表面粗糙度的影响因素,进行了一些磨削加工试验,获得了一定数量的磨削加工参数,为提高磨削加工表面粗糙度质量提供了可靠依据。
应用大切片法观察分析154例术前未经放疗和化疗的食管鳞癌血管、神经周围侵犯与预后及其它影响预后的形态学因素的关系,发现本组血管侵犯发生率为27.9%(43/154例),生存期长组(5年
<正> 湖南省科学学和科研管理会于今年十月十五日至十八日在岳阳市举行首次学术讨论会。参加会议的代表共70余人,收到56篇论文。论文作者结合各自的工作实践探讨一些问题。他
近七年来,处手术切除病理证实的胃肠道肿瘤2000余例,其中36例发生在小肠。36例小肠肿瘤中有16例(44%)在十二指肠,10例(28%)在空肠,10例(28&#215;)在空肠,36例中有33例(90%)为恶性;其中腺癌21例,平滑肌肉瘤5例,恶性淋巴瘤6例,类癌