【摘 要】
:
虚假评论是电商发展过程中一个无法避免的难题.针对在线评论数据中样本类别不平衡情况,提出基于BalanceCascade-GBDT算法的虚假评论识别方法.BalanceCascade算法通过设置分类
【基金项目】
:
教育部人文社科规划基金项目(16YJA630037),上海市一流学科建设项目(S1201YLXK)
论文部分内容阅读
虚假评论是电商发展过程中一个无法避免的难题.针对在线评论数据中样本类别不平衡情况,提出基于BalanceCascade-GBDT算法的虚假评论识别方法.BalanceCascade算法通过设置分类器的误报率逐步缩小大类样本空间,然后集成所有基分类器构建最终分类器.GBDT以其高准确性和可解释性被广泛应用于分类问题中,并且作为样本扰动不稳定算法,是十分合适的基分类模型.模型基于Yelp评论数据集,采用AUC值作为评价指标,并与逻辑回归、随机森林以及神经网络算法进行对比,实验证明了该方法的有效性.
其他文献
概述德国、美国、日本及国内的废旧电池回收利用法律法规,对我国现阶段车用动力电池回收利用标准情况进行分析。提出加快动力电池回收利用标准体系的建设建议。
用氢氧化亚钴[Co(OH)2]包覆高镍三元正极材料LiNi0.85Co0.10 Mn0.05O 2,控制烧结温度,使Co(OH)2分解为四氧化三钴(Co 3O 4)。半电池测试显示:包覆材料首次循环的放电比容量为
分别对锂离子电池在民用航空领域的应用进程、技术瓶颈及前景进行回顾、梳理和展望。整理锂离子电池在多电、全电飞机领域的应用进程,梳理相关研究进展,总结在应用过程中面临
研究了脂肪酶拆分外消旋6-羟基-8-氯辛酸乙酯。从10种脂肪酶中筛选出了脂肪酶Lipase PS—D,该酶能够有效拆分外消旋6-羟基-8-氯辛酸乙酯,并对反应条件进行了优化,确定了该酶的最
随着电动汽车的逐渐普及,电动汽车的电池管理系统(BMS)技术逐渐成为研发人员关注的焦点。谭晓军著的《电动汽车智能电池管理系统技术》一书紧紧围绕BMS的智能化技术,突出了电
采用ANSYS Fluent软件中的NTGK电化学模型,研究锂离子电池在恒温下恒流充电(CC)、恒流-恒压充电(CC-CV)、间歇脉冲充电(IPC)和再生脉冲充电(RPC)的电化学特性曲线,并与实验结
根据铁路客车辅助供电系统用电池组使用工况,对开发的富液排气式镍氢(MH/Ni)电池组进行运用考核。MH/Ni电池组与充电机匹配性良好,可实现强充电与浮充电的转换。MH/Ni电池组
目的观察莫沙必利联合兰索拉唑治疗食管运动功能障碍非糜烂性胃食管反流病(NERD)患者的临床疗效。方法回顾性分析我院收治的食管运动功能障碍NERD患者120例,根据治疗方法分为3
目的观察经验穴“五关”刺络放血联合头针治疗中风后手指拘挛性瘫痪的临床疗效。方法将60例中风后手指拘挛性瘫痪患者按随机数字表分为两组,每组30例。治疗组采用经验穴“五
中国素有“礼仪之邦”、“衣冠王国”的美称_几千年来,我国人民不仅创造了举世瞩目的辉煌又化,也创造了丰富的令人叹为观止的精美发式。发式是在一定历史时期里物质和及化的重要