基于用户生成内容的潜在客户识别方法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:LUOJIAJUN32
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】从产品论坛中识别潜在客户,对产品论坛中的用户生成内容特征进行分析,识别有购买意愿的产品潜在客户。【方法】将不均衡数据集转换为n个均衡数据集,结合Stacking分类算法识别潜在客户,分别使用基分类器算法和本文提出的针对不均衡数据集的Stacking分类算法对样本数据进行测试,并通过对比F值验证本文算法的有效性。【结果】本文提出的算法的F值较贝叶斯网络、逻辑回归、C4.5决策树、SMO和朴素贝叶斯5种基分类器算法分别提高17.4%、26.5%、24.1%、29.3%、40.9%,较Stacking、Bagging和Boosting三种集成学习算法分别提高10.1%、5.9%、13.1%。【局限】研究语料来源于汽车行业,具有一定的领域局限性。【结论】该方法能有效识别潜在客户。
其他文献
从2006年年底至今,俄政府相继出台整顿批零市场秩序法规和新的移民法,包括大批华商在内的外国零售商将受到强烈冲击。2007年1月15日,俄政府关于加大打击非法移民的法规生效.从200
当下政府改革的目标是建设公共服务型政府。而这就意味着,政府与公民之间的关系是服务与被服务的关系,政府向公民提供公共服务,公民向政府缴纳税收。从经济学角度看,税收也就是公
言恭达全国政协委员、中国文学艺术界联合会全国委员会委员,中国书法家协会顾问,第五届、第六届中国书协副主席,中国国家画院院务委员,江苏省人民政府参事。南京大学、东南大
城市近郊地区贫困、发展困难是全球性问题。经过30多年对城市近郊地区的帮扶,目前城市近郊地区不仅解决了亿万贫困人口的温饱问题,而且显著提高了居民的生活水平。由于中国人
红松无性系种子园的建立及经营管理技术孟广仁(本溪县清河城实验林场117116)建立红松无性系种子园是一项技术性较强,经营管理又比较复杂的工作。我场在承担部省联营林木良种基地一二期
目的:观察选择不同抗生素方案对下呼吸道感染患者进行治疗后的药学效果。方法:选择 2016 年 3 月- 2019 年 4 月本院收治的下呼吸道感染患者 100 例为 研究对象,采取数字奇偶
西山区在发展名优特新农产品生产上,下了不少功夫,取得了一定的成效,培育出了一些有一定市场知名度的产品,如:樱桃番茄、樱桃萝卜、彩色辣椒等已进入超市,具有一定的市场潜力
水电站工程中涉及的相关专业的标准、规范不断更新,对水电站厂房渗漏排水系统油水分离方案也有了更高的要求。现对水电站厂房渗漏排水系统油水分离设计方案进行研究,旨在减少
李秀红在《西部论丛》2005年第8期撰文指出,西部农村教育面临这样三个困境:一是经费不足,负债累累。由于西部地区经济发展落后、县乡财力有限,农村中小学公用经费普遍不足,有的学