中国居民商业医疗保险购买意愿识别研究——基于随机森林模型

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:sun_sun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会“大数据”时代的来临使得人工智能运用到各行各业,为促进行业发展提供强大动力。在保险领域,对于充分挖掘数据价值的研究还处于起步阶段,各保险公司都迫切希望从海量数据中提取有效信息,从而推出综合竞争力更强的产品,并制定更为合理的营销策略,吸引更多的客户。在发展商业医疗新客户的业务中,若能跟据所了解的数据进行分析,研究影响居民购买行为的主要因素,分辨出更有可能购买的高价值客户,锁定目标人群从而进行精准营销,将会有效促进保险公司业绩。由于高价值客户与低价值客户数量严重不平衡,误将低价值客户判断为高价值客户会浪费营销资源,而误将有意愿购买的客户判断成低价值客户会造成客户流失,造成公司损失。因此,识别出人群中有商业医疗保险购买意愿的潜在客户,对于保险企业来讲十分重要。对于不平衡数据的处理,通常有两类办法,即设计算法和重构数据集的办法。考虑设计算法,本文使用基于代价敏感的随机森林模型,给予正负类样本不同的误分代价。结果表明,在本文所使用的CGSS2017数据集中,当正负类类别权重为8:1时,分类器在测试集上有更好的分类表现。基于重构数据集的办法,使用基于ENN算法、RENN算法的欠采样和基于SMOTE算法、Borderline SMOTE算法的过采样方法。为得到更好的训练效果,本文提出一种综合采样方法—Borderline SMOTE+RENN算法,实验表明,该重采样算法结合随机森林模型的训练效果优于基于以上四种重采样算法构建的分类器。且经过对比分析,其在所用数据集CGSS2017上的分类效果优于最为常用的SMOTE+ENN算法和SMOTE+Tomek Link算法两种综合采样法。最后,使用常用的分类模型Logistic回归、决策树、SVM、KNN、Adaboost、梯度提升树等模型做分类,将效果与基于Borderline SMOTE+RENN算法的随机森林和代价敏感的随机森林的分类效果作对比分析,结论表明本文所提出的基于不平衡数据集的随机森林算法有更好的表现。分析影响居民商业医疗保险购买意愿的主要因素,通过对所用模型的特征重要性进行排序,本文认为受教育程度、家庭年收入、个人年收入是影响居民购买商业保险最主要的因素。
其他文献
信息技术的飞速发展极大地冲击着传统的教育行业,“互联网+教育”的商业模型正经历着空前的变革。在线教育作为互联网技术与教育行业融合衍生的产物,依托底层硬件设备、在线实时传输技术和AI智能技术的发展驱动而得到快速发展。疫情期间,相关政府部门要求各级各类学校开展“听课不停学”的线上教学活动,不少科技公司纷纷上线教育直播平台供教师与学生教学使用,期间涌现出了“钉钉”、“腾讯课堂”、“腾讯会议”等在线教育平
学位
互联网的发展越来越迅速,越来越多的用户选择在网络上发表自己的意见与看法,因此产生了大量的文本数据。作为互动视频元年,2019年互动视频正式出现在了大众的视野中,相比于其他视频,互动视频更加强调沉浸感和个性化体验,并且观众可以决定剧情走向。在最初的热潮过后,互动视频的发展却日渐显露出了疲态。因为视频创作者缺乏制作责任感,对制作认识不足,缺乏独立思考和表达欲,导致视频同质化严重,质量普遍低下,亮点不足
学位
<正>乡村文化建设是乡村振兴战略的重要组成部分,是全面贯彻落实党的十九大关于建设美丽中国的具体行动,也是推进新型城镇化和社会主义新农村建设、生态文明建设的重要途径。近年来,基层文化部门以实施乡村振兴战略,推进乡村文化建设为契机,把推动乡村文化建设与基层党建、精准扶贫、文明新风等工作有机结合,不断提升乡村发展的软实力,乡村公共文化发展环境得到了有效改善,不同形式的文化资源日益涌现,村民精神文化生活质
期刊
<正> 甘露醇是一种常用的脱水药,口服不易吸收,必须经静脉给药,也不易通过毛细血管进入组织。静脉点滴甘露醇按常规程序操作,是不应该外渗血管外,偶有外渗也很快被吸收,在局部皮肤不留有损害。但由于个体差异,也有个别人由于甘露醇外渗而引起水泡,现将笔者所遇到1例静脉点滴甘露醇引起皮肤水泡的病例报告如下。 病例报告 某患,男,45岁。因脑出血于1992年4月18日入院。入院后给予静脉点滴甘露醇250ml,
期刊
<正>保密工作是党治国理政、维护国家安全和保障经济发展的重要工作。当下信息安全、网络安全、数据安全已成为国家安全和保密工作的重要领域。党的二十大报告中提出,加快建设网络强国、数字中国,以及完善网络、数据等安全保障体系建设。铁路企业应当发挥党管保密的组织优势,构建起以法律为基础、以人为核心的长效机制,确保保密工作万无一失。一、大数据时代铁路企业保密工作面临的新形势、新挑战、新问题(一)当下我国民众的
期刊
股票指数波动率的估计和预测问题一直是金融计量领域的重点研究对象之一,其中波动率是指金融资产价格波动的程度和衡量不确定性或风险的程度,股票市场作为国家宏观经济的晴雨表能够反映整体经济情况。中国证券市场于上世纪90年代初开启,到现在已经发展了30余年,取得了非常巨大的成果,已经成长为全球规模最大的股票市场之一。创业板市场作为二板市场,上市的都是创新型和高成长型的中小企业,它们自身抗风险能力不足,所以其
学位
当今社会互联网的发展取得了巨大进步,微信、微博、QQ等社交产品彻底改变了传统短信、电话的联系方式,让我们的生活越来越便捷。知乎这种问答式社交平台也相应取得了巨大发展,知乎的注册用户数日益增多。在知乎平台上聚集的用户越来越多,他们都通过平台分享自己的问题、知识和意见,产生丰富多彩的的内容。但众多的用户在线上操作、分享资源,使得平台的数据量呈现爆炸式增长,信息过载的现象日趋严重。因此,以用户的历史交互
学位
随着经济全球化以及信息通信技术的飞速发展,全世界的电信行业都在经历着巨大的变革。而电信套餐业务作为电信运营商营收的重要来源之一,套餐推荐问题的相关研究也越显重要。随着人工智能的发展,人们可以使用数据挖掘技术,充分发挥统计学与机器学习在特征处理、模型预测中的优势,对用户实施智能化的套餐推送,这对运营商实现精准营销以及优化用户使用体验等都有一定的促进作用。本文拟在运用各类数据挖掘方法构建较为完善的用户
学位
在金融领域,对于世界各地的股票市场进行着广泛的关注,投资者想要预测未来股票价格的波动情况,以达到降低风险,获取最大收益的目的。但是,股市是一个被多因素影响的市场,这就造成了股指序列是一种十分不稳定的时间序列。对于非平稳的金融市场,研究者想要挖掘股指变动的趋势和其他更深层次的特征信息,在这样的背景下,如果能准确的预测股指的变动趋势,那么对于指导我国股票市场的交易活动有着非常重要的意义。基于此,本文提
学位
在我国建设现代化经济体系的道路上,区域协调发展战略和乡村振兴战略都是其中不可或缺的一环,县域地区作为紧密连接城乡的枢纽,在以上战略中起着关键的作用。为实现县域经济的可持续发展,来自县域金融层面的支撑也必不可少。广东省作为改革开放的先行者,在中国社会主义现代化建设的全局中起着十分重要的作用,其GDP连续多年处于全国第一的位置。在其经济总量不断增长的同时,区域内经济差异问题日益突出,成为阻碍整个地区进
学位