Hurdle模型的改进及其在车险索赔建模中的应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:coniji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计数数据是数据分析的热点问题之一,描述计数数据的分布通常有泊松分布、二项分布、负二项分布等。现实生活中经常会出现一种零膨胀数据,即计数为零的部分比例非常高。而当出现这种情况时,原来那些描述计数数据的分布便不再适用。Mullahy于是在1986年提出了适用于零膨胀数据的Hurdle模型。本文主要对处理零膨胀计数数据的Hurdle模型做了部分改进,并且使用一份车险索赔的数据来证实改进后的Hurdel模型的优越性。具体的,Hurdle模型零膨胀部分的数据产生是一个二分类过程,而在对其进行参数估计的时候可能会面临变量选择问题和不平衡样本问题。于是本文将解决变量选择问题的LASSO方法、解决不平衡样本问题的Safe-Level-SMOTE算法融入到Hurdle模型零膨胀部分的参数估计过程中。最后,本文将改进前后的Hurdel模型运用到车险索赔数据的建模过程中,将两者进行对比。最终结果表明,改进后的Hurdle模型相比改进前更简洁,精度更高。
其他文献
学位
社区结构是复杂网络的一个重要拓扑结构特征,随着网络科学的迅猛发展,已经成为复杂网络的研究焦点。但当前的社区发现算法仍存在如下几个问题:时间复杂度大,社区个数需提前确
本文通过集成汾渭平原旱涝研究方面的最新成果和补充分析相关数据,给出汾渭平原旱涝现状和演变的基本规律。主要结论:1.汾渭平原属暖温带半干旱半湿润气候区,干旱和洪涝是危
纳豆是由纳豆芽孢杆菌发酵大豆而成的一种历史悠久的发酵食品,具有极为丰富的营养价值和强大的保健功能。其独特的生理活性物质纳豆激酶,具有较强的纤溶活性,生物安全性好,有利于预防多种心血管疾病。我国市场上的大部分纳豆发酵产品其纳豆激酶活性不高,且大部分的国内研究关注单菌发酵纳豆工艺的优化,关于双菌混合发酵制备纳豆的研究暂时不多。因此深入研究探索双菌发酵纳豆的工艺,拓展提高纳豆激酶活力和纳豆风味的新思路是
植物在盐胁迫下会积累更多的可溶性糖,维持细胞渗透势和氧化还原水平等平衡,同时糖可以作为一种信号分子,调控逆境相关基因的表达,从而提高植物的抗盐性。本研究基于前期转录组测序分析结果,以野生型AC番茄为试验材料,研究外源海藻糖处理对盐胁迫下番茄幼苗糖含量的积累,糖代谢关键基因的表达以及ABA合成代谢的影响,为糖介导植物耐盐机制提供理论依据。研究结果如下:低浓度外源海藻糖提高了番茄幼苗的耐盐性。与单独的
S区块属于“低压、低渗、低丰度”气田,开发难度极大,利用常规的开发工艺进行开发,单井产量低。近几年,利用水平井技术提高单井产量取得了突破,水平井分段压裂主要采用“水平
珠光体钢轨是目前铁路应用最广泛的一种钢轨,但它的性能提升空间较小,不能满足客运高速化和货运重载化的发展趋势,因此研究强韧性匹配、耐磨性能良好的钢轨材料,具有重要的理论意义和应用价值。本文利用激光熔覆法制备了高硼贝氏体钢,并研究了Ti元素和稀土Ce改性对熔覆涂层的影响,得出以下结论:(1)高硼贝氏体钢熔覆涂层中,物相主要为α-Fe、Fe2B和Fe3(C,B)。随着硼含量的增大,熔覆涂层硬度逐渐增大;
地震成藏学是先进的地震勘探技术及成果与现代油气成藏理论相结合形成的一门新的学科,即运用现代油气成藏理论的原理、方法,对地震勘探技术处理与解释成果进行合理、科学的地
过渡金属催化的脂肪族化合物C(sp3)-H键胺化反应为制备吡咯烷及其衍生物提供了一种简捷、高效的合成方法。从微观和分子水平上,通过对催化反应及其相关过程中化合物结构性质关
软测量技术是过程控制和过程检测领域解决难测变量实时估计等问题的重要手段。随着实际工业过程对象的日益复杂,对于带有非线性、多变量、时变性等复杂特性的系统,采用多模型