基于负二项回归的死亡率预测

来源 :东方教育 | 被引量 : 0次 | 上传用户：nan13519927

【摘要】

：

【作者】

：

玉婻宝隋晓雪霍帅

【出处】

：

东方教育

【发表日期】

：

2018年15期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：本文中应用普通的线性回归--最小二乘法和广义线性模型对我国人口死亡率的预测模型进行研究，得出死亡率预测模型，分析结果，从结果中可为制定中国人口政策提供一定的依据。
　　关键词：负二项回归；死亡率预测
　　1.研究背景
　　人口老龄化是指总人口中因年轻人口数量减少、年长人口数量增加而导致的老年人口比例相应增长的动态。按照这个标准，我国已于1999年进入老龄社会。人口老龄化产生的原因：出生率下降、人口寿命提高。近年来我国为防止老龄化更加严重，出台的“二孩”政策。但在有些专家提出“二孩”政策并不能真正改善老龄化问题，只是一个缓解的过程。人口老龄化问题关乎我国未来经济社会的长远发展，必须对当前我国人口老龄化的趋势及可能带来的影响进行深入分析，以便及时调整相应的政策和措施加以应对。因此研究我国人口死亡率模型，建立预测模型是非常有必要的。
　　2.数据的处理与描述
　　2.1 数据的描述
　　对数据进行描述性统计分析，研究各数据指标之间的关系，分析出男性生存人口数、死亡人数、死亡率随年龄有一定的规律变化。为使变量之间的分布波动相对稳定，呈现的分布更明显，考虑对男性生存人口数、死亡人数、死亡率三个变量进行对数变换，画出散点图。可得出有关男性生存人口数、死亡人数、死亡率的对数随年龄变化的大致规律。
　　（1）死亡率对数在0至10岁这个区间呈递减趋势，从10岁开始，男性死亡率随年龄的增加而增加。
　　（2）男性死亡人口数的对数总体趋势是随着年龄的增加而增加，但在0至10岁之间是呈递减趋势，随后增加，直到75岁之后又递减。
　　（3）男性生存人口数总体趋势是随着年龄的增加而减少，在0至50岁之间有波动性。
　　2.2 响应变量分布的研究
　　由死亡人数对数直方图可根据横轴将数据分为两部分，以log（男性死亡人口数）=10为分界点。采用KS检验对双峰分布拟合效果进行检验，值小于显著性水平，拒绝原假设，认为拟合的双峰分布不能确切地描述死亡率对数的分布情况。不能从分布情况来建立预测模型，考虑从变量之间的关系来建立模型。
　　3.人口死亡率的模型建立及结果分析
　　3.1模型建立
　　利用最小二乘法拟合死亡人数。模型建立：，响应变量Y为死亡人数。回归变量X包含年份、年龄和生存人口数对数。检验模型显著性，利用R软件实现，比较P值与预设α值0.05后，可认为所有变量在显著性水平为0.05下具有显著性。但拟合优度的值为0.6486，修正后的拟合优度为0.6476，拟合程度不高。
　　3.2 模型分析
　　对模型进行残差分析，画出残差对拟合值散点图、残差的正态QQ图、位置尺度图、学生化残差与杠杆值图，曲线点表明存在非线性，可能意味着响应变量和回归变量之间不是线性的。说明用最小二乘方法来建立死亡人数的预测模型是不适合的。考虑建立用广义线性模型来建立模型。
　　3.3 负二项广义线性模型
　　3.3.1 模型建立
　　在建立中国死亡人数模型时，设为年龄i，年份j的死亡人数，为年龄i，年份j的生存人数，表示包括常数项和年龄i、年份j的解释变量对应的设计向量，向量为模型中的待估参数。
　　连接函数为
　　因此对中国死亡人数建立的负二项广义线性模型为：
　　利用R语言实现模型，得出的结果如下所示
　　Null deviance： 43790.1 Residual deviance： 1014.5 AIC： 20786
　　在显著性水平α=0.05、α=0.1下，两个解释变量的分量都是显著的。由，得出包括年龄、年份解释变量的偏差统计量的值远远小于不包括年龄、年份解释变量的偏差统计量的值，故建立死亡人数预测模型应考虑年龄、年份两个因子水平。
　　3.3.2 模型分析
　　去掉异常值，重新建立模型后，Null deviance，Residual deviance，AIC的值都减小，说明模型拟合的效果更好。
　　为了进一步说明用负二项广义线性模型建立中国死亡人数预测模型具有一定的优势性，此处用泊松回归模型进行建立模型。对两个模型进行比较，负二项回归模型中Null deviance、Residual deviance、AIC的值都远远小于泊松回归模型的三个项目的值。
　　3.4 结果分析
　　本文至此已经建立中国人口死亡人数的预测模型，那么现在要转换回建立中国人口死亡率预测模型的问题，由建立好的中国人口人数预测模型中年份、年龄与死亡人数之间的关系，以及死亡率的公式，得出预测的死亡率。可画出死亡率随年龄变化的散点图进行分析，年龄因子对死亡率影响比较大，因此找到死亡率随年龄变化的模式对预测非常重要。此外，随着时间的推移，死亡率初步呈现下降趋势，导致人口老龄化的形成。
　　4.结论
　　通过研究分析，得出死亡率预测模型，分析死亡率随年龄、年份的变化模式，可为实施中国人口政策提供一定的依据。在本文中，发现最小二乘法不适用于建立死亡率预测模型，而负二项回归相对于泊松回归拟合结果比较好。从建立的模型中看死亡率随年份变化的模式中，可知死亡率逐渐下降，导致老龄化社会的形成。但本文中建立的死亡率预测模型还有不足之处，有待改进。在用負二项回归建立模型时，还可再改进，如选取主要的因子，可能建立的模型具有更优的拟合优度性。
　　参考文献：
　　[1]李诗羽，张飞，王正林. 数据分析：R语言实践[M]. 北京：电子工业出版社， 2014. 243-259.
　　[2]Douglas C.Montgomery， Elizabeth A.Peck， G.Geoffrey Vining. Introduction to Linear Regression Analysis， Fifth Edition[M]. 北京：机械工业出版社， 2016. 326-335.
　　[3]张连增，段白鸽. 广义线性模型在生命表死亡率修匀中的应用[J]. 人口研究， 2012，（3）： 89-103.
　　[4]陈卓恒.负二项分布的广义线性模型及其应用[J].华侨大学学报，2011，32（2）.
　　[5]徐业峰. 负二项回归模型的统计推断[D]. 扬州大学， 2014.

其他文献

简述3D打印技术对陶瓷产业的关键性影响

摘要：科学技术使用的逐渐增多，使人们对其的依赖程度也在不断的增加，尤其是在将科技引入到我国生活用品的生产工作中来，不仅提升了人们生活的便利，同时也提升了生活的质量。陶瓷作为人们生活中重要的材料，在很多行业中都有涉及，随着技术的不断变革其形式以及性能也在不断的提升，而将3D技术引入到陶瓷到生产和创作中，是目前社会发展的又一趋势，并为各行业的产品带来了新的发展机遇。　　关键词：3D打印技术；陶瓷产业；

期刊

基于大数据和ARCGIS分析的青秀山风景区服务设施规划的合理性研究

摘要：本文以网络大数据为基础，结合对青秀山风景区的现有服务设施规划进行分析，同时在实地调研的基础上，通过ARCGIS软件对青秀山风景区的服务设施进行分析，进而研究青秀山风景区的服务设施规划的合理性，为完善青秀山的旅游服务功能提出相关建议，有利于将青秀山打造成更为亲民、便民、利民的休闲景区。　　关键词：大数据；地理信息系统；南宁青秀山风景区；服务设施　　一、绪论　　（一）研究背景　　青秀山（Qing

期刊

刑罚的正当化危机与积极的一般预防

摘要：在当今社会，法治成为一个国家的主要管理方式，人自出生开始就会受到法律的保护和制约，在受到法律保护权利的同时人们也看到法律为了维护某些人的正当性权利而侵犯某些人的正当性权利。在此情况下，人类社会就对法律当中的刑罚问题提出质疑，即刑罚是否具有正当性？为了回答这个问题，法学界的许多学者都对刑罚的正当化问题进行了研究探讨。早期也取得了一些研究成果，比如报应论和特殊预防论，但这些理论都受到了社会历史经

期刊

论数码钢琴集体教学研究

摘要：当钢琴课成为高等音乐院校的必修课时，师资就显得越来越紧缺，数码钢琴集体教学就凸显出它的优越性了。本论文从数码钢琴集体教学中的问题、教学方法等方面进行初探。　　关键词：集体教学；数码钢琴　　前言：　　在国家素质教育背景之下，钢琴以优雅的姿态在走进千家万户和中小学校。许多学校增开了钢琴课，钢琴社团等，学习钢琴的人数与日俱增。由于钢琴教师的紧缺，学校就引进数码钢琴集体教学来解决学生学习的问题。但是

期刊

新形势下如何开展交通运政管理思想政治工作的再思考

一、交通运政工作的压力和挑战　　新形势下交通运政管理工作压力大、挑战多，主要表现为如下几个方面：第一，经济发展进入新常态，意味着经济增速从高速增长转向中高速增长，经济发展动力正从传统增长点转向新的增长点。交通运政管理部门也必须认识到新常态经济的客观特征，管理人员必须提高管理能力和服务能力，应对新形势下交通运输产业在结构和质量上的变化，主动做好服务，推动新常态经济下交通运输业

期刊

太原市经济型酒店发展的优劣势分析

摘要：经济型酒店成为未来中国酒店业发展的新趋势，太原市旅游资源丰富，随着商务旅游和自助旅游人数的不断增加，经济型酒店受到了旅游者和商务人士的青睐。但是作为省會城市，经济型酒店这一潜力巨大的市场还尚待开发。就太原的经济型酒店发展现状来说，许多经济型酒店在管理服务及配套设施等方面不尽如人意，而且价格也并不“经济”。文章对太原市经济型酒店的现实状况进行了分析，并针对存在的问题提出了解决策略。　　关键词：

期刊

计算机软件技术在大数据时代的应用研究

摘要：伴随着科学技术的飞速发展，计算机软件技术在各个领域也得到了广泛的应用，对人们的日常生活和工作产生了或多或少的影响。受大数据时代的影响，为了促进计算机软件技术在大数据时代下更好的应用，社会的各个领域必须改进计算机技术，继而可以带来更多收益。文章主要讨论了计算机软件技术在大数据时代的应用和发展状况，希望为今后的研究提供一个适当的参考。　　关键词：计算机软件；大数据；技术应用　　引言：　　随着不断

期刊

浅析当今时代私人订制的必要性

摘要：从最早的衣服、鞋子、珠宝等产品的私人订制，到后来的汽车、家电的私人订制，如今的社会，产品和服务的订制已经无处不在。其不但迎合了人们追求质量的心理，也满足了个性化的消费方式。同时，私人订制也成为了商家获得竞争力优势、获得经济效益的主要方式。笔者分析了当今时代私人订制的必要性，具体如下。　　关键词：现代社会；私人订制；必要性　　一、关于“私人订制”服务的阐述　　“订制”这个词，最早起源于英国的购

期刊

食品添加剂与食品安全的关联性研究

摘要：食品添加剂与食品安全之间是具备紧密联系的，对食品添加剂进行合理合法的使用能够满足食品安全需要，其也是现代食品的重要基础。近年来，我国频繁发生食品安全事件，这些食品安全事件所造成的后果往往是触目惊心的，这也使许多人错误的认为食品添加剂是导致食品安全事件的罪魁祸首。鉴于此，本文便对食品添加剂与食品安全之间的关联性进行深入的研究，以期能够纠正人们对食品添加剂的错误理解，正确认识食品安全和食品添加剂

期刊

临潼地区生态经济圈层置地研究

摘要：该文主要通过研究临潼地区近年来经济发展状况，主要对占有临潼区GDP绝大部分游业发展的分析，并结合德国德国著名农业经济学家冯·杜能提出的圈层理论，将其应运在临潼地区，以此为临潼地区今后的发展提出相应的建议。　　关键词：临潼地区；圈层理论　　临潼位于西安东部，东与渭南市、南与蓝田县、西与高陵县、西北与三原县、北与阎良区和富平县交界，被称为古都西安的东大门，距市中心30余公里。2017年统计显示区

期刊

基于负二项回归的死亡率预测

与本文相关的学术论文