基于XGBoost算法的性别收入差距研究

来源 :重庆工商大学 | 被引量 : 0次 | 上传用户:zybmc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能时代下的社会科学方法论急需转变,以适用时代的需要。计算机科学方法与社会科学特别是人口学的深度融合将极大促进学科发展。随着移动互联网和移动大数据计算时代的进一步深入到来,社会学甚至整个社会科学从“计量范式”过渡到“计算范式”的学术过渡仅仅只是一个短暂而长期的一个时间性学术问题,计算社会科学正在获得蓬勃发展。本文利用“中国综合社会调查(CGSS)”2015年全国代表性数据,使用机器学习领域运用广泛的XGBoost算法来以社会预测的视角来探寻性别收入差距的影响因素。XGBoost算法相比较与传统回归模型具有预测精度更高,对回归结果的解释更详细,更科学,可以解决多重共线性的影响等优点,同时可以通过可视化操作将结果更清晰明了的展现出来。
  本文首先以人力资本理论、“生育惩罚”效应、劳动力市场分割理论和性别角色理论四种理论为出发点,衍生出具体变量,并进行描述性分析初步探析各变量对性别收入差距的影响。紧接着使用XGBoost算法拟合出男女混合收入模型和分性别收入模型,借助Python语言中的SHAP包对模型结果进行解释。结果表明,婚姻状况,工作单位或公司所有制形式、政治地位和劳动参与未被纳入到模型的计算内,说明对收入的影响有限。而受教育水平是影响预测收入的最重要的变量,但在男女表现上不同,受教育程度对女性收入预测是更重要的因素,教育程度较高时女性教育回报率高于男性。体制分割对性别收入的影响并不大,虽然职业地位指数对收入影响重要程度排名靠前,但在男女模型中差异不明显,但在职业地位指数较高时的男性对收入的贡献大于收益,女性恰好相反。生育子女数对女性收入有明显抑制作用,对男性作用较小,而性别角色观念只对女性收入起抑制作用。
  本研究把XGBoost算法引入人口学、社会学领域,是一次较为大胆的尝试,突破了传统方法的框架,展示了机器学习算法应用到人口学、社会学的可能性。但同时也面临着研究范式没有参考;研究数据过于老旧不能反映当下情况;这些困难和不足需要在后续的研究中加强,进一步规范好计算社会科学研究范式,丰富研究方法。
其他文献
民俗文化作为重要的旅游资源,在当前旅游产业蓬勃发展的时代背景下受到前所未有的重视。本文关注重庆市秀山县民族村在参与乡村旅游的过程中对于民俗文化的呈现以及其中的人群互动现象,主要基于民俗学学科应用性和村落旅游发展现状的思考。为全面了解民族村乡村旅游发展状况,达到发现问题并解决问题的目的,采用田野调研、文献研究和个案研究的方法,对民族村民俗文化进行实地调查研究,具体研究内容主要有三部分。  首先,从旅
学位
随着银色浪潮的到来,我国老龄化程度不断加深,人口老龄化成为目前我国面临的重大挑战之一。根据国家统计局资料显示,截至2018年底,我国60岁以上老年人口达到2.49亿人,占总人口的17.9%,其中65岁以上老年人口达到1.67亿人,占总人口的11.9%。2018年我国人均预期寿命已达到77岁,但是人均健康预期寿命仅为68.7岁,意味着我国老年人平均有超过8年是带病生存,其中患一种以上慢性病老年人的比
研究目的:贫困是一个历史性、世界性、普遍性的重大问题,消除贫困是人类自古以来梦寐以求并为之顽强奋斗的美好理想。在所有致贫因素中,“因病致贫、返贫”是排在第一位的。2013年、2015年、2017年全国建档立卡贫困户中“因病致贫、返贫”的比例分别为42.4%、44.1%和42%,相比其他因素,家庭成员患病尤其是慢病、大病和重病,更容易影响个人和家庭的经济状况、人力资本状况,从而增加患病贫困家庭经济不
学位
自20世纪80年代起,计划生育政策在我国实施了三十余年,当时这项基本国策的提出有效缓解了我国的人口增长压力,提高了社会人口质量,但它也是一把双刃剑,在解决人口快速增长问题的同时也产生了大量的独生子女家庭。据统计数据显示,截止2020年,我国独生子女人数近1.8亿,因这些独生子女所形成的数量庞大的独生子女家庭,正在面临或是即将面临空前严重的养老困境。独生子女家庭多以核心家庭模式呈现,其父母的空巢时间
职业流动是社会群体在社会变迁中获取社会资源,进而感知并定位自身社会阶层地位处于何种层级的重要途径,在社会结构分层与流动的研究领域中,学者们亦将其与阶层认同偏差现象联系紧密。本文的核心研究对象——“阶层认同偏差”,时下学者们主流的观点多以“趋中论”和“下偏论”独占鳌头,且针对此现象的产生与影响机制做出解释,形成了诸如“结构决定论”、“相对剥夺论”和“认同碎片论”等的理论阐述。因此,本文在已有研究的基
学位
中国拥有世界上最多的老年人口,且中国老年人口的健康问题突出。庞大的老年人群亟需相应的社会照料资源。自发展医养结合服务的号召被中央政府提出以后,重庆市成为了我国医养结合服务试点城市之一。重庆市在医养结合服务发展工作方面进行了先验的探索。虽然我们在意识形态上一直强调构建居家、社区、机构相协调,医养康养相融合的养老服务体系,但是现实操作中我国医养结合服务的发展仍然面临着诸多困境与难题。  医养结合的内涵
随着社会转型发展进程加快,社会竞争逐渐加剧,生活压力不断增大,人们的社会焦虑感加速蔓延,尤其是人口老龄化的发展背景,养老服务需求多元化、社会养老服务发展滞后等因素,人们对于父辈的养老压力形成了较大的社会焦虑感。如不加以重视,并加以控制和引导,可能导致民众陷入生存风险和社会危机,最终演变为严重的社会问题。党的十八大、十九大及十九届五中全会报告均提出了“健全多层次社会保障体系,全面推进健康中国建设,实
学位
外来媳作为人口迁移的特殊群体,是时代与社会发展的“产物”。本文从社会学的视角出发,关注农村外来媳这一特殊群体。农村外来媳是随着社会经济的发展,在交通、通讯等科技设施发达的客观条件支持下,促使通婚圈不断扩大而形成的一类群体,这类群体在传统“从夫居”的影响下发生省内、省际迁移,迫切需要融入到新的家庭与社区环境中,构建新的社会关系。而其“外来人”的身份给她们的融入带来了一定程度的困难。社会关系是社会生活
在人口数量红利逐渐减少的情况下,激发新形式的人口红利应当成为新时代社会经济高质量发展的题中之义。女性参与社会经济活动带来的性别红利开始受到学界关注,并认为其正在成为社会和经济发展的重要推力。本文以育有3岁以下随迁子女的流动女性为研究对象,将该群体的就业看作激发性别红利的载体之一。婴幼儿照料和就业作为女性生命历程中的重要事件,反映出女性既承担着社会再生产者的角色,也承担着物质再生产者的角色。改革开放
学位
我国已经进入老龄化社会,养老问题备受社会各界的关注。养老方式多样化,老年人的精神需求逐渐增强,如何在不同的养老方式下提升老年人的精神健康是亟待解决的关键。  本文研究养老方式对老年人精神健康的影响,根据问卷选取两个精神健康指标作为因变量,通过对比确保模型研究的有效性。关键自变量的选取基于生态系统理论,从微系统、中系统、外系统、宏系统四个层面将老年人养老方式进行细分,即通过居住地点、日常照料、经济支
学位