论文部分内容阅读
摘 要:我国的非寿险需求地区发展不平衡。本文采用聚类分析方法,选取全国31个地区的相关数据对我国非寿险需求进行区域性分析,把非寿险市场划分为3类,并分别对这3类地区进行定性分析。
关键词:非寿险需求;聚类分析;保费收入;保险深度;保险密度
近年来,随着经济的快速发展,我国非寿险业的发展也非常迅速。然而,由于我国目前的经济发展不平衡,部分城市的发展突出,远远超过了全国的平均水平,造成了这些发达城市非寿险业的发展速度也往往高于全国的其他城市,非寿险业呈现出地区发展不平衡的状况。本文以我国的非寿险市场作为分析对象,通过对全国31个地区的非寿险市场采用聚类分析方法来研究我国非寿险市场的地区差异,评价区域非寿险市场的发展水平。
一、聚类变量及研究样本的选择
1、聚类变量的选择
(1)保费收入:保费收入是衡量保险业发展规模的基本总量指标,本文选择非寿险业的保费收入作为非寿险保险需求的衡量变量。
(2)保险深度:保险深度是指某地保费收入占某地国内生产总值(GDP)之比,它反映了该地保险业在整个国民经济中的地位,公式为保险深度:地区保费收入/该地区GDP。
(3)保险密度:是指按全国或地区计算的人均保险费,公式即保险密度:地区保费总收入/给地区总人口。
由于如果仅考虑保费收入作为聚类分析的变量,可能会出现将人口较多使得保费收入较高和本身非寿险发达的地区聚为一类等情况,所以本文在考虑非寿险业的保费收入的同时,也将保险密度和保险深度作为聚类分析的变量,这样可以比较全面的考虑非寿险需求的各方面。
2、样本的选取
本文选取的样本为2006年我国31个省市自治区的地区保费收入、保险密度和保险深度的相关数据。数据来源有:《中国统计年鉴2007年》和中国保险监督委员会网站中的相关统计信息。统计软件采用了SPSS11.5。
二、聚类分析的实证研究
1、聚类分析的核心步骤
聚类分析是统计学中研究“物以类聚”问题的一种多元统计分析方法,其基本思想是认为研究的样本或变量之间存在着程度不同的相似形。聚类分析实质是一种建立分类的方法,将一批样本数据(或变量)数根据其诸多特征,按照它们在性质上的亲疏程度在没有先验知识的情况下自动进行分类,产生多个分类结果。
(1)指定聚类数目。本文指定聚类数目为3进行分析,在K-Means聚类中,SPSS会输出关于这个聚类数目的唯一解。
(2)确定初始类中心。本文采用系统指定方式,SPSS系统会根据样本数据的具体情况选择有一定代表性的样本作为初始类中心点。
(3)根据距离最近原则进行分类。依次计算每个样本数据点到3个类中心点的欧式距离,并按照距3个类中心点距离最短的原则将所有的样本分派,形成3个分类。
(4)重新确定类中心点。依次计算各类中每个变量的均值,并以均值点作为3个类的中心点。
(5)判断是否已满足终止聚类分析的条件。聚类分析中终止的条件有两个:第一,迭代次数。当目前的迭代次数等于指定的迭代次数(SPSS默认为10);第二,类中心点偏移程度。新确定的类中心点距上个类中心点的最大偏移量小于指定的量(SPSS默认为0.02)时终止聚类。通过适当增加迭代次数或合理调整中心点偏移量的判定标准,能够有效克服初始类中心点指定时有可能存在的偏差,提高聚类分析的准确性。
K-Means快速聚类是一个反复迭代的分类过程。在聚类过程中,样本所属的类会不断调整,直到最终达到稳定为止。
2、聚类分析的实证过程
为了进一步分析各地区在保费收入上所体现出的规律,分出哪些地区在非寿险保费收入上体现出相近的特征,本文根据各地区的保险收入、保险密度和保险深度对全国31个地区进行聚类分析,方法采用SPSS11.5提供的快速聚类(也称K-Means聚类)分析。
表1展示了3个类的初始类中心的情况,3个初始类中心点的数据分别是(101.33,558.29,0.98),(196.18,210.86,0.75),(17.18,45.73,0.75)。根据变量的经济意义可以看出,第二类的保费收入最高,第一类次之,而第一类的保险密度和保险深度是最优的,第三类的各变量均较低。
表2展示了3个类中心点每次迭代时的偏移情况,第1次迭代后,3个类的中心点分别偏移了14.984、83.292、37.42,第2类中心点偏移最大;第2次迭代后,第1类的中心点偏移小于指定的判定标准(0.02),第2、3类的中心点分别偏移13、583和3.578;第3次迭代后,3个类的中心点偏:侈均小于指定的判定标准(0.02),聚类分析结束。
表3展示了3个类的最终类中心情况。可以看出第1类在保险密度和保险深度上仍然最优,第2类在保费收入因子上最优,而第三类在各个因子上均最不理想。
表4展示了3个类的类成员情况,第一类有2个省市,第二类有5个省市,第3类有24个省市自治区。
根据详细的分类输出,整理具体的分类结果如下表:
三、实证结果分析
聚类分析的实证结果显示:
第一类包括北京和上海两个城市。这两个地区的保险密度和保险深度都最大,也就是说人均保费收入和保费收入占地区GDP的比例最大,保险密度是第2类地区的2.7倍多,是第3类地区的7倍多。实际上,这两个地区在经济、文化等方面都明显的优于全国的其他城市,其特点主要是经济发达、非寿险业市场相对成熟、业务规模大。
第二类包括天津、辽宁、江苏、浙江和广东5个地区。这5个地区的保费收入最大,经济也比较发达,非寿险市场处于比较完善的状态,市场主体在不断增加,经营手段不断改善,是今后非寿险公司加大发展力度的主要地区。
第三类包括全国其余的24个地区,其中部分地区为经济发展欠发达的地区,其特点是城市化水平较低,第三产业落后、居民风险意识比较淡薄,非寿险市场发展不完善。但是随着近年来全国整体的经济水平提高,这些地区的经济也在快速增长,非寿险市场持续稳步提高,具有良好的发展趋势。
关键词:非寿险需求;聚类分析;保费收入;保险深度;保险密度
近年来,随着经济的快速发展,我国非寿险业的发展也非常迅速。然而,由于我国目前的经济发展不平衡,部分城市的发展突出,远远超过了全国的平均水平,造成了这些发达城市非寿险业的发展速度也往往高于全国的其他城市,非寿险业呈现出地区发展不平衡的状况。本文以我国的非寿险市场作为分析对象,通过对全国31个地区的非寿险市场采用聚类分析方法来研究我国非寿险市场的地区差异,评价区域非寿险市场的发展水平。
一、聚类变量及研究样本的选择
1、聚类变量的选择
(1)保费收入:保费收入是衡量保险业发展规模的基本总量指标,本文选择非寿险业的保费收入作为非寿险保险需求的衡量变量。
(2)保险深度:保险深度是指某地保费收入占某地国内生产总值(GDP)之比,它反映了该地保险业在整个国民经济中的地位,公式为保险深度:地区保费收入/该地区GDP。
(3)保险密度:是指按全国或地区计算的人均保险费,公式即保险密度:地区保费总收入/给地区总人口。
由于如果仅考虑保费收入作为聚类分析的变量,可能会出现将人口较多使得保费收入较高和本身非寿险发达的地区聚为一类等情况,所以本文在考虑非寿险业的保费收入的同时,也将保险密度和保险深度作为聚类分析的变量,这样可以比较全面的考虑非寿险需求的各方面。
2、样本的选取
本文选取的样本为2006年我国31个省市自治区的地区保费收入、保险密度和保险深度的相关数据。数据来源有:《中国统计年鉴2007年》和中国保险监督委员会网站中的相关统计信息。统计软件采用了SPSS11.5。
二、聚类分析的实证研究
1、聚类分析的核心步骤
聚类分析是统计学中研究“物以类聚”问题的一种多元统计分析方法,其基本思想是认为研究的样本或变量之间存在着程度不同的相似形。聚类分析实质是一种建立分类的方法,将一批样本数据(或变量)数根据其诸多特征,按照它们在性质上的亲疏程度在没有先验知识的情况下自动进行分类,产生多个分类结果。
(1)指定聚类数目。本文指定聚类数目为3进行分析,在K-Means聚类中,SPSS会输出关于这个聚类数目的唯一解。
(2)确定初始类中心。本文采用系统指定方式,SPSS系统会根据样本数据的具体情况选择有一定代表性的样本作为初始类中心点。
(3)根据距离最近原则进行分类。依次计算每个样本数据点到3个类中心点的欧式距离,并按照距3个类中心点距离最短的原则将所有的样本分派,形成3个分类。
(4)重新确定类中心点。依次计算各类中每个变量的均值,并以均值点作为3个类的中心点。
(5)判断是否已满足终止聚类分析的条件。聚类分析中终止的条件有两个:第一,迭代次数。当目前的迭代次数等于指定的迭代次数(SPSS默认为10);第二,类中心点偏移程度。新确定的类中心点距上个类中心点的最大偏移量小于指定的量(SPSS默认为0.02)时终止聚类。通过适当增加迭代次数或合理调整中心点偏移量的判定标准,能够有效克服初始类中心点指定时有可能存在的偏差,提高聚类分析的准确性。
K-Means快速聚类是一个反复迭代的分类过程。在聚类过程中,样本所属的类会不断调整,直到最终达到稳定为止。
2、聚类分析的实证过程
为了进一步分析各地区在保费收入上所体现出的规律,分出哪些地区在非寿险保费收入上体现出相近的特征,本文根据各地区的保险收入、保险密度和保险深度对全国31个地区进行聚类分析,方法采用SPSS11.5提供的快速聚类(也称K-Means聚类)分析。
表1展示了3个类的初始类中心的情况,3个初始类中心点的数据分别是(101.33,558.29,0.98),(196.18,210.86,0.75),(17.18,45.73,0.75)。根据变量的经济意义可以看出,第二类的保费收入最高,第一类次之,而第一类的保险密度和保险深度是最优的,第三类的各变量均较低。
表2展示了3个类中心点每次迭代时的偏移情况,第1次迭代后,3个类的中心点分别偏移了14.984、83.292、37.42,第2类中心点偏移最大;第2次迭代后,第1类的中心点偏移小于指定的判定标准(0.02),第2、3类的中心点分别偏移13、583和3.578;第3次迭代后,3个类的中心点偏:侈均小于指定的判定标准(0.02),聚类分析结束。
表3展示了3个类的最终类中心情况。可以看出第1类在保险密度和保险深度上仍然最优,第2类在保费收入因子上最优,而第三类在各个因子上均最不理想。
表4展示了3个类的类成员情况,第一类有2个省市,第二类有5个省市,第3类有24个省市自治区。
根据详细的分类输出,整理具体的分类结果如下表:
三、实证结果分析
聚类分析的实证结果显示:
第一类包括北京和上海两个城市。这两个地区的保险密度和保险深度都最大,也就是说人均保费收入和保费收入占地区GDP的比例最大,保险密度是第2类地区的2.7倍多,是第3类地区的7倍多。实际上,这两个地区在经济、文化等方面都明显的优于全国的其他城市,其特点主要是经济发达、非寿险业市场相对成熟、业务规模大。
第二类包括天津、辽宁、江苏、浙江和广东5个地区。这5个地区的保费收入最大,经济也比较发达,非寿险市场处于比较完善的状态,市场主体在不断增加,经营手段不断改善,是今后非寿险公司加大发展力度的主要地区。
第三类包括全国其余的24个地区,其中部分地区为经济发展欠发达的地区,其特点是城市化水平较低,第三产业落后、居民风险意识比较淡薄,非寿险市场发展不完善。但是随着近年来全国整体的经济水平提高,这些地区的经济也在快速增长,非寿险市场持续稳步提高,具有良好的发展趋势。