【摘 要】
:
当前,对大数据的表述存在不同的定义,但一个普遍的观点是,大数据与"海量数据"和"大规模数据"的概念一脉相承,其在数据规模、数据复杂性和产生速度等方面均大大超出了传统的统计数据形态,也超出了现有统计手段的处理能力,预示着大数据时代的来临。本文通过对大数据和抽样调查的简单介绍,洞悉大数据时代和抽样调查各自在过去和当前所表现出来的特征,同时,也介绍了进入大数据时代需要具备的两个基础条件——云计算技术和物
论文部分内容阅读
当前,对大数据的表述存在不同的定义,但一个普遍的观点是,大数据与"海量数据"和"大规模数据"的概念一脉相承,其在数据规模、数据复杂性和产生速度等方面均大大超出了传统的统计数据形态,也超出了现有统计手段的处理能力,预示着大数据时代的来临。本文通过对大数据和抽样调查的简单介绍,洞悉大数据时代和抽样调查各自在过去和当前所表现出来的特征,同时,也介绍了进入大数据时代需要具备的两个基础条件——云计算技术和物联网。
其他文献
贸易与投资逐渐成为企业国际化的主要组织形式。我们发展了一个可用于分析企业国际贸易和对外直接投资行为的模型。由于金融异质性的存在,企业会根据不同的外部融资能力采取不同的组织形式:仅在国内销售、出口或者对外直接投资。外部融资能力最弱的企业仅在国内市场销售产品,融资能力较强的企业可以通过出口的形式步入国际化的行列,融资能力最强的企业则可以进行对外直接投资,即企业国际化经营中出现的"就近取舍集中"。这一发
北京的经济取得了快速的发展,这同时也给其生态承载能力带来了巨大的挑战。要实现生态可持续性的要求,政策决策者需要了解生态足迹变动背后的驱动因素。本文利用投入产出结构分解分析法对北京市2000-2010年生态足迹变动的驱动因素进行了分析,实证结果表明:人均GDP的增加和人口的快速膨胀是北京市生态足迹增加的主要驱动因素;技术进步和生产结构的提高是生态足迹减少的主要驱动因素。
本文首次尝试利用人口普查数据对广州市人口结构转变和住房需求的关系进行实证研究。经验观察表明,"婴儿潮"和"移民潮"很可能是2004年以来广州市住房价格快速上涨的重要原因。基于微观家庭户数据的实证研究发现,广州市居民住房需求与年龄高度相关:个人在20岁以后住房需求快速上升,直到59岁以后开始逐步下降;相关实证结果对于测量误差、样本选择、住房产权类型都是稳健的;进一步研究表明,"组群效应"是59岁以后
本文应用中国16家上市银行2004-2012年的最新数据,将银行业的生产看成是一个两阶段网络生产过程,并考虑了银行业的不良贷款作为非期望产出时的弱可处置性问题,应用两阶段网络方向性距离松弛的数据包络模型。通过研究得到的结论是,国有银行业的效率仍然是偏低,各家银行都存在着非效率现象,但效率变化呈现出一种倒"U"型的趋势。银行业效率评价的方法选择非常关键,没有考虑松弛时对效率的估计结果与考虑时差别很大
准确估计全国农村有多少贫困人口和贫困家庭对制定扶贫政策有重要意义,本文提出了收入分布函数组合拟合法,并用于估计全国农村贫困人口.根据各分布函数的拟合精度决定组合模型权重大小,最优选择平均秩的方法决定权重,分布函数组合模型极大地有效地提高了估计精度,以2011年全国农村居民家庭人均纯收入分组数据,测算出全国农村贫困人口规模为6835.881万,分析了反映贫困人口特征的贫困指数.
本文从省域的角度出发,选用合适的基尼系数公式,较为完整地计算出30个省市1990-2011年的城镇居民收入基尼系数,再拟合出其概率密度函数。然后基于核密度分解的思想将密度函数的变化分解为位置变化,形状变化及其他变化,利用这三种变化分析概率密度函数的变化。
近年来,CPI数据的可信度已成为社会舆论的热点。本文通过对CPI数据的编制过程的研究,结合珠海相关数据的匹配性分析,试图论证珠海CPI数据的合理性。经分析得出,珠海CPI数据有着相当的合理性,但针对如今可信度不足的现状,提出改善CPI数据公信力的有效措施和建议。
色谱经济分析法是统计学借鉴化学色谱分析法的一种原创性分析方法,为大数据时代背景下数据分析提供了一个新的技术平台。色谱经济分析法能够突破现有统计学的技术与方法瓶颈,其特性可以满足大数据对统计学的诉求。本文在阐述大数据、统计学与色谱经济分析法的逻辑关系下,重点以消费者的消费储蓄倾向为例,对色谱经济分析法的平衡理论、塔板理论、速率理论、分离度、信号检测和定性定量分析六部分进行置换与模拟,以期演示色谱经济
因子分析综合评价由于不能明确更好的因子分析模型、因子准确值、因子与主成分的关系和差异、因子分析综合评价的合理性条件,导致结果是错的,故应深入研究这些问题。本文应用具有优良性的因子分析模型L,加权算术平均数的合理性,解决了问题,得出了因子分析综合评价的合理性条件是:因子分析模型L下,变量是标准化、正向的,因子载荷阵较靠近简单结构,因子是正向的,因子与变量显著相关。并结合我国高技术产业利用外资质量评价
本文考虑在连续性住户调查中通过初始时刻的基于住户水平和基于个人水平的权重获得时刻的权重方法一权共享方法,包括入样概率倒数加权法;住户加权法;住户成员加权法。基于权共享方法的权重系数需要住户权重或者住户成员权重的均值为一。入样概率倒数加权方案要求提供时刻所有初始住户的入样概率和联合入样概率,住户权共享法和住户成员权共享法方法只需提供初始样本的入样概率,不需要联合入样概率。