大规模数据下基于充分降维的Leverage重要性抽样方法

来源 :统计研究 | 被引量 : 0次 | 上传用户:slow1223rabbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,大规模数据在短时间内搜集并储存下来,为分析决策提供了巨大的信息量,也给统计建模带来了一定难度。对于样本容量大、变量个数少的数据,Leverage重要性抽样是一个简便可行的方法。本文发现,该方法中度量样本重要性的Leverage分数与因变量无关,而且在维度较大的情形下对样本没有区分程度,使得估计结果较差。为了同时考虑因变量和维度的影响,本文提出了基于充分降维的Leverage重要性抽样方法。该方法以不损失信息为前提,在充分降维的空间内重新计算Leverage分数,使得抽样更具有代表性
其他文献
【正】上海汽车齿轮总厂厂长陈因达曾深有体会地说:“现在的市场竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼.”此话颇有见地.所谓“快鱼”,就是敏捷型企业;“慢鱼”只好在一旁眼巴
<正>新疆生产建设兵团天盈石化公司位于阿拉尔市以西的阿拉尔经济技术开发区,该公司30万t/a乙二醇项目(一期)工程建设如火如荼,计划年底完成机械竣工。该项目建设内容:主要包
从1953年到1957年,我国实行了第一个五年计划,试图沿着前苏联的工业化道路实现工业化和现代化。吴敬琏向大家分析了这条工业化道路的两个特点:一是采取投资和资源拉动的粗放增长
中国民营经济的高质量发展任重道远,新的创新驱动路径亟需拓展。互联网与实体经济的深度融合使得互联网的"资本化"趋势愈发凸显,而互联网资本对民营企业创新的作用机理研究尚
剖宫产疤痕妊娠在治疗上缺乏统一方案,本文旨在通过总结25例早期剖宫产疤痕妊娠患者的治疗效果,为临床提供可行的诊疗方案。一、资料与方法1.一般资料 回顾本院2004—2008年收
真正面向现实的马克思主义哲学研究必须有明确的“提问方式”。当代中国的马克思主义哲学研究应当首先确立“中国提问方式”,以此来逐步形成明确的研究范式和科学合理的问题意
【正】记得鲁迅先生说过这样一句话:第一个吃螃蟹的人一定是勇敢的人.他还说,螃蟹有人吃,蜘蛛一定也有人吃过,不过因为不好吃,以后才没有人吃的.很多植物的果实最初成为食品
【正】都已经是两个星期前的事情了,但每当回想起来,我的内心都会禁不住为之震荡.那是去年初冬的一个夜晚,寒风有些袭人.加完晚班,我和一位同事去了一家小吃店,随便要了几个
摘要: 目的:分析丙种球蛋白与甲基强的松龙联合治疗早期重症手足口病的治疗效果。方法:从2011年2月到2014年5月与我院治疗的早期重症手足口病患者中选取76例病例,分成在常规利巴韦林静脉滴注及抗生素等治疗中加入丙种球蛋白单药治疗的对照组(38例)与在常规疗法中加入丙种球蛋白静滴与甲基强的松龙联合治疗的观察组(38例),观察各组疗效、并发症及热退、抖动易惊消失、白细胞恢复等所需时间,分析丙种球蛋白