【摘 要】
:
数据挖掘的常用方法是回归分析,传统的回归分析仅可由自变量估计因变量的条件期望,分位数回归可由自变量估计因变量的条件分位数.在实际应用中,常会因为某些原因导致数据缺失
【机 构】
:
湖北大学数学与统计学学院,武汉430062;湖北大学应用数学湖北省重点实验室,武汉430062
论文部分内容阅读
数据挖掘的常用方法是回归分析,传统的回归分析仅可由自变量估计因变量的条件期望,分位数回归可由自变量估计因变量的条件分位数.在实际应用中,常会因为某些原因导致数据缺失,这些数据不可盲目删除或丢弃,否则会造成有偏的估计.在分位数回归模型下,文章以缺失数据为研究对象,主要解决两个方面的问题:一是利用逆概率加权的方法设计权重,通过构造加权的估计函数调整协变量随机缺失对参数估计造成的影响;二是设计Proximal-ADMM算法对模型参数进行估计.模拟与实证研究表明:采用Proximal-ADMM算法对带有缺失数据的分位数回归模型进行参数优化,所得估计量是无偏的.
其他文献
对2017-2019年国家社科基金、教育部人文社科基金立项课题,CNKI收录的CSSCI期刊论文进行量化分析,发现立项课题热点有区域国别问题研究,汉语作为二语习得与教学及数据库、语
马克思关于落后国家有可能避免经历挫折、跨越资本主义阶段直接建设社会主义的设想,是对人类社会一般形态发展原理在特殊国情条件下的突破.梳理不同时期马克思恩格斯关于“跨
2020年初突发的新冠肺炎疫情引发天津高校体育教学三个月的停摆,这是新中国成立70年以来从未发生过的体育教学事件.从教学的无法预测性和罕见性分析,这应属于体育教学的“黑
人类命运共同体思想和西方全球正义观在价值追求层面存在相通之处,即构建全球化中的世界正义秩序,但二者在文化传统、理论基础、实践单位、实践方式和关切领域等方面差异显著
社会变迁与社会规约是乡土文化教育认同的时代前提和外在保障,思维范式和幸福体验是其内在基础与认同的关键.乡土文化教育位置的失序、社会规约强制的不足、应对多元文化冲击
大数据时代的数据规模更加庞大,结构也更加复杂,因而数据分析应更加强调数据间的相关关系而不只是因果关系.与研究变量间因果关系的最小二乘回归模型不同,函数关系模型更加注
各单项预测方法权重的确定是区间型组合预测中的核心问题。与常规区间型组合预测方法相比,文章从熵值的角度出发,提出了三种简易可行的区间型组合预测权重确定的方法:将区间数转换成实数,利用相对熵确定区间型组合预测的权重;对于区间数自身,利用Shannon熵确定区间型组合预测的权重;将区间数转换成等价的二元联系数,利用联系熵确定区间型组合预测的权重。实例分析结果表明,所提出的三种权重确定方法简单可行,计算结果显示相应权重的区间型组合预测模型具有较高的预测精度。
住户调查数据包括基础数据和汇总数据两部分,由于基础数据包含住户敏感信息,尚未公开;汇总数据包括国家数据、分省数据和分市县数据,从发布级别来说,全国和分省数据是最高级别的,因此,探讨分省住户调查数据准确性问题具有重要意义。由于住户调查所涉及的调查指标繁多,文章主要针对居民人均可支配收入及人均消费支出、城镇居民人均可支配收入及人均消费支出、农村居民人均可支配收入及人均消费支出等数据准确性进行讨论。研究过程中运用benford定律、计量经济模型和统计诊断检验以及逻辑关系评估法探讨了城乡住户调查一体化新口径下分省
文章在劳动力供求理论基础上,提出老龄化对“中间群体”收入份额可能存在“倒U”型效应。交互效应面板数据模型的实证结果证实了该“倒U”型效应的存在。其中,发展中国家大多数仍处于“倒U”型的左侧,而发达国家已处于“倒U”型的右侧。中国老龄化极大地提升了“中间群体”的收入份额,而日本与之相反。“倒U”型效应的根源在于老龄化促进自动化时,未能带来生产率的极大提高和新岗位供给的有效增加。因此,自动化要朝着促进生产率提高、就业增加和劳动收入份额提升的方向行进。同时,人力资本投资、维持金融稳定
方志学宗师、哥伦比亚大学博士朱士嘉先生在美国留学和工作11 年,有很多重要的学术活动和研究成果.1950 年他辞去华盛顿大学教职回到中国,任武汉大学历史系教授.不久中国开始