基于抽样方法的大数据统计推断

来源 :天津大学 | 被引量 : 0次 | 上传用户:sunjava2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了大规模可加风险模型的子抽样估计和分布式大数据逻辑回归模型的最优子样本选择.(1)对于大规模生存数据,我们提出了基于可加风险模型的子抽样估计,并建立了子抽样估计的相合性和渐近正态性.我们通过最小化子样本估计的渐近方差得到最优抽样概率.通过数值模拟,我们验证了最优抽样估计比全样本估计需要的计算时间少,同时比均匀抽样具有更小的偏差和更优的覆盖率.我们还对SEER数据库中淋巴癌患者的生存数据进行了分析.(2)对于分布式存储的大数据,我们提出了分布式逻辑回归模型的最优子样本选择方法,给出了最优抽样概率和最优样本分配.我们证明了子抽样估计可以很好的逼近全样本极大似然估计,并给出了子抽样估计的渐近正态性.在数值模拟和实例分析中,我们验证了提出方法的有效性.
其他文献
绝对值方程问题是一类特殊的优化问题,在众多数学领域中,许多问题可通过转化成相应的绝对值方程组模型来解决,由此该课题是优化界研究的热点问题之一.目前,标准绝对值方程问题已被许多专家学者们推广到更广泛的框架下,将欧氏空间中标准绝对值方程组推广到二阶锥框架下(即为二阶锥绝对值方程组)或者是圆体锥框架下(即为圆体锥绝对值方程组).二阶锥绝对值方程问题可等价转化为相应的二阶锥互补问题,对其求解也就可以等价变
学位
随着保险行业的高速发展,市场竞争态势日渐激烈,风险挑战明显增多,其中一类就是道德风险。在保险行业,由信息不对称导致的道德风险问题逐步凸显,它的发生不仅阻碍保险业的发展,也导致了市场资源配置的低效率。因此,基于道德风险影响下的保险相关研究是必要的,它为保险公司防范道德风险提供了理论支撑,对提升保险公司的投资决策能力,稳定保险业的运作经营具有积极意义。随着经济的快速发展和保险规模的扩大,保险公司正面临
学位
<正> 笔者自1982年以来,运用辨证治疗之法治疗12例失眠症。其中病程长者6年,短者1年,均为服西药无效者。经余诊治,结果治愈7例,有效2例,无效3例。分型用药:肝气郁结用甘麦大枣汤合四逆散加胆草、大黄;肾阴亏虚,相火妄动用甘
期刊
目标检测与实例分割是计算机视觉的两大经典任务,在文本、车牌、行人、遥感检测及无人驾驶等多个领域有着重要作用。目标检测需要在一张图像中识别出给定类别范围内的所有物体,并且用一个矩形框将物体框出来。而实例分割则是用掩膜来为每个实例打上像素级标签。近年来随着硬件设备GPU的计算力大大提高,以及卷积神经网络(CNN)的快速发展,深度学习方法已成为包括目标检测在内的多种计算机视觉领域的主流方法。本文将着眼于
学位
知识经济时代,地理学与世界移民研究越来越重视知识移民及其流动。本文以海归知识移民为例,采用问卷调查等定量研究方法,探讨其回流的驱动因素,并在构建地方嵌入量表的基础上分析回流知识移民地方再嵌入的状况及其影响因素。研究发现:(1)工作与经济机会是吸引他们回流的关键性因素,但同时社会关系因素(家庭、朋友等)、文化归属因素(文化思维与深层的归属感等)和地方环境因素(生活环境、制度环境等)在其回流决策过程中
学位
由张量定义的互补问题和变分不等式问题是近年来互补问题和变分不等式问题的研究热点,其理论研究主要包括:可解性、解集的非空紧性、解的唯一性和误差界等性质.随着研究的深入,更多广义的互补问题和变分不等式问题被定义.本文主要研究了两类广义的互补问题和变分不等式问题,并分析了其部分理论性质,具体包括:本文将张量互补问题从非负锥R+n推广到更为一般的尖闭凸锥K上,给出了K上结构张量的定义,并举例说明了它们之间
学位
写作是小学语文教学过程中必不可少的内容之一,是社会考核个人能力的主要方式。作为小学语文教师,要及时改变传统教学方法,既要着重培养学生的写作能力,又要让学生的写作素材趋于生活化,而不是让其套用模板进行写作。只有将二者相结合,学生的作文才具有鲜明的个人风格,也才能提高学生的写作水平。
期刊
近年来在可持续发展的目标导向下,以风电、光伏为主的新能源发电凭借其清洁无污染的优点获得高速发展,并将逐渐替代火电成为中国第一主力电源。然而针对未来电网,一方面风电、光伏出力的不确定性对电力系统调峰能力提出更高要求,另一方面火电占比快速下降使调峰资源大幅减少,导致弃电现象严重。与此同时,氢能具备清洁高效、应用广泛等优点,使电解制氢成为降低新能源弃电率的潜在技术手段之一。基于此,论文将未来大规模新能源
学位
为提高职业院校“双师型”教师队伍建设,提升教师“产教深度融合”素养,本文以船舶智能焊接专业为例,分析了职业院校教师参加企业实践的意义,指出了职业院校教师参加企业实践的必要性。从教师和企业两个方面阐明了职业院校教师在企业实践过程中面临的问题和遇到的困难,并从拓展企业实践渠道、开展企业实践交流等方面给出了职业院校教师企业实践实现的具体途径,为职业院校教师进行企业实践提供经验借鉴。
期刊
任何思想观点和理论范畴都是历史的具体的。我们党提出不断提高“政治三力”的政治要求,有其深刻的历史语境:处于“两个一百年”奋斗目标历史交汇期的新历史方位,同加强党史学习教育、总结汲取历史经验联系起来,所要求的对象覆盖全体共产党员等。深刻把握不断提高“政治三力”的政治逻辑在于:必须旗帜鲜明讲政治,必须旗帜鲜明讲党性,必须努力掌握马克思主义看家本领。不断提高“政治三力”必须掌握正确的思想方法论:坚持人民
期刊