乘积模型的变量选择

来源 :河南大学 | 被引量 : 0次 | 上传用户:ssfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量选择是统计推断中的经典和热门研究课题。例如在癌症疾病研究中,真正决定癌症疾病发生的基因只有数十个,从成千上万的基因中选出这具有决定性作用的数十个基因,就是一个变量选择的过程,这不仅可以帮助生物学家更好的理解和研究分子的性能,也可以帮助统计学家建立更好的分类准则。另外在现实生活中,我们要处理很多类型的数据是非负的,比如研究公司的收入、生存时间等,用传统的线性模型来直接建模就不太合理了。乘积模型则能更好的处理这类数据,因此近年来得到了广泛的应用。  本文主要研究了乘积模型的参数估计和变量选择问题。第1节综合介绍了一些传统的参数估计方法,例如最小二乘方法、最小绝对值方法,最小相对误差方法等。我们通常所用的相对误差是误差值与观测值之比,而不是误差值与预测值之比,而本文所采用的LARE准则是将以上两种形式的相对误差相加。本文第二节综述了变量选择相关方法。在回顾Chen et al.(2010)提出的LARE估计及其理论性质基础上,本文在第三节重点研究了基于LARE准则的变量选择,通过选用Adaptive lasso和SCAD两种惩罚函数得到稀疏的估计,并证明了相应估计的oracle性质。第4节给出了调节参数的BIC选取方法,并通过模拟说明所提方法的有限样本表现。从模拟效果中可以看出,Adaptive lasso和SCAD选出真实模型的概率随着样本量增加趋于1,而且估计的效率与已知真实模型下估计的效率渐近相等。本文最后给出了相关工作的推广和拓展。
其他文献
代数组合学是组合数学的一个重要分支,它研究具有高度对称性和优美结构的组合对象.编码理论是现代计算机科学和数字通信技术的核心,它研究如何对信息本身加入冗余,以对抗传输过
本文介绍了住宅照明设计现状,讨论了住宅照明设计中光源及灯具选择的要素,并着重对各套内空间的光环境及其电气照明设计进行讨论。 This paper introduces the current situ
信赖域方法和线搜索技术都可以保证非线性优化算法整体收敛,各有优势,信赖域方法能保证算法具有良好的收敛性,线搜索技术在确定新的迭代点时计算量较小.Nocedal和Yuan提出了结合
Y两优2号是湖南杂交水稻研究中心选育的超级杂交稻新组合,具有株叶形态理想、熟期适中、适应性广、高产稳产、优质等特点。2009—2012年的品比试验及高产栽培示范表明,该组合
对于Banach空间几何理论的研究一直是众多研究工作者所关注的焦点点,特别是Banach空间的几何结构和各种几何常数,运用这些不同的几何常数不仅可以研究Banach空间的几何结构,也可以与不动点理论相结合。本文主要研究Banach空间中广义光滑模及其应用。主要从三个方面进行展开。首先,介绍了课题的研究背景,对Banach空间几何理论的发展做出简要介绍,并且简要的展示了本文的主要研究内容。其次,给出
学位
图像去噪是图像领域中的经典的问题。现实生活中拍摄仪器所获取的图像可能包含不同来源的噪声,会影响图像的质量,当我们需要对图像进一步处理时,比如图像分割等等,为了保证后续的
本文利用胡星标等人提出的“源生成法”,在一个可积的全离散Leznov格方程和两个可积的半离散Leznov格方程(由二维Leznov格方程离散化而得)的基础上,分别构造出一个带源的全离散Le
全球气候的变化已成为国际社会普遍关注的热点问题,如何遏制全球环境继续恶化、降低污染物排放量,已经成为世界各国政府以及学者的共识。从2003年开始,我国二氧化硫排放量已居世
本文中在DG代数层面介绍了Keller的Koszul对偶理论,研究了DG代数完备导出范畴中的silting对象以及正分次箭图上的极小的A∞路代数的导出范畴。具体地,得到如下结果。对给定域K
图像分割是高级图像处理如图像理解和图像识别的基础,是图像分析和计算机可视化的重要分支,无论是在理论研究领域还是实际应用领域都具有很高的关注度.另外随着人类活动范围