带结构信息的函数型数据回归方法及其应用研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:q418004922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
函数型数据分析方法从动态随机过程的角度分析问题,将一条变化的曲线轨迹作为研究单元分析数据问题。近年来函数型数据分析方法得到了迅速的发展。随着数据收集技术和存储技术的进步,我们面临着越来越复杂的数据结构。因此,如何利用数据的结构信息提升回归模型估计和预测的精度,是一个值得研究的问题。本文针对带结构信息的函数型数据回归方法进行了研究和应用,并从理论角度研究了模型的理论性质,主要内容如下:(1)本文研究了带样本网络先验信息的函数型线性模型。在许多现代应用中,样本来自网络连接的个体。网络的信息对预测发挥着重要作用。为了借助先验的样本网络结构信息提升参数估计效果和模型预测效果,本文在目标函数中引入了拉普拉斯二次惩罚函数以鼓励有连接的节点间预测的相似性,提出了带样本网络先验信息的函数型线性模型,并研究了该模型的统计性质。随着数据收集技术和存储技术的发展,我们面临越来越庞大复杂的数据,数据中可能包含多个函数型协变量。针对这一现象,本文引入高维数据处理技术,对函数型协变量进行变量选择,提出了带样本网络先验信息的高维函数型线性模型。针对在实际数据分析中可能会存在“离群点”的情况,本文提出了带样本网络先验信息的稳健高维函数型线性模型。模拟结果和实例分析结果说明了当存在网络内聚性时,将样本网络结构信息纳入模型预测可以改进传统模型。(2)本文提出了带数据异质性的高维函数型线性模型。在某些研究实例中,我们仅仅知道数据可能来自于不同的亚组,但是具体的样本来源异质结构是未知的。因此,在构建模型时一个比较有挑战性的问题是如何在异质结构信息未知的情况下,将样本自动分组,同时完成对高维函数型线性模型的变量选择和参数估计。针对这一情况,本文提出了考虑数据异质性的高维函数型线性模型。本文假设样本中的异质性由未观察到的潜在因素决定,即回归模型的截距项来表示。我们通过对个体差异进行惩罚,自动将样本分为多个亚组。该模型能够同时实现样本的自动分组和高维函数型协变量的变量选择。这是亚组分析方法首次在函数型数据回归分析中使用。我们给出了该模型的统计性质,且允许函数型协变量的个数、样本异质结构组数随着样本数目增加而增加。模拟分析和实例分析表明,该方法在处理异质数据和同质数据方面,都表现出了良好的效果。(3)本文提出了带响应变量相关结构的多元响应变量回归模型。在某些实际数据分析中,基于相同的样本,可以针对不同的响应变量构建多个回归模型。如何借助响应变量间的结构信息促进多个回归模型的函数系数估计是值得研究的一个方向。为了提升多个回归模型中系数函数局部稀疏估计(即在某些子区域上为零)的准确性,本文利用响应变量间的相关关系,提出了多重光滑局部稀疏(m-SLoS)估计方法。仿真结果和实际数据应用分析表明,该方法在系数函数估计方面具有良好的数值性能,特别是在多个回归模型的系数函数具有完全相同或相似的零子区域的情况下。(4)本文提出了多元函数型广义可加模型。多元函数型数据是由多条函数构成的数据集合,广泛存在于各个学科领域和应用中。一些情况下,响应变量同函数型协变量之间并非都是线性关系。本文在稀疏结构假设下,放松了线性的假设,并引入了高维数据分析方法处理这类问题,相比传统的函数型广义线性模型更加灵活。我们给出了当连接函数为恒等函数时的多元函数型可加模型的统计性质。
其他文献
InAs/GaSb Ⅱ类超晶格(type-Ⅱ superlattices,T2SLs)因其俄歇复合速率低、材料均匀性好和较低的制造成本等优点,非常适合制备长波红外探测器。经过几十年的发展,超晶格红外探测器目前已经取得很大进展。但是,目前报导的InAs/GaSb Ⅱ类超晶格长波红外探测器和焦平面大都是采用分子束外延(Molecular beam epitaxy,MBE)方法生长获得的。而另一方面,工
学位
近年来,随着工业、建筑、交通等产业迅速发展,脊髓损伤(Spinal cord injury,SCI)患者的数量明显上升。SCI多发生于中青年人,常常导致终身残疾,给社会和家庭带来了沉重的负担,已成为一个重要的公共卫生问题。其主要临床症状表现为肢体的运动、感觉和自主功能的永久性丧失。随着干细胞研究的不断深入,干细胞移植疗法为SCI的治疗带来了希望。人脐带间充质干细胞(Human umbilical
学位
稀土离子掺杂的上转换发光是一种特殊的反斯托克斯(anti-Stokes)发光现象,即吸收多个低能量光子(例如波长较长的近红外光),发射出单个高能量光子(例如波长较短的可见光),最终实现光子能量的上转化。上转换发光材料具有优异的光学和化学性质,包括发光波长范围窄、自体荧光干扰低、稳定性高等,被广泛地应用于生物医药、信息防伪、环境监测、太阳能电池和光催化等领域。正是这种特殊的上转换发光机理,材料的发光
学位
圆竹取自竹茎秆中部,由生长有隔膜的竹节和中空的节间交替构成,并保持自然外观形态的圆筒状竹材。竹材采伐后在运输、仓储、分选等环节均伴随着气干失水。竹材的大气干燥是一种经济环保且适用于偏远林区的一种干燥方式,然而气干受环境因素影响较大,竹材含水率难以控制,干裂问题一直困扰着圆竹产品质量和产业发展。干裂与圆竹壁层的梯度结构密切相关,竹壁由表皮、竹肉、髓环三部分构成,而竹肉又是以维管束单向增强体和薄壁细胞
学位
背景与目的:心血管疾病是当今严重威胁人类生命健康的最主要疾病,其中,动脉粥样硬化(Atherosclerosis,AS)则是诱发心血管疾病发生发展最常见、最重要的病理基础。AS是一种非传染的慢性炎症性疾病,起始步骤通常是内皮细胞(Endothelial cell,EC)受损导致功能障碍,致使血小板和单核细胞聚集到内皮下,并释放包括血小板衍生生长因子(Platelet-derived growth
学位
目的:结直肠癌是常见的消化道恶性肿瘤之一,发病率和死亡率呈逐年上升趋势,给我国社会和经济发展带来沉重负担。我国每年新发结直肠癌病例429200人,死亡病例281400人,是第三常见的恶性肿瘤。结直肠癌最主要的死亡原因是复发与转移。虽然随着外科技术的不断进步,结直肠癌的生存率得到了提高,但肿瘤的转移以及复发仍给病人带来不良预后,给患者的疗效和生存质量带来严重影响。因此,寻找结直肠癌复发与转移的最佳治
学位
乳腺癌是女性最常见的恶性肿瘤,也是引起女性恶性肿瘤死亡的主要原因。乳腺癌干细胞(breast cancer stem cells,BCSCs)是一组具有自我更新和分化潜能的肿瘤启动细胞,它们影响着肿瘤的生长速度、迁移、侵袭、复发、转移和治疗抵抗以及调控干细胞信号通路的过度激活等特征。CD44+/CD24-/low和乙醛脱氢酶1+(ALDH1+)是鉴识乳腺癌干细胞最常见的标记物。乳腺癌干细胞已成为乳
学位
报纸
第一部分TMEM16A在压力超负荷型肥厚心肌病理机制中的作用背景:Ca2+、Ca2+依赖的转录因子、Ca2+依赖的酶、Ca2+稳态相关的蛋白(主要是离子通道蛋白和转运蛋白)在正常心脏和疾病心脏重塑及电重塑中具有非常重要的作用,作为Ca2+激活Cl-通道(calcium-activated chloride channels,Ca CCs),Ca CCs的激活情况与胞内Ca2+相关,生理或病理条件下
学位
期刊