基于FDR控制的函数型数据的变量选择研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:ymlazy62
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
函数型数据作为一种数据类型,在许多领域经常出现.多元函数型线性回归问题作为多元线性回归问题在函数型数据下的推广.对于函数型变量选择问题,现有的方法大多没有考虑控制函数型变量的错误发现率(False discovery rate,FDR).因此,对于函数型变量选择过程,本文考虑在控制FDR的前提下,尽可能多的选择出与响应变量相关的函数型特征.最近,在高维数据下,统计学家们先后提出了model-X knockoff滤波、高斯镜像法等有效方法,这类方法通过构造关于非显著特征的对称统计量来达到控制FDR的目的.本文的研究基于这类控制FDR的方法,基于model-X knockoff滤波以及高斯镜像法,将两种方法推广至函数型数据的情形.第一种方法我们称为F-knockoff滤波,我们首先定义了随机函数的条件两两独立,通过条件独立定义随机函数的显著性,同时将model-X knockoff滤波相关定理结论推广至函数型的情况,并定义了F-knockoff变量.第二种方法我们称为函数型高斯镜像法,分为低维高维两种情况.对于低维函数型高斯镜像法,我们首先定义了低维函数型高斯镜像变量,将低维高斯镜像法相关定理结论推广至函数型数据的情况.对于高维函数型高斯镜像法,我们首先讨论了向量情况下的选择后推断问题,定义了高维函数型高斯镜像变量,并将高维高斯镜像法相关结论平行推广到函数型数据的情形.同时我们对两种方法进行了数值模拟与实际数据分析,结果表明我们提出了方法能成功地控制函数型变量选择过程的FDR.
其他文献
语音信号作为人类生活与工作中最重要且不可或缺的交流手段,在学界研究领域与业界应用领域受到很高的重视。每个人的语音特征都是独一无二,从理论上讲,语音特征,或者被称为声纹,就像人类的指纹一样,几乎不会有两个人拥有相同的声纹。因此,可以通过对不同人的声纹进行识别,从而实现识别不同人身份的目标。而这种技术,就被称为声纹识别,或者说话人识别。与人脸识别,虹膜识别和指纹识别一样,声纹识别也属于生物识别技术。在
学位
推荐系统(Recommender Systems,RSs)经过几十年的科研探索以及商业应用,目前已经发展成为一种用途广泛的基本工具,可以在我们工作、生活、商业运作、学习、社交和娱乐等各个日常方面提供更有信息量及效率的选择。在内容服务日益过载的数字经济时代,用户需要从大量快速增长的内容、产品和服务中做出选择,推荐系统的作用已变得不容忽视。由于推荐系统拥有巨大的应用价值,近几十年来它始终处于研究热门领
学位
无机CsPbI3材料由于优异的半导体特性、出色的热稳定性成为光电领域的明星材料,引起了相关领域内学者的普遍关注。经过几年的发展,CsPbI3钙钛矿太阳能电池的功率转换效率(PCE)已经超过了20%。然而,由于CsPbI3材料中容忍因子的限制(组分Cs+尺寸太小),使其在室温下无法维持长期稳定的相结构。鉴于此,我们提出了在CsPbI3中引入难挥发的大体积有机阳离子来诱变本征的三维结构,使其沿特定的晶
学位
随着互联网技术的快速发展和网络基础设施的不断完善,我国已有超过7.8亿的人选择在网上购物,大量的用户购买行为产生了海量的数据,电商平台如何利用这些数据,借由机器学习技术对客户未来的购买行为做出预测,已经成为当下的研究热点。购买金额预测是指对客户未来一段时间购买的订单总金额进行预测,企业可以通过购买预测来实现调整备货策略、制定业务人员的销售目标、制定下一个周期的经营预算等目的。为了实现用户的购买金额
学位
以2年生拧筋槭嫩枝为试验材料,采用生长素NAA、IBA,浓度0、500、1 000、1 500 mg/L和速蘸时间0、5、10、15 min,研究拧筋槭嫩枝扦插技术,探讨生长素种类、浓度和时间对拧筋槭嫩枝扦插生根的影响,试验中发现不同浓度IBA、不同速蘸时间对拧筋槭根数和根径影响显著,对根长影响不显著;在相同NAA与速蘸时间处理下(NAA1 000 mg/L、速蘸时间10 min),IBA为1 5
期刊
近年来互联网行业高速发展,软件的规模和用户都持续增长,传统的单体应用已经无法满足用户的需求。企业为了追求高性能、高可用且稳定的目标,通常会使用微服务架构对软件进行设计,将软件整体的功能分为不同的模块,每个模块开发、构建和部署以及日渐复杂的互联网软件架构都给企业运维人员带来很大的挑战。软件系统在运行过程中产生的海量微服务日志和中间件日志是运维人员分析和监控软件的重要信息来源,所以,企业需要一套能够对
学位
自旋波是电子自旋的集体进动形式,运动中携带有丰富的振幅和相位信息,并且摒弃了传统电子传输的热损耗,因而成为新一代低能耗存储器件的理想载体。从GHz到THz,波长比相同频率的微波小4到5个数量级,这使得它们与现代纳米级的电子设备和电路兼容。随着电子器件的微型化和高频化,需要制备微纳级别的电子器件,因此对于微纳尺寸图案化薄膜自旋波的基础物理机制研究及调控是非常重要的。本文采用图案化技术研究了软磁薄膜共
学位
可充电的水系锌离子电池,以其储量丰富、价格较低、高稳定性、低氧化还原电位(-0.76 V)、高比容量(820 m Ah g-1)以及高离子电导率(约1 S cm-1)等一系列优点而引起了国内外的广泛关注。水系锌离子电池的构造包括正极、负极活性材料、水系电解质、集流体以及纤维隔膜,然而,对于电池而言,其电化学性能很大程度上受正极材料和负极材料的限制:锌作为锌离子电池中最广泛使用的负极材料,在电池的工
学位
近年来随着云计算、物联网等技术快速发展,越来越多具有计算密集和时延敏感特性的新型网络应用开始出现在用户视野。为了克服移动设备在执行新型网络应用时工作负载方面的局限性,移动边缘计算(Mobile Edge Computing,MEC)能够有效解决联网(Internet of Things,Io T)设备能量和计算能力不足的问题,成为下一代网络关键技术。边缘计算系统中任务卸载及资源分配方案受到工业界和
学位
经过十多年的发展,钙钛矿太阳能电池的光电转换效率从3.8%提升到25.7%,成为最受欢迎的第三代光伏器件。全无机CsPbX3(X=Cl,Br,I)钙钛矿太阳能电池由于具有结构简单、合适的带隙以及优良的载流子传输等特点被广泛研究。但是,全无机CsPbX3电池目前仍然存在一些问题:首先,电池中有机空穴传输材料如spiro-OMe TAD(spiro)受热易分解是影响CsPbX3器件长期稳定存在的重要因
学位