【摘 要】
:
本文将研究含有多元非线性结构的高维线性回归模型和含有多元非线性结构的高维Logistic回归模型的参数估计问题。虽然传统的部分线性模型和广义部分线性模型利用了非参数方法在一定程度上解决了非参数部分的估计问题,但当非参数部分是高维变量时,会存在“维数灾难”的问题,在实际使用中为了避免该问题,通常在非参数部分仅使用一维变量。为此,本文受到使用核技巧处理非线性回归问题的启发,在backfitting迭代
论文部分内容阅读
本文将研究含有多元非线性结构的高维线性回归模型和含有多元非线性结构的高维Logistic回归模型的参数估计问题。虽然传统的部分线性模型和广义部分线性模型利用了非参数方法在一定程度上解决了非参数部分的估计问题,但当非参数部分是高维变量时,会存在“维数灾难”的问题,在实际使用中为了避免该问题,通常在非参数部分仅使用一维变量。为此,本文受到使用核技巧处理非线性回归问题的启发,在backfitting迭代算法的框架下,首先提出了基于核技巧的部分线性模型的估计方法,并进一步尝试将核技巧的思想运用到Logistic部分线性模型的估计中,用于解决响应变量是0-1变量的分类问题。其次,通过数值模拟结果证明了本文提出的算法的有效性,并与传统的部分线性模型和Logistic部分线性模型的估计结果进行比较,得出基于核技巧的估计方法的准确性和稳定性优于传统的估计方法。最后,将Logistic部分线性模型运用于信用卡数据来处理二分类问题,对基于核技巧的估计方法和传统的估计方法得出的模型预测效果进行了实证比较。
本文提出的基于核技巧的部分线性模型和Logistic部分线性模型的估计算法,对传统的部分线性模型和Logistic部分线性模型的估计算法的缺点有一定程度上的改进,主要在于将对非参数部分的局部估计改进为基于再生核的全局估计,克服了非参数方法存在的“维数灾难”问题。因此,其对半参数模型领域具有一定的研究价值和意义。
其他文献
随着大数据时代的到来,海量数据的出现,数据缺失的问题越来越严重。缺失数据给应用研究和统计分析带来了很大困扰。传统的统计分析方法不能直接应用到缺失数据的处理中,不恰当的处理缺失数据,会导致错误的结论。因此,缺失数据的处理一直以来都是统计学的前沿和热点问题。本文考虑缺失数据下转换模型的统计推断问题,我们采用逆概率加权光滑最大秩相关估计方法来估计转换模型中的感兴趣参数,并对所提出估计量的渐近正态性和相合
针对信用卡申请评分中的数据不平衡问题,本文提出了一种可以用于连续变量与分类变量混合的混合数据的欠采样方法——UMBKER。该方法可以在基本保持原有多数类样本数据分布特性不改变的前提下,有效地去除多数类样本中较为冗余的样本,从而达到降低数据不平衡率、减少不平衡数据对模型影响的目的。 UMBKER算法是一种适用于混合数据聚类的KAMILA聚类方法与去冗余算法相结合的欠采样方法。该方法先对数据集中的多
2008年的金融危机,对全球经济造成振荡,与此同时,也让经济不确定性逐渐成为学者和政策制定者不容忽视的问题。不确定性的研究早已有之,但量化经济不确定性的困难阻碍了相关研究的进一步发展。现有的测度主要在国家的维度展开,测度的方法,根据所使用数据的不同,可以划分为基于统计指标的测度、基于主观意见的测度和基于媒体信息的测度。考虑到我国各省域之间的异质性以及宏观经济不确定性测度的研究趋势,本文旨在测度省域
自从金融诞生以来,风险就伴随其左右,随着网络贷款平台的迅猛发展,信用风险问题层出不穷。2016年8月,监管部门发布了《网络借贷信息中介机构业务活动管理暂行办法》,为行业的规范发展指引了道路。无论是出于金融机构本身对于预期损失和收益估算的需要,还是基于监管部门对金融机构的要求,金融机构都需要对信用风险各项指标做预测。2004年颁布的《新巴塞尔资本协议》充分反映了一笔交易的信用风险既包含债务人的违约概
由于我国各个地区在经济水平、政府调控、区域企业特征、区域人口特征等方面存在较大差异,货币政策的调控效果并不都能达到预期目的,即货币政策的传导效果呈现区域非对称性。不少学者探索了我国货币政策区域非对称性的成因,但是多数文献着眼于货币政策对总产出和物价水平的调节,而忽视了宏观货币政策波动对微观企业行为的影响。 因为企业是国民经济的主体,企业行为会受到货币政策的影响。企业之间不仅在产权性质、资本规模等
《新巴塞尔协议》将违约损失率纳入银行监管资本的计量框架之中,使得违约损失率成为信用风险管理领域的一个重要研究课题。同时,违约损失率的准确预测,对银行保证资本充足、维持金融体系的稳健都有着重要作用。本文采用多任务学习方法,希望能提高违约损失率预测的准确性。 本文选取了美国著名网络借贷平台Lending Club官方网站所提供的2013年-2016年的贷款数据,包括借款人的身份信息、财务信息以及贷款
为“增强金融服务实体经济能力,健全货币政策和宏观审慎双支柱调控框架,完善金融监管体系,守住不发生系统性金融风险的底线”,我们必须要推进金融业综合统计改革。而想要达到宏观审慎管理,需要我们有强大的统计体系、统计数据对此进行支撑。2008年金融危机后暴露出的信息缺口也警示着我们,统计体系提供的统计数据如果不够全面的话,难以实现对金融风险的监测和对金融危机的预警,无法监测无法识别就更难以实现对金融风险的
“预测”作为实证经济学的三大任务之一,它不仅受到学者的关注,更受到政府、企业、消费者等主要市场参与主体的“青睐”,因为它关系到政府政策和企业投融资策略的制定以及消费者消费行为的选择。GDP作为衡量经济发展的重要指标,尽管受到诸多质疑,但世界绝大多数国家目前仍将其作为衡量经济发展的最重要指标,并作为政府制定政策的重要参考变量,因此,如何预测GDP并降低其预测误差是一个值得关注和研究的课题。 本文在
经济增长、能源节约、环境保护、科技进步是目前人类共同关心的话题以及人类可持续发展努力的方向。重点问题是了解当今经济、能源、环境、科技四大系统目前的协调发展水平以及如何在当今粗放式发展中做到以经济可持续增长为目的,能源可持续利用为基础,环境可持续生存为条件,科技可持续发展为手段的经济、能源、环境、科技四大系统协调平衡发展。协调发展对我国以全新的、更高效的、更低成本的经济发展方式实现整个社会的可持续发
随着环境问题的全球化及日益严重,发展绿色经济已经成为全球共识。绿色信贷作为我国绿色金融最主要的金融工具,可以有效发挥资本市场配置资源功能,动员和激励更多的社会资本投入到绿色产业中,弥补公共财政投入的资金缺口。为了对绿色信贷实施情况进行监测评价,对绿色信贷进行核算是必不可少的,而目前我国的绿色信贷统计却仍处于初级阶段,存在着诸多问题:如对绿色信贷存在不同理解,导致涉及机构部门的识别不清晰与统计资产的