【摘 要】
:
多分类数据分析在实证研究中具有重要意义.然而,由于高维数、小样本及低信噪比等原因,现有的多分类方法仍面临信息量不足而导致的效果不佳问题.为此,学者们通过收集更多信息源数据以更全面地刻画实际问题.不同于收集相同自变量的不同源样本,目前较为流行的多源数据收集了相同样本的不同源自变量,它们的独立性和相关性为统计建模带来了新的挑战.本文提出基于典型变量回归的多分类纵向整合分析方法,其中利用惩罚技术实现变量选择,并独特地考虑不同源数据间的关联结构,提出高效的ADMM算法进行模型优化.数值模拟结果表明,该方法在变量选
【基金项目】
:
全国统计科学研究重大项目"基于网络结构的多层次变量选择方法及应用"(2018LD02);上海市浦江人才计划"多源高维数据的变量选择与整合分析及其在生物医疗领域的应用"(19PJ1403600);
论文部分内容阅读
多分类数据分析在实证研究中具有重要意义.然而,由于高维数、小样本及低信噪比等原因,现有的多分类方法仍面临信息量不足而导致的效果不佳问题.为此,学者们通过收集更多信息源数据以更全面地刻画实际问题.不同于收集相同自变量的不同源样本,目前较为流行的多源数据收集了相同样本的不同源自变量,它们的独立性和相关性为统计建模带来了新的挑战.本文提出基于典型变量回归的多分类纵向整合分析方法,其中利用惩罚技术实现变量选择,并独特地考虑不同源数据间的关联结构,提出高效的ADMM算法进行模型优化.数值模拟结果表明,该方法在变量选择和分类预测上均具有优越性.基于我国上证50的多源股票数据,利用该方法对2019年股票日收益率的影响因素进行了实证探究.研究表明,本文提出的多分类整合分析在筛选出具有解释意义变量的同时具有更好的预测效果.
其他文献
一rn香港大屿山,21世纪初新增添了一处绝美的风景:心经简林.从昂坪的宝莲禅寺一路往海边走,可见由38条高大木柱组成的户外木刻群,将饶宗颐先生的汉简心经书法作品,镌刻在来自
本文以2011—2019年我国医药制造业上市企业为样本,考察了高管团队风险偏好、失败再创新行为与再创新绩效间的关系.研究表明,高管团队风险偏好正向影响失败后技术开发阶段再创新绩效,但负向影响失败后成果转化阶段再创新绩效.失败后全新创新在高管团队风险偏好与失败后两阶段再创新绩效间皆存在中介作用,而失败后追加创新未见中介作用.同时,高管团队风险偏好对失败后两阶段再创新绩效的影响较对成功后两阶段再创新绩效更显著,且失败后全新创新较成功后全新创新的中介作用更显著.本文旨在为企业构建合理的高管团队、改善其失败再创新
冷战后,中国国际关系研究领域出现了一种流行观点,即英美之间的霸权转移是以和平方式进行的。对这一观念的重新考察表明,“英美霸权和平转移论”赖以存在的前提和史实都不无争议,且其传播带有意识形态色彩。首先,将和平视为没有战争的状态,可能是一定历史时期、地域和文化等背景下的社会意识,已经遭到越来越多的质疑。其次,即使以消极和平观作为判断依据,英美之间没有直接战争,并不等同于英美霸权转移过程中没有发生战争。最后,对“英美霸权和平转移论”源头和传播背景的追溯表明,其理论带有明显的美国中心论和文化霸权等意识形态色彩,隐
航空运输是中美经贸活动、文化交流的桥梁和纽带,为中美乃至世界经济的发展做出了重要贡献。航权是开展航空运输的权利基础,是主权的体现和延伸,是基于主权基础上的权利交换。新冠肺炎疫情下确保国家安全是主权国家的首要责任和义务,一国有权对授予他国承运人的航权予以限制。新冠肺炎疫情导致履约的基础完全丧失。中国对美国航权的限制,并未剥夺美国承运人公平竞争的机会。竞争对抗将成为今后一个时期中美关系的主基调,航权必将是中美间持续关注的议题。应高度重视法律在处理对外事务中的作用,积极运用法律维护自身权益。摒弃“内外有别”的管
尽管国内价值链战略被视为助推中国产业发展的重要途径,但受制于忽略异质性的不足,已有研究很难进行企业层面的系统分析.有鉴于此,本文通过汲取增加值贸易与微观计量的双重优势,整合2002年、2007年、2010年、2012年省(区、市)间投入产出数据、工业企业数据与海关数据的海量信息,构建了一个可以连接新新贸易理论与国内价值链的分析框架.结果显示:我国制造业的国内价值链嵌入度大幅提升,但是提升背后隐藏着偏好加工制造、排斥服务投入的倾向;进一步考虑贸易类型、区域空间与所有制差异,也未改变国内价值链嵌入度的上述倾向
在现行农村土地制度下,土地经营权流转能否在增加农民收入的同时缩小收入差距是必须回答的现实问题.本文使用全国25省(自治区、直辖市) 180个村的固定观察点数据,从收入增长和收入差距两个层面,分析了土地经营权流转对农村居民收入分配的影响效应.回归结果表明,土地经营权流转(包括土地转入和土地转出)在平均意义上显著促进了农户人均收入水平的提升.条件分位数处理效应模型的估计结果表明,土地经营权流转对农户人均收入的影响效应随收入分位点的提高而上升,这说明土地经营权流转在一定程度上扩大了农民内部的收入差距.进一步使用
门限因子模型设定载荷具有阈值型区制转换结构,可以同时刻画高维时间序列的共变性和区制转换特征.针对高维门限因子模型,本文基于自适应组LASSO技术给出了一种一致模型选择过程.这一模型选择过程将因子个数设定、门限效应推断纳入统一的分析框架,不仅解决了模型选择的一致性问题,还同时实现了模型选择误差的统一控制,这对于高维门限因子模型而言是非常重要的.理论研究和随机模拟结论表明本文给出的一致模型选择过程具有良好的大样本性质和有限样本表现.最后,本文将门限因子模型应用于我国金融市场分析,实证结果进一步验证了本文理论的
印太地区已成为大国博弈的重要区域,深刻影响着世界秩序的未来走向。作为曾经的域外霸权国,英国的“印太政策”体现出内在的承继性与代表性。通过梳理和考察英国对外政策的历史演变,发现英国尽管在整体上从属和联动于美国的全球战略,但其“印太政策”具有自身的路径依赖与政策目标。具体而言,英国依托帝国历史遗产,通过提升与局势稳定英联邦成员的合作水平,同时加大对欠发达英联邦成员的援助力度,强化与印太地区英联邦国家的历史纽带。与此同时,英国持续强化印太地区的军事存在,发挥印度洋领地的战略支点作用,加强与南太岛国互动,以提升在
本文创新地将半监督交互式关键词提取算法词频-逆向文件频率(Term FrequencyInverse Document Frequency,TF-IDF)与基于Transformer的双向编码表征(Bidirectional Encoder Representation from Transformers,BERT)模型相结合,设计出一种扩展CPI预测种子关键词的文本挖掘技术.采用交互式TF-IDF算法,对原始CPI预测种子关键词汇广度上进行扩展,在此基础上通过BERT"两段式"检索过滤模型深入挖掘文本信
竺可桢不仅是中国气象学、地理学的奠基人,而且也是中国海洋科学的开拓者。新中国成立后,他积极推动国家海洋研究机构的建立,加速了海洋科学研究的深入及多学科的协同发展;他力倡开展广泛和细致的海洋综合调查,使新中国获得了系统的海洋地质、海洋资源、海洋气象等资料,更好地推进了海洋的开发与利用;他力主不同系统的海洋研究单位要分工协作,并坚持海洋基础理论研究不能偏废,促进了海洋基础理论研究的深入,为其他涉海事务工作做出了理论上的支撑和贡献;他向中央积极献策维护国家海洋国土权益的行动,显示了一个学者在维护国家领土主权、海