特征扩维判别分析(FADA)

来源 :厦门大学 | 被引量 : 0次 | 上传用户:a369747001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性判别分析是最经典的统计学习方法之一。LDA具有诸多魅力,如:在样本容量较小时,相较逻辑回归,LDA具有更好的渐近效率和更稳定的估计;当数据服从多元正态分布时,LDA又被证明是贝叶斯最优分类器,并且中心极限定理的存在使得这个性质尤其具有吸引力。但当面临非线性可分场合、多原型混合、小样本高维特征这三种场景时,LDA不再适用。本文主要针对非线性可分场景的判别分析拟合进行研究,我们提出了特征扩维判别分析方法(FADA)。朴素贝叶斯分类器在高维场景下的不俗表现,证明了自变量的条件边际密度能够有效地帮助解决判别问题,因此我们利用这类单变量转换构造新特征。对于一组数据,我们将其均分为两部分,一部分用以估计每个类别下、每一维自变量的条件边际密度函数(?),再将另一部分数据原有的输入变量代入计算,得到对数边际密度函数(log-marginal-density)形式的特征(?),从而拓展获得高维特征空间,利用稳健的高维判别分析方法SDA求解判别向量的稀疏解。我们的方法是FANS算法与SDA算法的一种结合,并且将前者中的两分类问题推广到了多分类。数值模拟和实证数据应用证实了 FADA能够有效解决多分类的非线性可分问题;针对各种分布类型的数据,FADA都能给出灵活的决策边界,且其求解的稀疏判别方向为模型提供了一种自然的可视化方案。
其他文献
传统吉祥文化是中国传统文化长河中的重要分支,反映了人们对于吉庆祥瑞观念的心理诉求,吉祥纹样就是一个现存例子。本文通过对苏州私家园林花窗研究,认为传统吉祥纹样具有正
在嵌入全球价值链的背景下,汇率变动和国际贸易在一国经济增长过程中发挥着举足轻重的作用。目前,我国把经济高质量增长和新旧动能转换作为大国向强国迈进的突破口,其核心在于提高企业生产率对于经济发展的贡献。因此,本文将基于国际背景和国内实际,对汇率变动、进口贸易和全要素生产率展开研究。本文的研究不仅关乎国民经济协调发展,更涉及本国保持世界分工地位的重大现实问题。首先,文章梳理了相关理论和参考文献,并得到本
本文主要研究经济政策不确定性、高管海外经历以及两者的交互项对企业投资效率的影响。并将企业的投资效率分为投资不足和投资过度,研究经济政策不确定性、高管海外经历以及两者的交互项是通过怎样的机制影响企业投资效率的。并进一步根据企业的产权性质,将企业分为两类:国有企业和非国有企业,分别研究经济政策不确定性、高管海外经历以及两者的交互项对不同产权性质企业的投资效率的影响。本文以2010年至2017年沪深A股
本文希望厘清Amihud(2002)非流动性指标被定价的原因是“非流动性补偿”还是“错误定价”。本文将高Amihud组合和低Amihud组合的预期收益率之差定义为“Amihud溢价”,然后探讨了它的形成机制。首先,本文分析了2007-2018年的月度数据,证实A股市场存在稳健的“Amihud溢价”,它同时具有经济和统计意义上的显著性,而且在不同行业、市场环境和月份下都存在。进一步的分析表明“Ami
锗酸盐激光玻璃具有稀土离子溶解度高、声子能量较低、物化和机械性能优异、抗激光损伤阈值高和红外透过范围较宽等特点,有望应用于通信、光纤激光器及传感等领域,近年来备受
绿色气球菌(Aerococcus viridans)为革兰氏阳性球菌,是一种重要的人畜共患病原菌,在环境中普遍存在,可以引起人和动物的多种感染甚至死亡。在兽医临床上,绿色气球菌可引起猪的脑膜炎、肺炎、尿路感染和关节炎等,此外,该菌还可引起牛临床和亚临床乳腺炎。但由于该菌与肠球菌和链球菌的形态及生化特征很相似,所以前期绿色气球菌多被误判为这两种细菌。近年来,由于鉴定方法的完善,越来越多的绿色气球菌被
分布式拒绝服务(Distributed Denial of Service,DDoS)攻击是攻击者通过控制大量僵尸主机,对一个或多个目标同时发动攻击,消耗攻击目标的服务器资源和网络带宽资源,使目标主
扭超势与连通分次Frobenius代数存在确定的一一对应关系,可以通过一个扭超势建构一个连通分次Frobenius代数.本文推广了这一结论,讨论了由箭图诱导的分次Frobenius代数,说明
随着重金属污染土壤面积不断扩大,导致我国农作物种植受到不同程度影响。农作物从土壤中吸收的重金属积累在体内,并通过食物链传递,进入人体内,对人类健康构成了严重的威胁。
在庆祝中国共产党成立95周年大会的讲话上,习近平对文化自信特别加以阐释,指出“文化自信,是更基础、更广泛、更深厚的自信”。文化自信成为继道路自信、理论自信和制度自信