基于L1-范数的多核Fisher判别分析方法及其应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhangyiyuxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计模式识别在判别分析领域扮演着重要的角色,也是模式识别的课题之一,作为统计模式识别基础的多元统计分析和鉴别分析在计算机出现之前就已经存在,而作为对样本数据具有降维功能的Fisher判别分析法发展迅速,其理论研究和应用取得了很大进展,如医疗诊断、人脸识别、信用风险评价等领域。随着大数据时代的到来,数据分析更多面对的是高维度、结构非常复杂的数据,传统的Fisher判别分析已难以实现准确的识别。传统的Fisher判别分析法利用Frobenius范数确定判别准则,异常数据对其比较敏感,这就引出了基于L1范数建立Fisher判别准则;又为了解决非线性可分问题以及充分反映样本的多种特征,将多个核函数引入以构造新的判别模型。论文将多核函数和L1范数同时用于Fisher判别建立基于L1范数的多核Fisher判别模型,以研究如何提高判别模型的准确识别率问题。  本研究主要内容包括:①选取将具有旋转不变性的L1范数应用于Fisher判别分析中,以减弱异常数据的敏感性。为了处理线性不可分的情况,并且充分利用样本的多种特征属性,引入了合成核函数,该核函数融合了线性核函数的全局性和高斯核函数的局部特性。②从理论上对L1范数下的多核Fisher判别函数以及相对应的判别准则进行了详细的推导;对模型中的参数和组合系数,提出了“经验选择法”与“实验试凑法”相结合的计算方法;在建立判别函数和判别准则时使用拉格朗日乘子法求解类间散度距离与类内散度距离差的极大值,避免了“小样本问题”下的类内散度矩阵不可逆问题。③选取UCI数据库中IRIS、SEEDS、Ionosphere三类不同类型的数据集对论文研究方法的有效性进行了验证,选用上证100指数成分股和“ST”股的上市公司作为样本,应用论文提出的方法并对上市公司财务状况好坏进行了实证判别。⑤通过与传统的Fisher判别中的误判概率比较,模型使判别能力(或准确识别率)在一定程度上有所提高。与传统的Fisher判别法相比,在样本维数较低时模型的判别能力较弱,在对维数相对较多或维数比较接近样本数目时,模型准确识别率比传统Fisher略有改善,并且多核函数下的判别能力优于单个核函数。如果要大幅改善论文判别方法的识别率,提高计算速度,需要在确定参数的算法上有所改进。
其他文献
万庾镇南望华容县城,北邻湖北省石首市高基庙镇,全镇共有29个农业村场,1个居委会,总面积98.5平方公里,人口42197人.近年来,万庾镇以创建省级安全生产示范乡镇为契机,在市、县
如今,Internet发展迅猛,已成为人们生活中不可或缺的一部分。无论是出门吃饭还是在家看影视节目都可以根据网站的推荐进行选择。然而,随着接入互联网的网页数量不断增长,传统
毋庸置疑,资产证券化在所有的金融创新中是一个重要话题,也是一个较为前沿的概念,目前很多人已对资产证券化这个词耳熟能详。资产证券化起源于西方,其在西方国家的发展程度自然无
贝多芬原名路德维希· 凡· 贝多芬,德国杰出的音乐家.《悲怆》 奏鸣曲是贝多芬早期的一首具有代表性的钢琴奏鸣曲.此首奏鸣曲是第一首由贝多芬本人亲自写上题目的作品.《悲
商业银行是世界各国金融体系的主体.作为以赢利为主要目标的综合性银行和货币创造者,商业银行在金融体系中具有举足轻重的作用,其特殊地位毋庸置疑.商业银行业的生存质量及改
上班前 心境平 生产急 安全重rn莫饮酒 勿熬夜 精力足 情绪稳rn安全帽 要戴好 防砸鞋 要系绳rn烧电焊 戴面罩 打磨时 戴眼睛rn“5S” 常推进 好习惯 要养成……
产业集聚是产业发展过程中的一种空间地缘现象,是产业在特定地域范围内的相互集中。新经济地理学使产业集聚成为国内外学者研究的重点问题之一,众多研究表明:产业集聚是一个区域
在中国,文化产业是一个全新的概念,对于其内涵与外延至今尚无定论.在本文中,笔者针对中国长期实行文化事业体制而几乎将所有文化门类均作为公共物品供给的事实,得出外部性问
行政组织文化是行政组织运行和和发展的基础,同时,也是组织成员思想和价值观的直观反映,它影响着行政组织的发展方向.行政组织文化是某一行政组织在发展过程中逐渐形成的可以
随着我国经济的迅速发展和市场资本化程度的加深,资本市场在经济生活中发挥日益重要的作用。财务报表作为外部投资者获取企业内部经营管理信息的主要来源之一,影响着投资者的理