支持向量数据描述及其在财务报表舞弊识别中的应用研究

来源 :江苏大学 | 被引量 : 5次 | 上传用户:jzsoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量数据描述作为一种基于统计学习理论的单分类方法,在解决有限样本、非线性以及高维数据的模式识别问题中表现出许多特有的优势,已成为机器学习领域的又一研究热点。在构造支持向量数据描述时只需要一个类别的样本信息,将其应用于财务报表舞弊识别的研究中,能够较好地解决舞弊数据不易获得的问题,对降低投资风险、增强会计信息透明度以及促进市场的健康发展都具有重要作用。因此,深入研究支持向量数据描述将具有较高的学术价值和十分重要的现实意义。论文总结了支持向量数据描述的国内外研究现状,分析了已有方法的优缺点。针对模糊支持向量数据描述中隶属度计算所存在的问题,提出了一种在核空间中计算样本隶属度的方法,进而实现了一种分层模糊支持向量数据描述算法。针对基于支持向量数据描述多类分类算法对重叠区域所采用的判别策略的不足,提出一种基于核空间相对密度的支持向量数据描述多类分类算法。针对现有边界优化算法未能充分利用样本在核空间中的分布信息,提出了一种新的边界优化算法。针对现有增量支持向量数据描述算法存在的问题,提出了一种增量支持向量数据描述的改进算法。在对支持向量数据描述研究成果的基础上,设计并实现了一种财务报表舞弊识别模型。论文的主要工作包括以下几个方面:1、总结了支持向量数据描述的研究现状,介绍了机器学习的基本问题和统计学习理论基础,并对支持向量数据描述进行了详细的讨论。2、提出了一种分层模糊支持向量数据描述算法KHFSVDD。该算法首先利用核K-Means将原始问题划分为K个子问题;然后,应用模糊支持向量数据描述算法生成子问题的局部描述;最后,通过合并子问题的解来构建原始问题的全局描述。3、提出了一种核空间相对密度的思想,并将其应用于基于支持向量数据描述的多类分类算法中,以核空间相对密度为决策依据,判断超球重叠区域中待测样本的类别。4、提出了一种边界优化算法,该算法根据超球边界附近样本的平均密度信息,以及待测样本与球心的距离,对边界附近的待测样本的类别进行判断。5、提出了一种增量支持向量数据描述的改进算法,该算法在分析支持向量集构成情况的基础上,以动态的方式选择出可能转变为支持向量的数据进行训练,在约减训练样本的同时保留了更多的数据分布信息。6、构建了一种基于支持向量数据描述的财务报表舞弊识别模型,该模型包括初始描述、增量描述以及报表检测等模块。
其他文献
随着移动对象运动轨迹的采集越来越方便,催生了大量基于位置的服务(Location Based Service,LBS)。这些服务对于市民生活、道路规划和城市发展等具有相当重要的理论意义与实
随着语义网的发展,本体应用的范围越来越广泛。本体作为语义网的重要基础,用于描述计算机处理数据的语义信息,使语义网中不同系统间能够实现某种程度的知识共享和重用,以提高
蚁群算法是通过对自然界中真实蚂蚁的集体行为的观察、模拟而得到一种仿生优化算法,它具有很好的并行性、分布性。根据蚂蚁群体不同的集体行为特征,蚁群算法可分为受蚂蚁觅食
随着时代的进步和发展,人们对社会安全问题越来越重视。视频监控在其中发挥了重要的作用。随着计算机技术和硬件技术的不断发展更新,为视频监控技术的智能化发展提供了充分的
随着Web技术的发展,网络上现存的主观意见表述文本陡增。主观WEB文本不仅能给其他用户提供客观的参考价值,并且产品生产方也可以及时根据用户的意见言论来调正自己的产品设计
硬盘是迄今为止应用最为广泛的数据存储设备,其具有高速读写、大容量数据存储等特点,能够满足各种数据存储需求。但是,由于近年来电子技术的快速发展,硬盘逐渐不能适应一些新
图像融合是按照一定的规则,将两个或两个以上的传感器在相同或不同时间内获得的同一场景或同一目标的成像进行处理,最终获得更适合进一步图像处理的要求。多聚焦图像融合就是
数字图像处理和计算机视觉是近年来发展十分迅速的研究方向,目前正广泛地应用于军用和民用等各个领域,是智能机器获取外部信息和理解世界的重要途径。运动检测与目标跟踪是计
云计算是当前信息领域的热点,它的出现宣告了低成本提供超级计算时代的到来。在云计算时代,用户可在全球范围内动态租用计算资源。云计算整合了互联网“云海”中的“云岛”资
随着大容量、高速度计算机的出现,使计算机的应用范围迅速扩大,软件开发急剧增长,软件系统的规模越来越大,复杂程度越来越高,软件可靠性问题也越来越突出。原来的个人设计、