基于惩罚的半监督支持向量机

来源 :厦门大学 | 被引量 : 0次 | 上传用户:jie_169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会中,有标记样本的获取难度大及成本高等问题导致大量未标记样本的存在,对未标记样本的合理利用一直是人们关注的问题之一。传统的半监督学习方法大多数都是建立在随机缺失的假设下。然而,在现实生活中的很多样本数据并不能满足这一假设。在这种情况下,如果我们再利用传统的半监督学习方法来构建模型,很难利用模型做出正确的预测。为了弥补传统半监督学习方法的弊端,本文提出了一种新的基于支持向量机和Group Lasso惩罚项的半监督分类方法,记为GPSSVM。当样本数据不满足随机缺失的假设时,本文提出的方法依然具有良好的适用性。本文将提出的新的半监督学习方法用于信用卡风险违约预测中去,并将其与监督的带Group Lasso的支持向量机的结果进行比较。本文首先梳理和归纳了传统的半监督学习方法,分析了现有的每种半监督学习方法适用的场合,并针对传统半监督学习方法的不足,放松了半监督学习随机缺失的假设,在带Group lasso惩罚项的支持向量机的基础上对未标记样本的系数添加惩罚,提出了一种新的半监督分类方法—GPSSVM,该方法能同时利用未标记样本和有标记样本,并利用Group lasso惩罚项实现变量选择。本文详细介绍推导了该方法的理论基础和算法实现,并在多种情形下进行了模拟计算,从模型的预测能力和变量选择能力与监督的带Group lasso的支持向量机模型和传统的半监督支持向量机进行比较。结果表明,当存在少量的有标记样本和大量的未标记样本且样本数据不满足随机缺失的假设时,本文提出的GPSSVM方法的效果较好。在模拟分析后,本文将新提出的GPSSVM方法应用到信用卡风险违约预测中。结果表明,无论有标记样本和未标记样本的分布是否相同,本文提出的GP SSVM方法要显著的优于监督的Group lasso支持向量机模型。
其他文献
目的:通过观察复方鼻喷剂敷料在慢性鼻-鼻窦炎鼻内镜术后术腔恢复中的作用,探讨其对鼻黏膜转归的影响。方法:1、选取2020年10月至2021年09月期间在杭州市第一人民医院耳鼻咽喉-头颈外科住院、术前诊断为慢性鼻-鼻窦炎(chronic rhinosinusitis,CRS)且行规范保守治疗效果不佳需要手术的患者作为研究对象,用随机表法将患者随机分入试验组和对照组,每组均为22例;试验组术后的填塞材
学位
目的 观察新加白术芍药汤对肝郁脾虚证经行泄泻的治疗效果及安全性。方法 将纳入的70例患者按照随机数字表顺序随机分为两组,观察组(n=35)及对照组(n=35),对两组患者一般资料(包括年龄、病程以及腹泻程度分级)进行分析并确定基线,予以同等基础治疗方案。观察组患者在基础治疗上联合新加白术芍药汤口服;对照组患者在基础治疗上联合双歧杆菌三联活菌散(培菲康)口服。服药疗程:月经来潮前3日开始服用,连续服
学位
目的 本研究拟探讨同型半胱氨酸(Hcy)联合D-二聚体(D-D)检测在妊娠期高血压疾病(HDP)患者病情严重程度评估和预后预测中的临床价值,为医务人员指导HDP的临床治疗提供依据。方法 选择本院产科2018年5月~2021年5月期间治疗的287例HDP患者作为观察组,选择同期正常妊娠患者60例作为对照组,根据患者病情严重程度分为妊娠期高血压组(n=145例)、子痫前期(PE)组(n=90例)及重度
学位
在营销实践中,存在着各种促销工具,为了保证研究的代表性和有效性,国内外学者按照不同的标准对其进行归类,其中有学者将促销方式按照收益获得时间不同,分为立即性促销和延迟性促销,得到了较多认可。但近几年,关于立即性促销和延迟性促销的研究,几乎都是集中在促销时间、促销水平、消费者个人特征等因素对其有效性的影响上,较少有研究关注到促销信息呈现形式所产生的影响,及其潜在作用机制和边界条件。本文基于现有文献和研
学位
收入不平等问题一直以来都是我国经济社会发展过程中的关注重点,由于城乡二元经济体制的存在,我国的居民收入不平等主要表现为城乡收入差距的扩大。随着经济水平的发展和扶贫工作的持续推进,我国农村居民人均可支配收入呈现逐年升高的趋势,但是与城镇居民人均可支配收入的差距仍在不断扩大。因此,如何缩小社会各阶层之间的收入不平等程度,成为政策制定者和学者关注的议题。在此背景下,金融层面提出了“金融包容”这一概念,金
学位
目的 观察桂芍济川煎对于中风后恢复期脾肾阳虚证便秘的治疗效果及临床用药安全。方法 将纳入的80例患者按随机数字表顺序随机分为两组,观察组(n=40)和对照组(n=40)。治疗前对两组患者的基本资料进行分析,包括性别、年龄、病程,以及病变部位、卒中性质、便秘程度等,予以记录并分析基线。两组患者均给予同等基础治疗方案,观察组患者再予以桂芍济川煎口服,对照组患者予以乳果糖溶液(杜密克)口服。临床治疗4周
学位
报纸
知识付费发展至今,随着消费者对其的好奇心和热度逐渐减弱,知识付费市场信息不对称问题愈演愈烈,市场逐渐疲软。对此,知识付费平台参照实物商品的运营,也陆续推出了线上评价系统、声誉系统、免费试听、免费退货等消费者保障政策来减缓信息不对称问题。但是,相比实物商品,知识付费产品有着个性化、时效性、市场无限性、不易腐坏等特点,使得这些政策实施效果与期望存在差距。另外,知识产品的虚拟化特点使得其免费退货政策与实
学位
法律制度的改革对于发挥政府宏观调控,促进经济发展具有重要意义。2007年以《物权法》出台为标志的担保物权制度改革是我国法制建设的重要事件,其作为一项宏观经济政策,不仅能够起到调控经济全局的作用,同时也对微观企业的经营决策产生重大影响。尤其是将这一稀缺的自然实验用于企业投资行为的研究,能够深入分析其实施的政策效果。当前学者对于担保物权制度改革的经济后果研究主要集中在企业融资领域,既该政策的出台将应收
学位
在我国,加班是一个普遍并且严重的现象。根据2018年《中国劳动统计年鉴》的数据,我国50.3%的城镇就业人员平均每周工作超过40小时,31.2%的城镇就业人员平均每周工作超过48小时。过长的工作时间和繁重的加班工作给劳动者造成了福利损失,而对加班进行工资补偿的措施在一定程度上能够改善劳动者的处境。本文基于厦门大学在校学生的加班偏好,探究了能对劳动者效用进行充分补偿的加班工资倍率水平,并对我国现行法
学位