可变隶属度2C-FSVM的研究及其辅助认定贫困生的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:beyondryo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贫困生认定是目前高校学生工作的重要内容,是公平、公正、合理分配资助资源的重要前提。目前的大数据和机器学习技术则为贫困生精准认定提供了有效的解决途径。本文针对由于贫困生占比少而导致的数据不平衡、存在各种导致虚假认定的干扰因素等不确定性现象,提出了一种可变隶属度2C-FSVM(Dual-C-parameter Fuzzy Support Vector Machine)模型,并将其应用到贫困生辅助认定中。可变隶属度2C-FSVM模型不仅能够更好地解决实际贫困生数据集的不确定性、类不平衡性敏感的问题,而且还可以基于样本距离类中心的远近而采用不同的模糊隶属度计算方式,更细致地刻画数据样本点的不确定性。基于该模型,本文实现了一个有效的贫困生认定方法,不仅能更准确地实现贫困生的辅助认定,还能帮助发现“隐形贫困”和“虚假认定”的学生,从而提升高校的贫困生认定的效率和准确度,促进精准资助。首先,本文调研了贫困生认定问题的研究现状和支持向量机的研究现状,并重点分析了支持向量机中类不平衡问题和不确定性问题的研究发展现状。接着,对本文用到的技术进行了介绍,主要包括:支持向量机分类技术、基于随机森林的特征选择技术、类不平衡数据集的分类评价方法及K折交叉验证方法等。其次,针对贫困生辅助认定存在的类不平衡、不确定性问题,提出了一个改进的可变隶属度2C-FSVM模型,并推导出其拉格朗日对偶问题。在该模型中,每个数据样本点不仅被赋予所属类的惩罚代价,还根据其与类中心的距离而决定是否结合紧密度来计算模糊隶属度。进而将该模型在多个公开不平衡数据集上进行了对比实验。实验结果表明该模型相比于其它传统支持向量机,对含有不确定性的数据集中的少数类的识别更为精准,对数据集类不平衡性、不确定性的敏感性更低。最后,将提出的可变隶属度2C-FSVM模型应用于某高校贫困生的辅助认定。首先给出了一个整体应用流程,然后利用一卡通流水数据,训练可变隶属度2C-FSVM模型,从而得到贫困生辅助认定模型,利用其获得疑似“隐形贫困”和疑似“虚假认定”学生名单,实现高效贫困生辅助认定。
其他文献
本文针对冻融环境条件下,测定土壤中的盐分、水分含量,设计构建出冻融装置及测试设备;系统研究时域反射仪(TDR)测定土壤含盐量时,温度、土壤密度、含水量对土壤电导率的影响,确定不同温度下土壤电导率与盐含量的关系曲线,获得TDR传感器分别测定NaCl、Na_2SO_3、Na_2CO_3、KCl、Ca(HCO_3)_2和MgSO_4六种盐分合适的测试温度范围、含水量范围、盐分含量范围、盐分标定公式及其相
新疆西天山是我国铁矿分布相对集中的区域之一。塔城大队在西天山铁热克特乌增铁矿区发现的铁热克特乌增铁矿,矿产储量估算196万吨,虽然该铁矿规模较小,但是品位高,埋藏浅,矿化特征较独特。但因自然条件险恶,地理交通情况较差,该地区的铁矿地质研究程度低,其铁矿研究大多集中在矿产储量计算,而其铁矿成因、成矿环境、成矿条件、成矿模式等问题尚未定论。因此加大该铁矿床的基础地质和地球化学方面研究力度,可进一步认识
为了缓解甚至根治正交异性钢桥面板疲劳开裂与铺装层易损这两类典型病害,本文基于自主研制出的一种具有良好力学性能的耐高温环氧树脂胶粘剂,提出了一种新的组合结构形式,即钢-UHPC胶接组合桥面板。(1)为探究钢-UHPC胶接组合桥面板的抗弯性能,设计了 20块钢-UHPC胶接组合板进行了静力弯曲试验研究。结果表明,在负弯矩加载下,钢-UHPC胶接组合板的弹性阶段不仅由UHPC自身的性能决定,还与组合板的
我国的地形条件复杂,公路工程的建设管理难易程度不一。伴随着我国公路路网的日趋完善,公路总里程数也随之大量增加。大部分公路工程在建设运营期都伴随着边坡稳定等级难易确定等问题,如不能及时有效的采取边坡加固等防范措施,则导致边坡发生失稳破坏等现象。因此,公路边坡稳定性已成为交通行业学者们重点探索和研究的问题。本文通过文献调查法和问卷调查法以及实地考察,在分析、归纳和边坡失稳案例进行分析总结基础上,选取了
我国的地域面积广大,各地域的地形特征、人文环境、资源种类不同,区域发展模式、经济状况也各不同。本文旨在通过研究竞技健美操赛事参赛单位区域分布的研究,找出其优势区和
传递对准精度评估技术是评价传递对准算法精度,衡量其实际应用价值的有效手段。传递对准作为机载武器惯性系统在空中动基座条件下初始对准的主要方法,挠曲变形等诸多干扰因素
人们生活中存在较多的信息产品盗版,盗版产品的存在会危害正版产品的销售,对于消费者而言,由于盗版产品价格较低,并且能够带来和正版产品相同的价值,导致部分消费者选择使用盗版产品;对于市场方面,随着互联网的发展,百度网盘、天翼云以及微云等网盘为盗版产品的传播提供了条件。但是,信息产品存在网络外部性的特征,盗版产品的存在会提高该信息产品的网络外部性强度。因此,对于正版厂商而言,如何既能够有效利用盗版产品增
在能源危机与环境污染的影响下,全球对汽车排放的限制要求越来越高。混合动力汽车(Hybrid Electric Vehicle,HEV)结合了传统汽车续驶里程长和电动汽车高效、环保的优点,其研究和开发已成为汽车行业的一大热点。为解决HEV安全、节能问题,目前大多数控制策略集中于汽车各动力部件工作性能对整车的影响,并没有考虑周围车辆的行驶状态,因此由车辆内部各部件协调工作向车辆与周边环境协作控制发展具
目的体外细胞实验研究TGF-β1诱导人胚肺成纤维分泌纤维化因子和LncRNA-ATB的改变,分析LncRNA-ATB与这些纤维化因子表达的相关性;建立矽肺体外细胞模型,分析LncRNA-ATB在矽肺
改革开放以来,我国大力发展网络信息技术,伴随着经济的快速发展,消费者的个性化需求逐步凸显,工业设计标准化也向个性化方向发展,所以,我国中小型企业快速发展。现阶段,我国中小型企业为国家提供了大量的就业岗位,并为国家GDP创造了巨大的价值。但是中小企业在发展的这一过程中,面临着融资困难的问题,之所以会出现这种问题,最根本原因就是融资对象或者方式方法出现问题。互联网金融就是传统意义上的金融公司和互联网公