基于密度聚类和邻域的主动学习方法

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:dgsbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主动学习是机器学习的子领域,可以有选择地对样本进行学习,主要解决无法有效使用大量无标签数据的问题.结合密度聚类算法和邻域模型,提出了一种主动学习方法,这是一个交替地执行聚类算法和选择样本进行标注的过程.首先,利用密度峰值聚类算法(DCFSFDP)对数据集进行类簇划分;其次,根据样本邻域信息制定的选择策略选择部分样本进行标记后加入有标签样本集合,并利用已标记的样本在下一次聚类过程中修正聚类结果,使类簇划分更加准确;最后,当有标记样本的数目达到指定的上限后停止聚类过程.实验结果表明,提出的方法能在只有少量有标签样本的情况下主动对大量样本进行标记,证明该算法能有效地应用于处理大量无标签数据.
其他文献
基于动态数学技术的初中数学变式教学,能让数学符号与图形的变化过程可视化,能让概念的生成过程直观化,能让解题思路多维化,能有效改变传统教学模式以静态环境想象动态过程的
小学生的数学学习既有感性的因素,又有理性的成分.教师要做好说思融合地引领工作,让学生在说一说异同中,帮助学生更科学地理解算理,领悟算理;还得引导学生在说结论、说规律等
文章报道了2017年9月采自蟒河国家级自然保护区硅藻门的中国新记录3种,包括1种2变种:分别为宽腹异极藻Gomphonema tumens Kociolek&Stoerme、胀大桥弯藻孟加拉变种Cymbella t
单元复习课的上法有多种,如结构图式的知识点梳理、以思想方法为主线的设计.文章基于数学核心素养的理念设计了一节“一元一次方程”的复习课,并浅析此节课中如何通过三个问
激发兴趣是课堂教学设计的基本目标追求,教师要在操作方式和方法上做出一些创新探索,以成功调动学生学习主动性.整合回顾、解析问题、动手操作、兴趣训练,都能够有效地激发学
初中生的运算能力对数学学习至关重要,但不少学生存在运算速率低、错误率高等现象.笔者通过多年教学实践,认为该现象实质是“运算障碍”,提出“明晰算理,激发兴趣,深度反思,
以“抛物线的标准方程”一课为例,展示了围绕矛盾冲突开展自主探究教学设计的教学过程.教学实践说明,从理解教材与学生出发制造矛盾冲突,可以引发自主探究,强化理性认知,将探
近年来在山西霍州霍山周边进行植物考察时,采集到豆科(Fabaceae)野决明属Thermopsis Benth.ex S.Moore野生植物霍州油菜Thermopsis chinensis Benth.ex S.Moore,为山西豆科野
让学生学会主动探究、主动思考,不仅是新课标的要求,更是新时代发展的要求.教学中,教师应探究培养学生提出问题能力的策略,为创新埋下一粒种子;通过有目的的问题组和探究情境
高中阶段的数学核心素养也是当前小学、初中阶段数学教学的方向标.数学核心素养对理解和深化数学学科本质、设计具体教学活动,以及开展多元评价都有着特殊的意义.在数学活动