基于样本选择的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:cai2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文根据机器学习的相关知识,以及两年的对分类器方面的研究发现,数据的可靠性和数据的昂贵性导致我们总是获取不到理想中的真实有效的数据,数据总是充满了噪音或是数据有时候得不到标记,我们总是想通过对数据的最大化利用来减少人工的干预,这就催生了半监督学习和迁移学习。半监督学习方法总能适应只有少量标签的数据,但是通常的半监督集成学习方法有两个局限性:1)它们在高维数据集上不能获取令人满意的结果和2)它们并没有考虑如何优化和扩展训练集。在本文中我们提出了渐进式半监督集成学习算法来改善上述的两个缺陷并解决了只有少量数据有标签的问题,我们和传统的一些算法进行了对比得出该算法有两个特点:1)它采用了随机子空间技术和2)一个渐进训练集生成过程以及一个自进化样本选择过程来增大训练集,我们也采用了一些非参数测试来比较在不同数据集上的不同半监督集成学习方法的准确度,实验结果基于加利福尼亚大学的18个真实数据集。本文还介绍了关于迁移学习方法中的样本选择的过程,阐述了迁移学习是如何通过样本选择方法来利用源域以提高对目标域的预测准确率,并做对比实验来证实该方法具有一定的有效性,最后阐述了样本选择的具体过程以及对优化过程的促进作用,并分析实验结果得出样本选择的适用范围。
其他文献
实验仪器和设备,往往是科学研究与理论考证进行应用实践的重要物理基础。关系着科研水平的提高,甚至会成为决定科研成败的关键。为加强实验设备管理及提高实验设备的工作效率
随着移动互联网的快速普及和高校信息化建设的深入开展,基于移动互联网的在线教学模式和平台逐渐被各类教育机构所接受,并不断研发和使用基于移动互联网的在线教学平台。与传
随着人工智能以及计算机视觉领域的不断发展,计算机视觉领域中的识别、追踪、检测等研究技术也被广泛地应用,譬如自动驾驶等智能交通、维护社会安稳的智能监控和智能家居等应
随着“大众创业、万众创新”的推进及原创设计师品牌的蓬勃发展,原创设计师品牌的创新创业激情受到了极大的点燃,而“众创空间”的出现也开启了原创设计师品牌创新创业便利大
本文采用微波消解法和双浊点萃取法对西藏和云南两种产地的玛卡进行预处理,安排了正交试验以确定待测样品的最佳微波消解条件,详细考察了双浊点萃取的条件,并对螯合剂种类用量,萃取剂种类用量,溶液p H值等重要影响因素进行优化,通过萃取前各元素的标准曲线的斜率和萃取后各元素的标准曲线斜率之比得出西藏玛卡中的铜、铁、锌、镉、铅、汞富集倍数分别为:20.07、14.03、23.05、6.87、7.09、4.22
“朱陆之辩”是理学史乃至中国哲学史上一大公案,学者对“朱陆之辩”的讨论已经持续了 800年,从对“朱陆之辩”的研究讨论中,可以分为“和会”与“分疏”两个方面。唐君毅是2
无线传感器网络主要应用于对环境的监测和目标的跟踪。而对于矿井巷道而言,由于无线传感器网络受到煤尘、瓦斯等影响容易造成节点性能的下降和定位精度的不准确。因此本文根
为了应对高清视频传输与存储带来的巨大压力,国际电信联盟(International Telecommunication Union,ITU)发布了高效视频编码(High Efficiency Video Coding,HEVC)标准。该标
新疆若羌县白山地区位于塔里木板块东北缘,处于北山古生代裂谷构造带核部。研究区内存在三条韧性变形带:一条主体存在白山断裂内,带内广泛发育着弱变质强变形的石炭系石板山
目前,在机器人控制领域,面向服务的控制系统可提高控制系统的重用性和可扩展性,将形式化建模和模型验证技术应用于面向服务的机器人控制系统,可以提高系统的开发效率,同时保