半监督自训练方法综述

来源 :重庆师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:ning0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]通过介绍半监督自训练的背景及自训练方法的理论、训练机制、特征属性、比较标准,并梳理自训练方法的应用场景和存在的主要问题,为 自训练方法的进一步研究提供参考.[方法]检索半监督自训练方法的相关文献,回顾近些年 自训练方法研究领域取得的进展并进行归纳总结.[结果]首先,介绍了半监督 自训练方法的背景及自训练方法的理论.然后,从相关研究中梳理了 自训练方法训练机制、特征属性、比较标准.在训练机制部分,归类总结了 自训练学习过程中训练集的扩充方法;在特征属性部分,分别从自训练方法的置信度度量方式和训练过程中的停止准则进行阐述;在比较标准部分,论述了衡量自训练方法有效性的评价指标.最后,整理归纳了 自训练方法的应用场景和主要存在的问题.[结论]半监督自训练方法的理论研究和应用探讨在未来一段时间仍然是机器学习研究的重点和热点之一,本研究对于理解半监督自训练方法的学习机理以及解决实际应用问题等都具有重要的理论价值和现实意义.
其他文献
针对当前等深线更新方法在等深点生成环节未能充分顾及航行安全的问题,结合可能最浅水深概念和抛物线插值法,提出一种顾及航行安全“扩浅缩深”原则的等深点生成算法,并据此算法实现等深线更新.首先根据海图水深点构建并优化Delaunay三角网;其次采用一种顾及“扩浅”原则的等深点插值算法确定等深点的位置;最后在等深线追踪完成后,采用顾及航行安全的光滑算法绘制出形状平滑的等深线,实现等深线自动更新.实验结果表明,该方法更新的等深线能够正确表达海底地形,符合海图等深线绘制的航行安全原则,满足海图等深线要素的更新要求.
滴滴出行数据中包含了丰富的用户位置信息、出行时空属性、用户行为规律与特征,通过对这些信息的深入分析与挖掘,并结合可视化技术,以图形图像的方式展示,有助于分析用户出行的规律.为了直观展示海口市交通流量动态变化,分析车辆出行的时空规律和交通出行路况,设计一个可视化分析系统.以日历图、径向柱状图等可视化方法为依据,结合可视化工具,从出行数据的不同维度着手分析海口市交通流量情况.该系统能够客观地反映海口市交通变化情况,可以为交通管理规划提供合理的依据.
[目的]考虑了网络通讯受宽带限制,提出 了 一种自适应通讯量化的分布式次梯度方法来求解分布式凸优化问题.[方法]首先设计了 自适应量化方法,其次提出了有向网络下的分布式优化次梯度算法.[结果]得到了当 目标函数为凸函数和强凸函数时该算法的收敛率.[结论]数值例子表明所提算法能有效降低通讯成本,并能适用于更一般的非平衡有向通讯网络.
足印影像激光光斑质心提取是精确获取激光指向位置的基础,对于提升高分七号卫星激光测高数据精度具有重要意义.设计一种基于最小二乘椭圆拟合的激光光斑提取方法,并根据反馈结果利用累计矩阵对序列影像进行粗差剔除,实现了高分七号足印影像激光光斑提取.通过仿真数据和高分七号真实足印影像进行实验,验证了该方法具有较好准确性和稳定性.未来我国在星载激光测高领域将拥有更广阔的前景,所研究的相关成果可以为后续国产激光测高技术研究提供参考.
针对现有3D特征点提取方法易造成边界点遗漏和尖锐点错判的问题,提出一种基于多因素参数的3D特征点检测方法.首先在3D特征点提取过程中,利用相邻投影法向夹角的大小提取边界点,以保证边界的完整性;其次针对点云尖锐点的提取,通过将k邻域中曲率权值、法向量夹角均值和距离均值用于定义特征点识别参数;然后根据曲率最大值和相邻点间的距离均值定义3D特征点识别阈值,并将识别参数与阈值进行比较而判定特征点;最后将所提出的方法分别与现有的基于曲率和法向量的3种方法进行实证分析比较,实验结果表明,基于多因素参与的3D特征点检测
受网络带宽、计算机软硬件和浏览器承载量等因素的制约,现有3D WebGIS在矢量栅格数据一体化表达时容易出现渲染效率不高、表达效果不佳等问题.通过分析2种不同架构下3D WebGIS的技术特点和服务需求,研究了基于屏幕空间像素投影反算方法,设计了优化矢量数据渲染性能的技术方案,提出了一种创建帧缓冲区渲染队列的方法来解决片元着色器承载空间不足的问题,并在B/S架构下开发了基于屏幕空间像素投影反算方法渲染矢量数据的原型系统.实验表明,该方法渲染效率和表达效果俱佳,具有很强的应用前景和研究价值,可为3D Web
[目的]研究绿头鸭(Anas platyrhynchos)的全基因组微卫星分布特征及规律.[方法]利用生物信息学方法对已报道的绿头鸭全基因组查询搜索并进行特征分析.[结果]在绿头鸭1 070 Mbp的基因组中,1~6个碱基重复的微卫星数量有476 957个,总长度为9 101 935 bp,相对丰度为445.77个·Mb-1,占全基因长度的0.83%.不同重复类型的微卫星中单碱基的数量最多,有326 468个,长度为5 444 144 bp,占基因组微卫星总数的68.45%;然后依次是四碱基、二碱基、三碱
[目的]星型网络上单台车辆分群调度问题是运筹学和计算机科学中一个重要的组合优化问题.[方法]对客户服务时间为零的情形,证明存在一个具有良好性质的最优解;对客户服务时间任意的情形,设计两个候选时间表然后选择表长较短者作为最终的近似解.[结果]对第1种情形,给出一个多项式时间最优算法;对第2种情形,给出一个近似比为5/3的近似算法.[结论]研究结果可为交通运输、生产制造、生物科学等相关行业提供有效决策支持.
社会经济的发展伴随而来的环境污染问题日渐得到人们的重视.针对中南地区4省1区(河南省、湖北省、湖南省、广东省和广西壮族自治区)春节期间PM2.5的变化情况,结合该区域所属及其相邻探空站获取的大气可降水量PWV数据以及气象监测站获取的风速数据,通过反距离加权插值得到中南4省1区春节期间的PWV和风速值,综合考虑CO、SO2、O3和NO2等大气污染物以及PWV、风速和DEM高程值建立该地区春节期间的地理加权回归(GWR)、地理加权回归克里金(GWRK)以及地理加权回归规则样条(GWRCRS)插值模型,并运用3
[目的]基于滑坡点属性与研究区全域点属性作为分类基础数据,对位于三峡库区的万州区滑坡易发性区划对比研究.[方法]选取高程、多年平均降雨量、地表切割深度、坡向、距道路距离、坡度、POI核密度、倾坡类型、岩性、归一化植被指数、曲率、地形起伏度、地形湿度指数等13个因子作为影响因子,分别对滑坡点属性与研究区全域点属性使用 自然断点法进行因子分类,并通过两种分类结果构建模型预测研究区内滑坡易发程度的空间分布情况.[结果]以研究区全域点属性作为分类数据对应的曲线下面积(Area under curve,AUC)值为