基于在线数据的迁移学习分类方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:gamearner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际应用领域产生了大量的在线数据,如异常检测和信用卡欺诈检测等。这些在线数据多缺乏标记信息,且在线数据中隐含的信息随时间发生变化,这都给在线数据分析任务带来极大的挑战。近年来,利用有标记的源领域信息实现在线迁移学习的方法得到了广泛的关注。现有的在线迁移学习方法多根据分类准确度来更新模型,在实际应用中难以达到理想的效果。为此,本文面向不同特点的应用领域开展在线迁移学习方法研究,主要研究内容如下:1)介绍了在线迁移学习的定义,并对当前主流的在线迁移学习方法进行了分析和介绍。2)在信用卡欺诈等在线应用领域中,分类代价比准确率更为重要,且在线数据的代价通常会随着时间发生变化。针对这一问题,本文综合考虑分类代价和准确度提出一种基于自适应代价的在线迁移学习分类方法(OLAC)。该方法引入标记分布参数用于代价的自适应计算,并通过组合参数将源域和目标域结合,从而实现源域模型到目标域的在线迁移;最后,根据代价和准确度来动态更新学习分类模型。实验结果表明该方法可以取得比基线算法更好的分类准确度和最小的代价。3)针对多数线性分类模型无法解决在线数据中的线性不可分问题,而解决在线线性不可分问题的核方法在在线环境下又存在支持向量无边界增长的问题,本文提出了一种基于核的在线迁移分类方法(KOTL)。该方法首先将目标函数直接映射到再生希尔伯特空间从而忽略原来目标域数据在低维空间是否线性可分问题;然后引入一种缓冲策略解决核函数支持向量的无边界增长问题;最后,通过同时优化结构损失函数、域间分布差异以及流行正则化函数来实现分类模型的更新。在多个图像数据集上的实验表明,KOTL算法的性能显著优于基准算法。
其他文献
现行预算法难以适应现实发展的需要,缺陷和问题日益突出。修订预算法对规范我国分配秩序和推进财政各项改革具有重要意义。鉴于多种条件的制约,此次预算法修改从范围、程度和
变压吸附是主要的气体分离技术之一。本文阐述了气体吸附分离的基本原理,对吸附平衡、吸附剂、变压吸附过程与模拟做了较为详细的综述。利用该技术能够回收乙烯装置尾气中的
由于新自由主义在全球取得了主控地位,贱民阶层这一概念如今已日渐不再适用,而需要布尔迪厄所创的“无保工”这一术语加以取代。继而,本文进一步论述,贱民阶层这一范畴之源是
随着中国科学技术的飞跃性发展,我国逐渐进入了新的时代,新的时代也对我们提出了新的要求。各行各业都在积极进行改革,教育事业亦是如此,传统的教育模式已经满足不了新的时代
城陵矶穿越长江隧道全长2756.379m,根据地层不均匀的地质条件,为节省投资并确保水下施工的安全,在长江南岸以及长江主河道以下地质条件复杂、断层破碎带密集的地段采用盾构法施工
西岭雪山位于四川省成都市大邑县西岭镇境内,因唐代诗人杜甫“窗含西岭千秋雪,门泊东吴万里船”的诗句而得名。主峰庙基岭海拔5 353米,是成都第一高峰,山顶终年积雪,秀美壮观
期刊
建设什么样的城市,怎样建设城市是当前我国城市化进程中亟待解决的问题。宜居城市是由自然物质环境和社会人文环境相互交织、融合形成的一个复杂巨系统。倡导以人为本的科学
公务员招考已经成为社会关注的热点问题,因此对于公务员招考制度的也有着大量的研究,但较少有人通过胜任特征模型的视角对公务员招考进行分析和研究。本文通过比较研究法、实
以1963-2012年的14期多源遥感影像为数据源,提取了黑河下游额济纳地区典型样本年的绿洲空间分布情况,并将其分解为"增"和"减"两种过程分别进行了分析;利用格网化手段和GIS叠
急性重症胰腺炎是临床上常见的危重病之一,具有起病急,发展快,病死率高的特点。连续性血液滤过治疗急性重症胰腺炎已成为临床上很重要的手段。本文对21例经连续性血液滤过治