基于多示例的字典学习算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:qzspk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多示例学习作为一种新的机器学习方法近年来受到越来越多研究者的关注。在多示例学习问题中,训练集是由多个正包和负包构成的,每个包又是由若干个示例构成的,且每个正包中至少有一个正标签示例,负包中的示例则全部都是由负标签示例构成的。多示例学习的提出是用于解决包的分类问题的,通过分析训练样本集(包)来去区分预测未知包的标签。本文主要提出了一种基于多示例的字典学习算法(SMIDL),SMIDL将字典学习、转换表示结合在基于相似度的多示例学习中以得到统一的学习模型。由于多示例学习的特性,训练集的每个正包中至少有一个正标签示例,且每个包中的单个示例标签通常是难以确定的,对于正包中难以确定标签的示例,我们首先从训练集的每个正包中选择一个最可能为正标签的候选示例,对于正包中其余未被选定的模糊示例,我们生成两个相似度权重来分别表示它对于正类和负类的相似度。之后,多示例数据集经过字典学习和转换字典学习被重新表示,被重新表示的数据集结合未被挑选的模糊示例及其相似度权重一同进入学习阶段去构建基于铰链损失函数的分类器。在字典学习阶段,对稀疏编码系数采用的是2,1-范数约束,而不是使用耗时的0-范数或1-范数约束,相比于0-范数和1-范数约束,2,1-范数约束不仅可以保证稀疏编码按行的稀疏性,而且在训练阶段是非常简便有效的。转换字典学习通过最小化重构误差获得,并且转换字典可以将输入示例数据与稀疏编码连接。为了解决所提出的基于多示例的字典学习模型,分类误差项应该被最小化,但是它与铰链损失函数中的最大化问题相耦合,因此引入松弛变量来表示铰链损失函数中的最大化变量问题。之后我们将字典学习模型、转换字典学习模型和分类器模型结合到一个统一的模型中一同去学习,最后通过一种交互式的迭代框架来对模型进行求解以获得预测分类器模型。在多示例学习数据集上的实验结果表明,我们所提出的多示例字典学习方法比对比的多示例学习方法、多示例字典学习方法具有更好的分类性能和较低的标签噪声敏感度。
其他文献
未来通信产业面临更快信息速率、更高频谱效率以及更低能量损耗等指标要求。在面临产业发展与频谱资源之间供需矛盾的问题时,认知无线电技术允许次级用户暂时接入主用户未占
网络借贷是互联网金融创新的一种典型模式,在我国大力发展普惠金融的背景下有很大的发展空间,但与其蓬勃发展形成鲜明对比的是网贷平台屡屡发生的“跑路”现象,管理层信息披
滚动轴承、齿轮等作为机械设备中不可缺少的动力传动装置,一旦发生故障将无法确保机械设备的安全运行,因此,对旋转机械故障进行诊断具有重要意义。旋转机械在运行过程中,其信号呈现出非线性非平稳性的振动,如何从非线性非平稳性的振动信号中提取出故障特征进行故障识别是旋转机械故障诊断的关键。传统的时频分析方法,如短时傅里叶变换、Winger分布和小波变换在旋转机械故障诊断中得到了广泛地使用,但是大多缺乏自适应性
目的:便秘是中风后出现的常见并发症之一,严重影响中风患者的生活质量及转归预后。临床常用的治疗方法多为口服缓泻剂及灌肠,可暂时缓解患者症状,但容易形成依赖及增加腹泻风险。中医学治疗便秘疗法众多,不同治疗方案的效果及维持时间差异较大,故仍需要不断探索更有效、实用性更强的治疗方案。本研究以中风后气虚便秘为观察对象,通过评价引气归元穴组温和灸结合针刺对中风后气虚便秘患者的治疗效果,并与常规针灸比较,客观分
密集组网技术是5G提出的满足用户持续增长的数据业务需求的关键技术。但密集组网下随着基站密度增大,同频干扰问题成为限制密集组网技术应用的主要因素。密集组网模式下基站
研究目的:调查北京市部分超重肥胖学龄儿童的身体形态分布情况和运动能力特点,探究影响儿童青少年超重肥胖的因素。研究方法:研究北京市某区学龄儿童,总计324人。填写调查问卷和收集了体质测试:肺活量/体重指数、坐位体前屈、1分钟跳绳、1分钟仰卧起坐、50米跑和50米×8折返跑等指标。将研究对象分为三组,分别为:超重组、肥胖组和正常组,采用统计学软件SPSS20.0进行统计分析。研究结果:1.肺活量/体重
热拌阻燃沥青普遍存在能耗高、污染重的问题。常温阻燃沥青技术可望彻底解决隧道阻燃沥青技术高能耗、高污染的缺陷。本文选用十溴二苯乙烷为主要阻燃剂与反应型常温沥青结合,通过分析沥青基本性能指标和氧指数试验结果,初步确定了阻燃剂掺量。通过正交试验,确定了阻燃沥青最佳掺量。在此基础上,对反应型常温阻燃沥青的高、低温性能以及阻燃剂的阻燃机理进行了分析。最后,对反应型常温阻燃沥青混合料基本路用性能和阻燃性能进行
皮日休是晚唐后期创作较为丰富的一位作家,他的前期作品集中收录于《皮子文薮》中,这部自编集共十卷,其中前九卷为文,共有文章将近九十篇,这些文章的共同特点,在于沿袭儒家先圣心忧家国的情怀,倡导“仁义礼智信”等儒家基本观念;此外,皮日休生活在唐末的黑暗时代,他坚持儒家道统,并善于在继立先圣思想的基础上进行突破,善于提出自己的主张,因而《皮子文薮》文具有十分重要的研究价值。本文将从“立言”的角度出发,对《
摄影测量法是一种利用被摄物体影像来重建物体空间位置和三维形状的科学技术。其非接触,高精度,低成本的特点被广泛应用在桥梁健康监测领域中。本文利用摄影测量法对桥梁等目标进行拍摄,通过基于共面特征影像的摄影测量处理解算相机在拍摄时的位置姿态,进而求出桥梁上目标点的空间坐标,为桥梁健康监测提供可靠数据。本论文的主要内容如下:1、基于对相机成像时构像关系的分析,针对相机在桥梁拍摄方法上的不足,提出一种交换相
中国画是我国优秀传统文化代表之一,凝聚了中华民族的悠久历史与思想智慧。现有针对中国画的研究大多集中于对作者与描绘对象的识别,缺少对画作情感的分析。而正是画家将生活中的心情感悟寄情于美术创作升华了国画的艺术价值,情景交融是中国画重要的艺术表现形式。研究国画情感的计算机分析方法,有助于用户的鉴赏和学习,推动数字化建设与文物管理。本文通过研究优秀卷积神经网络架构的特征提取与结构优化原理,并针对中国画独特