【摘 要】
:
不同于监督学习,多示例学习的数据集由“包”组成,每个包中含有若干个以向量形式表示的示例。多示例学习数据集中包的标签明确,其基本假设为:正包中至少含有一个正示例,但具体是哪一个或哪几个未知;负包中全是负示例。随着多示例学习分类算法在图像和文本等领域应用越来越广泛,多示例学习降维算法也逐渐成为研究热点。本文主要研究工作如下:一、提出了一种对于多示例学习问题通过使用支持向量机实现线性降维的算法。首先,假
论文部分内容阅读
不同于监督学习,多示例学习的数据集由“包”组成,每个包中含有若干个以向量形式表示的示例。多示例学习数据集中包的标签明确,其基本假设为:正包中至少含有一个正示例,但具体是哪一个或哪几个未知;负包中全是负示例。随着多示例学习分类算法在图像和文本等领域应用越来越广泛,多示例学习降维算法也逐渐成为研究热点。本文主要研究工作如下:一、提出了一种对于多示例学习问题通过使用支持向量机实现线性降维的算法。首先,假设数据集每个正包中最具区分度的正示例已知,并将它们作为对应包的单特征向量表示;每个负包中的所有示例取均值作为对应包的单特征向量表示(数据集给定此项为定值)。这些单特征向量标签明确,于是可将多示例学习拓展至监督学习内解决。然后,利用这些正负类单特征向量训练一个二分类线性软间隔支持向量机模型。支持向量机的分类准则是不同类样本间隔最大化,因此分类超平面的法方向是一个很好的投影方向,可将多示例数据集向此方向投影实现降维。但问题关键在于正包中正示例是未知的,正包单特征向量的选择直接影响支持向量机模型及投影方向。本文采用交替迭代优化的块坐标下降方法实现投影向量的求解。具体的,先初始化正包单特征向量并计算出负包的单特征向量,将它们作为样本训练一个支持向量机模型并获得初步的投影方向;然后,固定模型更新优化正包的单特征向量,有了新样后本又可重新训练支持向量机模型并更新投影方向。按此方法交替迭代优化达到预设停止条件即可。二、提出了一种对于多示例学习问题使用L1范数线性判别分析获取投影矩阵的线性降维算法。求解方法与第一种算法类似,也是将数据集每个包用单特征向量表示转至监督学习内解决,然后交替迭代优化正包的单特征向量和投影向量实现求解,不同的是这里使用更具鲁棒性的L1范数线性判别分析获取投影矩阵。现有的一种求解L1范数线性判别分析的方法是使用基于自定义梯度的梯度法,本文在此基础上使用动量梯度法实现加速收敛并可使结果更加精确。最后用实验验证了本文提出的两种算法的有效性。
其他文献
目的microRNA(miRNA或miR)-429在某些肿瘤中低表达,扮演抑癌基因的角色,但在另一些肿瘤中高表达,起类似癌基因的作用。目前有关miR-429在乳腺癌中表达情况的研究较少。有研究结果显示miR-429在乳腺癌组织中的表达较癌旁组织中的表达明显减低。秦等利用探针法实时荧光定量PCR检测人乳腺癌细胞系中miR-429的表达情况,结果显示:miR-429在不同人乳腺癌细胞系中的表达存在差异
目的细胞分裂周期蛋白14A(cell division cycle 14A,Cdc14A)磷酸酶作为高度保守的丝/苏氨酸双特异性磷酸酶家族中的一员,最初是由L.Hartwell在筛查调控出芽酵母细胞周期基因时意外发现并命名[1]。它在真核生物(从单细胞真菌中的酵母菌到人类)G2期阻滞中发挥着稳定的保守性作用[2]。Cdc14在G2/M转换时能下调Cdk1的活性,其功能涉及有丝分裂后期的调控及退出有
目的:基于全转录组芯片测序技术及生物信息学筛选缝隙连接蛋白CX43(connexin 43,CX43)的下游差异基因并进行功能预测及生存分析,为探究原发性肝癌发展机制及寻找新的药物作用靶点提供理论支持。方法:采用TransIntroTM EL转染试剂转染重组质粒至人肝癌SMMC-7721细胞,构建CX43过表达组,其中对照组仅转染空载质粒。通过采用qRT-PCR、Western blot来检验转染
土地的不合理利用严重破坏了土壤结构,土壤结构的好坏直接影响作物对养分的吸收利用,进而影响作物产量。最大限度地提高养分利用效率和尽量减少土地利用对环境的影响是世界范
目的:对不同阶段羊膝关节软骨退变模型进行磁共振T2-mapping检查,揭示各阶段羊膝关节软骨退变MRI表现的特点和规律,分析与其软骨内蛋白多糖含量的相关性,探讨不同阶段软骨退变MRI表现的分子病理学机制。方法:选择健康的蒙古羊15只,随机分为A组、B组、C组、D组、E组共5组,每组3只,通过在羊膝关节内注射木瓜蛋白酶溶液的方法来制作蒙古羊左膝关节软骨退变的模型。A组不进行处理作为对照组,B组、C
目的:观察头痛舒缓颗粒对肝气郁结型紧张型头痛的临床疗效及安全性。方法:本研究利用随机、对照的方法,选取2017年10月至2018年10月期间,就诊于本院脑病科门诊,符合纳入标准的紧张型头痛患者60例,按随机数字表法,分为治疗组和对照组各30例。对照组予单纯西药(盐酸阿米替林片)治疗;治疗组在对照组基础上加服头痛舒缓颗粒;两组患者均连续服药4周,计为一个疗程。观察治疗前后两组患者的紧张型头痛积分、中
在智能视频监控中,前景目标检测的目的是提取感兴趣前景目标并将其用于中高层视频分析技术。因此,视频前景检测具有重要的研究价值,也是智能视频监控的核心内容。针对目前尚
今年2月7日,厦门《海峡导报》一篇题为《英雄,你在哪里?》的报道,震动了正在忙于过春节的市民。文中说,沈阳龙翔高科技有限公司孙总经理无端被一伙歹徒殴打,面临生命危险的
目的:改良加工小牛冻干松质骨技术,通过数字化模型精准设计股骨头骨支架及将其在自主研发的灌注生物反应器内加载肌腱干细胞诱导分化。为股骨头坏死再生提供材料基础。方法:通过对SD大鼠的股骨头MicroCT的数据进行分割重建,设计股骨头骨支架模型。采用改良的小牛冻干松质骨加工方法,将小牛新鲜松质骨数控雕刻成股骨头骨支架,并采用酶消化法进行去抗原后冻干。依据股骨头骨支架模型设计制造12轴灌注生物反应器模型,
目的:通过腺病毒载体上调和下调大鼠心肌组织中miR-327的表达,探讨其在心肌缺血再灌注损伤(MIRI)中的作用及其分子机制。方法:(1)腺病毒转染:将60只健康雄性SD大鼠随机分为5组,分别为假手术组(Sham组,生理盐水+假手术)、缺血/再灌注损伤组(I/R组,生理盐水+I/R)、miR-327抑制组(Ad-miR-327-i组,Ad-miR-327-RNAi+I/R)、腺病毒空载组(Ad-N