高维问题中的小样本学习

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:testb321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小样本学习(Small Sample Learning,SSL)是模式识别领域中非常重要的研究主题。在可穿戴设备、移动互联网以及视频监控等智能应用方面受到了广泛关注。这些应用有一个共同的特点:嵌入在一个高维空间中可用于训练模型的样本非常少。在过去的几十年,研究人员提出了很多算法来减少这个问题带来的影响,并学习得到一个鲁棒的模型。本文目的在于进一步改善在实际应用问题中嵌入在高维空间的小样本学习的有效性和稳定性。我们考虑这个问题的如下几个方面并提出了对应的解决策略:首先,提出了排序信息保留鉴别分析(Rank Preserving DiscriminantAnalysis,RPDA)来探索排序信息对鉴别学习的性能提升。具体说来,RPDA采用块配准框架对类内样本的局部排序信息以及类间样本的鉴别信息进行建模。然而,同其他监督流形学习算法一样,RPDA算法仍有一些超参数,难以选择到最优的设置。我们进一步提出了一个新的降维算法—集成流形排序信息保留(Ensemble Manifold Rank Preserving,EMRP)来回避这一问题。EMRP寻求多个配准矩阵最优的线性组合来近似存在数据中的本质流形。我们将这两种算法应用于基于加速度的人体行为识别以得到鲁棒和高效的低维表达。然后,提出了稀疏排序信息保留(Rank Preserving Sparse Learning,RPSL)。该方法考虑保留排序信息和获得稀疏投影矩阵两个方面,因此RPSL可以减少集中测量现象的影响以及获得计算上的简约性。另外,为了有助于随后的分类,建模过程也考虑了分类错误最小化。通过一系列等价变换,我们将RPSL的目标函数转换为基于Lasso惩罚的最小平方问题。另外,在我们基于Kinect的场景分类研究中,我们对RGB-D图像样本提取SIFT特征,并采用局部约束线性编码对其进行特征表达,随后采用RPSL和一个简单分类器对场景进行分类。与其他经典的降维算法相比较,RPSL得到模型有着较好的解释性,另外在测试阶段可以节约计算方面的资源。其次,提出了一个全新的半监督分类器—Hessian正则化支撑向量机(HessianRegularized Support Vector Machines,HesSVM)。我们详细论证了利用Hessian正则化对边缘分布紧支集局部几何特性进行建模的合理性,并且证明了再生核希尔伯特空间中的HesSVM等效于核主成分学习的主分量张成的空间进行HesSVM学习。另外,我们提出了在云计算环境下进行图像标注的框架:通过Hamming压缩感知将压缩后的图像传输到云上,随后采用HesSVM进行语义标注。我们在公开的PASCALVOC’07数据集上验证了HesSVM分类器对大规模图像标注的有效性。最后,研究了弱监督度量学习。我们注意到KISS度量学习小样本训练中存在对协方差矩阵的逆估计不稳定的情况,从而会导致性能变差等问题。本文提出了正则光滑KISS度量学习(Regularized Smoothing KISS,RS-KISS),该方法将光滑和正则化技术无缝的结合用于估计协方差矩阵。RS-KISS算法优于KISS算法,是因为RS-KISS能够采用有效的办法放大协方差矩阵中小特征值估计不足,以及减少协方差矩阵中大特征值被高估的情况。另外,KISS的协方差矩阵采用的是极大似然估计。一般认为随着训练样本数量的增加,基于最小分类误差准则的鉴别学习比经典的极大似然估计更加可靠。因此我们进一步提出一个新的算法—最小分类误差KISS度量学习(MinimumClassification Error KISS,MCE-KISS)。这两个方法在VIPeR和ETHZ数据集上进行了充分试验。结果表明MCE-KISS算法准确性更高,而RS-KISS计算更加有效。因此,我们需要依据实际情况选择适用的算法。
其他文献
非球面光学元件在各领域中得到越来越广泛的应用。近年来,光学元件加工技术发展迅速,面形加工精度可达纳米量级,但非球面的高精度通用化检测一直是一项具有挑战的课题。干涉
目的:探讨宫内节育器(IUD)带器妊娠的原因及干预方法。方法:分析收治的147例带器妊娠病例。结果:患者平均年龄29.88岁,IUD放置时间1~24年,孕周6~12w,IUD类型:金属环84例、Tcu环35例、
以2006-2016年上海证券交易所A股市场为研究对象,以学习效应为视角,将机构投资者的介入与企业的现金持有进行比对研究,导论出其中的关联度,以帮助A股上市公司以全面的眼光审视投
技术性贸易壁垒存在着维护国家安全、保障人类健康等正面效应,也有构成贸易障碍的负面效应。对于不同国家,它的效应又是不对称的。《TBT协议》对技术性贸易壁垒的正负效应起
随着科技的进步,高维高噪声数据聚类在数据挖掘研究领域中处于越来越重要的地位。聚类分析作为数据挖掘的一项主要研究课题,已引起广泛重视,同时产生了大量的理论和方法,并取
根据PET、ERP和心理学实验的事实,提出选择性注意的统一模型。在统一模型,把探照灯模型和偏置竞争模型和特点结合起来,既包括竞争机制,又包括增强机制。
中阶梯光栅具有刻线密度低、闪耀角度大、衍射级次高、光谱范围宽、色散率大、光谱分辨率高等一系列突出优点,近年来由于其优良的性能而倍受青睐。作为评价中阶梯光栅质量的
我曾对“商业模式创新的循环”进行了一些深入的思考,在这里对这个主题进行更形象化的描述。这张图片描述了现存的商业模式从t0时点开始,转变为从众多的原型中选定的即将要执行
会议
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
《虾蟹类增养殖技术》课程基于蓝墨云班课平台开展了翻转课堂的教学,通过一学期的教学探索,该教学模式激发了学生的学习兴趣,增强了课程参与度,提高了教学效果和教学质量,值