基于流行学习和张量表示的图像算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:tiankuangfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技领域的发展,人类对大规模数据处理的需求越来越高。无论是图象数据,文本数据,语音数据,还是其他类别的数据,计算机通常都是将数据向量化再进行处理。由于此类数据的海量性和高维度性,使得处理起来困难,计算代价高。因此诞生了很多算法用于解决这个问题。流形学习就是一种研究在流形假设下的机器学习问题的方法,它通过学习数据样本的空间结构信息实现对数据的降维处理。本文分别利用流形学习和张量表示改进传统的非负矩阵分解算法和稀疏编码算法。提出我们的新算法和模型,并在真实数据集进行实验验证。非负矩阵分解(NMF)算法是模式识别和机器视觉领域的经典算法之一。研究发现将流形正则化结合到传统的NMF算法中可以显著提高NMF算法的其性能。然而,现存的大多数流形方法没有考虑到流形的外部几何结构信息。我们提出了一个显式地利用数据分布外部几何结构信息的算法,称为基于曲率感知的非负矩阵分解(CANMF)算法。我们分别使用近邻图和各向异性分布过程来模拟数据的内部几何结构信息以及外部几何结构信息。利用外部几何结构信息,不同类别间的权重被压缩,增强算法的鉴别能力。仿真实验结果和真实数据集上的实验结果证明了所提算法的有效性和鉴别能力。稀疏编码(SC)是一种自动提取和选择特征的技术,被广泛应用于无监督学习。但是,传统的稀疏编码方法将输入图像向量化处理时,打破了局部像素邻接性,破坏了空间结构信息。因此我们提出了一个新的二维稀疏编码模型(2DSC),该模型利用新的框架将灰度图像重新表示为张量线性组合。2DSC利用循环卷积算子,使学习到的字典更加简洁,因为传统的稀疏编码算法学习到的基的平移不变形式被同样地处理。我们将2DSC用于真实图像的处理,演示2DSC在采用大数据块的情况下也能学习到有意义的字典,而这一点是传统稀疏编码所做不到的。
其他文献
有一天,小狐狸散步的时候,在路边看见了一颗闪光的白石子。小狐狸很高兴,心想:我每天都捡一个漂亮的小东西回来,放到箱子里,让它成为一个百宝箱。第二天,小狐狸捡到了一个漂亮的蝴蝶结。第三天,除了一个从树上掉落的松球,路上没有别的什么好东西。第四天,小狐狸捡到了一粒纽扣。第五天,他捡到了一面小圆镜。小箱子里的东西渐渐堆满了。森林里的小动物们纷纷跑来打听。
期刊
目的分析声带真菌感染的临床特征。方法回顾性分析7例声带真菌感染患者的临床资料。结果 7例患者症状均为声音嘶哑,术前喉镜检查发现新生物位于右侧声带2例,左侧声带2例,双侧声带前段者3例;5例新生物呈灰白色隆起,2例为光滑新生物;5例局部麻醉纤维喉镜下行声带肿物摘除,2例全身麻醉支撑喉镜下行声带肿物切除;7例患者术后声音恢复好;术后组织病理检查诊断均为真菌感染,其中1例合并细菌感染;随访1~4 a,均
针对摘钩作业时间短,需要在机器人和车厢同步时准确识别目标把手和测距的问题,提出使用双目立体视觉技术配合机械臂自动摘取车钩的方法并对视觉部分进行深入研究:通过图像预处理和模板匹配技术识别目标把手,在利用特征检测和匹配算法恢复双目摄像机间的位姿信息,并对双目摄像机的位姿信息进行校正.为了克服立体匹配时光照不均的影响,提出了基于局部融合的立体匹配算法获取视差图,最后使用三角测量计算列车分解区域中目标把手
近年来,从医学图像中提取描述图像的定量特征来为临床问题提供决策支持的做法,受到了广泛的关注;这种方法被称为影像组学。通过与统计分析、机器学习等方法相结合,影像组学能够有效地应用于计算机辅助诊断系统,提高诊断、预后的标准化和准确性。本论文首先研究了影像组学特征的快速计算方法,在CUDA平台上开发了基于GPU(Graphics Processing Unit)的影像组学特征快速计算工具cu Radio
目前冠状动脉相关的疾病已成为威胁人类健康的主要疾病之一,呈现高发病率和死亡率。而冠脉微循环功能障碍是诱发这些疾病的重要因素。临床上根据微循环功能障碍的程度来确定治疗过程中的给药策略或者判断是否需要手术等。微循环功能评估是临床治疗的基础,临床医生常通过对冠脉造影图像的定性观察、手动测量或者利用磁共振成像等手段来评估。前者精度不高,后者操作复杂费用昂贵。冠脉造影是常用的冠脉疾病的诊疗手段,通过对冠脉造
那年冬天,我在浙江绍兴遇见了一群热心人。我们去公园玩,没想到在一个转弯处汽车突然倾斜了,哥哥赶紧刹车,往后倒车,汽车却不动。姐姐下车一看,叫道:“一边轮胎卡在台阶下了!”我们赶紧下车查看。这时,好几个路人围上来说:“经常有外地车卡在这里,每次都是我们帮忙推车。”说着,他们马上召集了附近的一群好心人,大家齐心协力帮助我们推车。大伙儿弓着腰,后腿绷直,使出了全身的力气,哥哥也发动了车,小心地往后
期刊
在计算机视觉领域中,视频人体动作识别技术的研究是相当重要的,具有极大的挑战性。深度图像技术的发展,特别是能获取深度信息的Kinect深度摄像头的出现,为人体动作识别提供了新的解决思路和方案。研究人员可以快速准确地从深度图像获取骨架关节的三维位置,还原人体的三维骨架模型。本文基于人体骨架模型,提出了两种基于人体三维骨架特征的动作识别算法。两种方法分别基于特殊正交群以及特殊欧氏群,创新性地提取了时空维
随着公路通车里程的增长与汽车数量的增加,交通事故导致的伤亡与损失的数量也急剧上升。其中有很大比例是因驾驶员的疏忽造成汽车偏离车道。车道偏离警示系统(Lane Deflects Warning System)因会提前预测偏离并警告驾驶员,可大大降低此类事故的发生率而正在成为国内外研究和开发的重点。本文论述的题目是基于图像的车道偏离警示系统的设计与实现,本文的主要工作包括以下几方面:在车道偏离警示系统
在计算机图形学领域,对于动物的毛发以及人的头发的模拟仍然是一个非常前沿并且具有挑战性的工作。这主要是由于在模拟环境中往往需要对数十万根头发进行模拟,同时要保证各自的运动特性以及考虑头发和头发之间的交互碰撞。传统的交互毛发解决方案上往往通过运用简化的动力学表征或者降低整体的模拟自由度来达到保证模拟的实时性。在本篇论文当中,我们提出一种实时地、基于GPU通用计算的毛发模拟方法。该方法旨在高效地模拟毛发