利用ELM-AE和迁移表征学习构建的目标跟踪系统

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:yingq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在目标跟踪算法中,特征模型对图像特征的快速学习能力和对跟踪过程中目标特征变化的自适应能力一直是目标跟踪算法的主要研究方向之一。特别是对于基于图像块学习的判别式目标跟踪器而言,这两点已然成为影响跟踪器效率和鲁棒性的决定性因素。然而,现有的大多数同类算法在这两个能力上的性能并不能达到令人满意的效果。为了解决这一问题,本文提出了一种高效且鲁棒的特征模型。该特征模型首先利用基于极限学习机的自编码器(Extreme Learning Machine Autoencoder: ELM-AE)对目标和背景图像块的
其他文献
目前主流的深度学习方法用于微表情识别存在实验数据非常稀缺的问题,导致神经网络在学习的过程中知识获取有限进而难以提升精度。针对目前存在的问题,提出双流网络时间域信息交互的微表情识别方法,构建了双流时间域信息交互卷积神经网络(Dual Scale Temporal Interactive Convolution Neural Network,DSTICNN),网络对微表情序列进行处理,进而实现微表情自
期刊
随着目标跟踪在众多生活场景的广泛运用,高精度且高速的跟踪算法需求也日益增多。针对某些特定场景如移动端、嵌入式等设备,在设备算力相对不足的前提下,仍要保证跟踪器达到良好的跟踪精度和高速实时跟踪问题,提出一种高帧率的轻量级孪生网络目标跟踪算法。首先,选取易于部署在嵌入式设备中的轻量级卷积神经网络MobileNetV1作为特征提取网络,深层网络具有对目标特征强大的提取能力;接着,针对主干网络的不足提出两
期刊
针对水体对光的吸收与散射作用,导致水下拍摄图像存在雾化现象、色彩失真等问题,提出一种基于复原结构与增强纹理融合的水下图像清晰化算法.首先,通过相对总变差模型将图像分解为结构层与纹理层;其次,基于背景光的高亮度与平坦特性及颜色信息计算背景光值,利用红色暗通道先验优化透射率,通过逆求解成像模型得到复原结构层;然后,提出梯度平滑方法用于纹理层,该方法在抑制噪声的同时有效增强纹理细节;最后,融合复原结构层
期刊
时空人群流动预测是智慧城市中的关键技术之一。目前主要有两大痛点困扰着相关研究、从业人员:第一,人群流动与多种因素相关,先前的研究总结出了多种时空先验知识,考虑这些先验知识将有助于建模多种类型的时空依赖,但由于人群流动预测应用场景的多样性,后续工作很难合理而全面地利用这些先验知识;第二,随着深度学习技术的发展,相关技术的实现越来越复杂,复现先进的模型是一件费时且愈发繁琐的事情。针对上述痛点,基于Te
期刊
针对常用航拍图像拼接算法在处理存在视差的复杂图像时会出现鬼影、失真、不自然的问题,本文在APAP(As-Projective-As-Possible)算法的基础上,添加全局相似性和直线结构保护约束,提出了一种基于直线特征约束网格变形的航拍图像拼接方法.首先,在图像重叠区域检测点、直线特征,并估计单应性扭曲;然后,使用网格将图像划分成多个局部图像块,建立网格优化模型,根据网格顶点坐标集定义一个包含图
期刊
当前小目标检测算法的实现方式主要是设计各种特征融合模块,检测效果和模型复杂度很难达到平衡。此外,与常规目标相比,小目标信息量少,特征难以提取。为了克服这两个问题,采用了一种不降维局部跨通道交互策略的通道注意力模块,实现通道间的信息关联,通过对每个通道的特征进行权重分配来学习不同通道间特征的相关性。同时,加入改进的特征融合模块,使网络可以使用低层和高层的特征进行多尺度目标检测,提升了以低层特征为主要
期刊
可溶性有机氮在氮素转化和生态环境安全方面具有重要的作用。在等氮磷钾条件下以单施化肥(CK)为对照,研究不同数量紫云英翻压后(CMV1,15 000 kg·hm~(-2);CMV2,30 000 kg·hm~(-2)和CMV3,45 000 kg·hm~(-2))灰泥田土壤可溶性有机氮(SON)和溶解性有机氮(DON)的动态变化、迁移特征及损失量。结果表明,不同施肥处理20~40 cm和40~60
期刊
最近有一种迁移学习的新方法—对抗域适应,该方法将生成对抗网络(Generative Adversarial Networks, GAN)的思想添加到深度网络当中去,能够学习数据的可迁移表示形式进行域适应。虽然通过GAN的思想能够很好地提取出源域数据和目标域数据的共同特征,有效地进行不同域之间的知识迁移,但现有的对抗域适应算法不能够有效地保留目标域数据的局部特征,而目标域数据的某些特征可能会对分类精
期刊
现有图像修复方案普遍存在着结构错乱和细节纹理模糊的问题, 这主要是因为在图像破损区域的重建过程中, 修复网络难以充分利用非破损区域内的信息来准确地推断破损区域内容. 为此, 本文提出了一种由多级注意力传播驱动的图像修复网络. 该网络通过将全分辨率图像中提取的高级特征压缩为多尺度紧凑特征, 进而依据尺度大小顺序驱动紧凑特征进行多级注意力特征传播, 以期达到包括结构和细节在内的高级特征在网络中充分传播
期刊
将图片切分成单“字”识别再连接成“串”是脱机手写图像识别的一种方法,但由于手写字符间易存在粘连,切分方法不易实现。CRNN特征提取网络虽解决了整张文本图片输入,标签却不易对齐的问题,但由于不同人脱机手写风格的严重差异,网络提取出的特征表示力不够。针对此提出了加强型卷积块注意力模块和复合卷积,并将其加入处理脱机文本识别的CRNN+CTC主流框架中。加强型卷积块注意力模块增大输入特征图的贡献权重且并联
期刊