视觉语言模型相关论文
随着数字化技术的发展,在内蒙古自治区,越来越多的蒙古文古籍被转成数字图像,以便长久保存。但是以图像格式保存的古籍文档没有索......
传统的视觉语言模型(visual language model,VLM)只考虑了相邻视觉单词之间的空间位置关系,不考虑不相邻视觉单词之间的贡献。针对......
[目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视......
在目标分类领域,当前主流的目标分类方法是基于视觉词典模型,而时间效率低、视觉单词同义性和歧义性及单词空间信息的缺失等问题严......
随着互联网和多媒体技术的飞速发展及广泛应用,尤其是智能手机等新兴移动终端的迅速普及,使得数字图像资源的规模呈爆炸式增长。面......
为了帮助用户高效地组织和检索图像资源,多数图像分享站点允许用户为图像添加标签.图像标签推荐系统旨在提供一组标签候选项来方便......
随着互联网的发展,网络图像资源与日剧增,伴随而来的是围绕着网络图像为对象的众多研究课题,比如图像标注、图像检索、图像搜索结......