【摘 要】
:
目标检测是机器视觉领域最热门的研究方向之一,在学术界已取得令人瞩目的成果,在工业界也存在许多有价值的应用。然而,主流的检测方法仍有两个缺陷:(1)即使是经过大量数据有效训练的模型,仍然无法很好地泛化到新场景中;(2)模型一旦部署到位,则无法随着不断累积的无标注数据自主进化。为克服上述问题,受视觉知识理论启发,提出一种场景自适应进化的无监督视频目标检测算法,该算法可利用目标群体概念,降低场景变化带来
【出 处】
:
Frontiers of Information Technology & Electronic Engineering
论文部分内容阅读
目标检测是机器视觉领域最热门的研究方向之一,在学术界已取得令人瞩目的成果,在工业界也存在许多有价值的应用。然而,主流的检测方法仍有两个缺陷:(1)即使是经过大量数据有效训练的模型,仍然无法很好地泛化到新场景中;(2)模型一旦部署到位,则无法随着不断累积的无标注数据自主进化。为克服上述问题,受视觉知识理论启发,提出一种场景自适应进化的无监督视频目标检测算法,该算法可利用目标群体概念,降低场景变化带来的不利影响。首先通过预训练检测模型从无标注数据中提取大量候选目标,然后对候选目标聚类,构建目标概念的视觉
其他文献
1、概况千年古村水北位于山西省晋城市泽州县金村镇,处太行山麓西侧,丹水之畔,北有群岑,南下太行,西接晋城,东通陵川,素有"太行山麓、汭曲山庄"之称。"麓"意为山脚下,"汭"为河流会合的地方。水北村山环水抱的布局体现了中国古村落选址的理想模式。村东山体绵延似青龙,村西山体兀立似白虎,村后为神农山,村南不远处两座形似乌龟的小山锁住村湾的咽喉。横贯全村的丹水河从村东流过。村中草木葱天,
认知心理学早已指出,人类知识记忆中的重要部分是视觉知识,被用来进行形象思维。因此,基于视觉的人工智能(AI)是AI绕不开的课题,且具有重要意义。本文继《论视觉知识》一文,讨论与之相关的5个基本问题:(1)视觉知识表达;(2)视觉识别;(3)视觉形象思维模拟;(4)视觉知识的学习;(5)多重知识表达。视觉知识的独特优点是具有形象的综合生成能力,时空演化能力和形象显示能力。这些正是字符知识和深度神经网
为推动认知层面视觉内容理解的研究,即基于视觉细节的深入理解做出精确推理,视觉常识推理的概念被提出。相比仅需模型正确回答问题的传统视觉问答,视觉常识推理不仅需要模型正确地回答问题,还需给出相应解释。最近关于人类认知的研究指出大脑认知可以看作局部神经元连接的全局动态集成,有助于解决特定的认知任务。受其启发,本文提出有向连接网络。通过使用问题和答案的语义来情景化视觉神经元从而动态重组神经元连接,以及借助
根据十四五规划中提出的加快智能化城市建设服务体系,市政道路是智慧城市建设的重要内容,道路损坏检测则是保证市政道路良好管理的重要手段。本文利用YOLOV5算法经过数据集制作、实验设定、模型训练、问题识别等过程对呼和浩特市市政道路损害情况识别,识别后通过系统及时告知维修人员检修,大大节省了人力和时间成本。对数据集中2000多张市政道路图像进行标注及分类及模型训练,实验表明,本文的模型mAP达到了0.9
针对在络筒工序中出现的筒纱错支现象,在不对现有络筒机进行较大改造的前提下,设计出基于射频识别(RFID)的筒纱错支监控系统,实时监控络筒过程中的纱线质量。描述了监控系统的整体设计方案,探究了超高频RFID系统在络筒机上的应用。将含有纱线信息的电子标签安装在纱管上,阅读器固定在络筒机的滑道旁,以读取纱管上的电子标签。信息管理系统利用读取到的标签信息判断管纱的具体种类,采用监控管纱身份信息的方式来防止
为了响应国家垃圾分类的号召,提出利用光生伏特效应,结合图像识别技术、太阳能追踪技术,设计了一种光伏发电式智能垃圾分类系统。当晴天的光照强度大于设定值时,追踪系统可使得太阳能电池板始终垂直太阳光直射的位置,极大地提升了光伏发电的效率。投入垃圾后,摄像头可按照垃圾种类对其进行识别,STM32F103ZET6单片机通过串口通信读取到垃圾的种类信息,并通过步进电机控制滚珠丝杠的移动距离,以及舵机旋转对有害
农作物病害的治理与防治对农作物的产量和品质有着极其重要的影响。近年来,随着计算机视觉与深度学习技术的发展,基于叶片图像的农作物病害识别研究受到了广泛关注。在葡萄病害识别领域,大规模病害叶片标注数据集的缺乏限制了识别的准确率,而获得专业的葡萄病害数据集需要耗费大量的人力和物力。针对叶片数据集缺乏等问题,提出了一种基于循环生成对抗网络的数据生成模型。实验表明,该模型能够生成质量较高的葡萄叶片病害图像,
岩性快速识别具有重要的基础地质研究意义与工程应用价值,本文提出了一种基于岩石图像迁移学习的岩性智能识别方法.首先,利用深度监督目标检测网络(DSOD)对图像中的岩石进行检测,通过获取岩石的位置信息并自动剪裁,建立高质量的岩石图像数据集.然后,结合ResNet网络构建岩石图像深度学习迁移模型,利用残差网络提取岩石特征信息.再利用迁移学习的方法,通过加载预训练权重对模型进行训练,从而实现岩性智能识别.
中国汉字博大精深,拥有数千年的文化背景与历史积淀,具有其独特的文字结构,是世界上使用人口最多的文字。与一般的视觉元素不同,汉字包含了丰富的高层语义信息,不管在工业界还是学术界对汉字识别技术都有极大的应用需求和重要的研究意义。首先阐述了汉字识别技术的基本概念和定义,对OCR、印刷体识别、手写体汉字识别等概念进行详细说明。在简要介绍了传统汉字识别方法后,详细分析了当前基于深度学习的汉字识别方法的研究历
齐康东南大学建筑研究所所长,教授,中国科学院院士,中国城市规划学会特邀理事杨俊宴:今天我们的主题是关于中国现代城市设计的起源。齐先生,您投身建筑和城市研究领域这么多年来,有哪些事件对您来说印象十分深刻?齐康:要说对我印象最深刻的,应该是苏州的干将路。当年苏州拓宽干将路,为了留住苏州的老味道,我的老朋友周干峙委托我来做项目审查,让我把握两边建筑的基调和风格。