自监督学习相关论文
遥感图像数量的快速增长和遥感图像标签的难以获取,导致依赖于标注样本的传统深度学习方法已然不再适用于遥感图像的处理。因此针......
基于视觉Transformer的自监督模型掩码自编码器因其优秀的全局特征捕捉能力,被广泛应用于遥感图像分类领域。但该模型存在图像重建......
目的 卷积神经网络(convolutional neural network, CNN)在遥感场景图像分类中广泛应用,但缺乏训练数据依然是不容忽视的问题。小样本......
近年来,高光谱图像处理在遥感领域占据着越来越重要的位置,高光谱图像分类作为其中的重要一环,更是具有举足轻重的地位。高光谱图......
随着信息技术和电子商务的发展,互联网已经成为国民日常生活不可或缺的一部分,对国民的生活质量产生极大影响。然而,互联网上的海......
图像是人类获取信息的重要途径,基于深度神经网络的自动化图像理解算法取得了飞速发展,并且在智能监控、自动驾驶、智慧医疗等领域......
新一代信息技术的飞速发展及其在各领域的广泛应用引发了数据的爆炸式增长.如何挖掘海量数据中蕴含的重要信息、发挥数据的价值是......
随着以抖音快手为代表的短视频APP的火爆,网络上储存的多媒体视频数据也在爆发式增长,这些视频信息往往包含音频和图像等模态的数......
随着互联网的发展和普及,由用户创造的内容在线上内容中的占比不断增长。以用户评论为例,不少网民在观看影片后会发布影评,在电商......
三维人脸重建旨在从二维人脸图片中恢复出三维人脸模型。自监督三维人脸重建能够缓解三维人脸数据缺乏的问题,因此成为了近年来的研......
人脸表情识别在日常生活中发挥着越来越重要的作用,人脸表情识别技术的发展,将自动驾驶、虚拟现实和各种社交机器人等应用带入到现......
近年来,汉字自动生成因其在艺术字体生成、个性化字体设计,以及书法作品生成等问题中的广泛应用而引起了大量关注.当前主流的汉字......
随着计算机技术不断地更新,深度学习领域属于计算机科技发展的前沿,诞生出了许多分支方向,本文研究的图像旋转验证码属于其中之一......
有监督的深度神经网络模型在很多机器学习任务中拥有很好的表现,例如计算机视觉领域中的图像分类以及分割,自然语言处理领域的预训......
为了减少人们在语义分割任务中的标注成本,提出了一种新的基于自监督图像对的弱监督语义分割算法Co-Net。首先,将一对图像分别输入到......
帕金森病是一种常见的慢性神经系统疾病,构音障碍是帕金森病的早期症状之一。基于语音进行帕金森病的辅助诊疗有助于更早发现病情和......
Windows系统作为目前互联网上使用量最大的操作系统,提供和承载了海量的信息与服务,但是该系统下大量的恶意软件攻击给人们的信息......
面部表情是一种人类的一种重要交流方式。为了更精确地描述人类面部的动作变化,相关学者提出了面部动作编码系统。根据面部肌肉群......
基于声音诊断的机械设备异常状态检测在工业自动化领域具有重要意义。当前,无监督机械设备异常声音检测主要基于人工构造算法提取声......
[目的]金融领域知识图谱关系变化频繁,依赖人工标注的传统关系预测方法无法满足金融领域的需求。为此提出一种数据驱动的动态关系预......
视觉语言导航是涉及视觉信息和语言信息的复杂多模态任务,导航智能体遵循语言指令引导,在视觉环境中移动,以到达指定目的地。视觉......
由于传统的监督学习方法很大程度上依赖于大量的标注数据,近年来,无需外部监督信息的自监督学习方法受到了极大关注。对比学习是一种......
计算机视觉是使用机器来理解和分析图像的过程,它不仅是人工智能的一个组成部分,而且是人工智能的一个重要分支。在计算机视觉的各......
微表情是一种持续时间极短、不易被察觉的面部动作,揭示了个体的真实情绪,可以被广泛地应用于谎言识别等领域。而微表情检测的研究......
近年来,随着经济、科技、医疗等的快速发展,在世界范围内,人口数量持续上升。每逢节假日,在旅游景点、购物商场、交通枢纽等公共场......
机器人取放任务是目前人工智能与机器人领域融合最紧密的研究热点之一。传统的取放任务主要是在强结构化环境下利用人工示教的方式......
肺癌是目前对人类的身体健康威胁最大的癌症之一。为了在减轻医生负担的同时提高肺癌的诊治效率,深度学习被引进临床进行肺结节的......
混凝土构件垮塌的原因往往都是由于没有进行科学及时的病害检测,这些微小结构的开裂通常会引发整个工程的灾难性破坏。而实际工程......
目标跟踪是计算机视觉领域一个基础性课题,在智能驾驶、安防监控、军事侦察等领域均有着广泛应用。在目标跟踪任务中,影响跟踪性能......
正电子发射断层成像(Positron Emission Tomography,PET)是一种分子水平非侵入式功能成像方法。PET图像能反映人体不同组织器官的代......
立体视觉被广泛应用于机器人、无人飞行器、辅助/自动驾驶、三维测量与虚拟现实、立体电影/视频制作等领域,如何获取深度信息和如......
肺癌是世界上最常见的恶性肿瘤之一,发病率和死亡率均位于恶性肿瘤的第一位,严重威胁人民的生命健康。其中,非小细胞肺癌(NSCLC)是肺......
蛋白质工程在医疗、食品、化工和能源等多个领域有重要应用,并具有加速合成生物学、医学和纳米技术发展的潜力。在传统蛋白质工程......
作为人机交互系统(HCI)中的一个重要组成部分,表情识别算法受到了广泛的关注与研究。近年来,基于深度神经网络的人脸表情识别方法为......
随着信息技术的高速发展,人们在享受互联网技术带来巨大便利的同时,也面临着互联网中海量数据产生的信息过载问题。推荐系统是一种......
肺癌作为发病率最高的癌症之一,严重危害人类的生命健康安全,及时发现并诊断肺癌有利于为患者提供最佳的康复治疗方案。然而,临床......
作为维护人类健康的重要基石,医疗在专家们多年的实践和积累中逐步发展,无论是过去还是现今的社会,它一直扮演着不可替代的角色。......
在工作和生活压力与日俱增的现代环境下,心理压力给人们身体和精神健康带来的问题日益显著,长期的压力甚至会引起抑郁问题,因此,对......
胃癌的早期诊断与患者的预后密切相关。如果能准确评估胃癌的病理状态信息,临床医生可以针对患者的实际情况进行个性化治疗,更加有......
环境感知是工程车辆智能化的基础,检测路面的障碍并进行尺寸估计有助于规避潜在的危险,降低事故的风险。基于激光雷达的三维目标检......
本文主要研究甲骨文、商周金文、春秋楚简和魏晋南北朝石刻字的智能识别。它们历史悠久,与现代汉语差别较大,有较高的识读门槛,使......
金融股票市场是各类投资者热衷参与的一项重要经济活动,对于经济的发展有着重要的影响。投资者期望在金融股票市场上进行投资从而......
文本分类任务在金融行业研究中有重要意义,服务于风险控制、股票预测、证据公开和流程规范等方向。当前成熟的通用文本分类方法仅......