【摘 要】
:
目的 从图像中裁剪出构图更佳的区域是提升图像美感的有效手段之一,也是计算机视觉领域极具挑战性的问题.为提升自动裁图的视觉效果,本文提出了聚合细粒度特征的深度注意力自动裁图方法(deep attention guided image cropping network with fine-grained feature aggregation,DAIC-Net).方法 整体模型结构由通道校准的语义特征提取(semantic feature extraction with channel calibration
【机 构】
:
江西财经大学信息管理学院,南昌 330032
论文部分内容阅读
目的 从图像中裁剪出构图更佳的区域是提升图像美感的有效手段之一,也是计算机视觉领域极具挑战性的问题.为提升自动裁图的视觉效果,本文提出了聚合细粒度特征的深度注意力自动裁图方法(deep attention guided image cropping network with fine-grained feature aggregation,DAIC-Net).方法 整体模型结构由通道校准的语义特征提取(semantic feature extraction with channel calibration,ECC)、细粒度特征聚合(fine-grained feature aggrega-tion,FFA)和上下文注意力融合(contextual attention fusion,CAF)3个模块构成,采用端到端的训练方式,核心思想是多尺度逐级增强不同细粒度区域特征,融合全局和局部注意力特征,强化上下文语义信息表征.ECC模块在通用语义特征的通道维度上进行自适应校准,融合了通道注意力;FFA模块将多尺度区域特征级联互补,产生富含图像构成和空间位置信息的特征表示;CAF模块模拟人眼观看图像的规律,从不同方向、不同尺度显式编码图像空间不同像素块之间的记忆上下文关系;此外,定义了多项损失函数以指导模型训练,进行多任务监督学习.结果 在3个数据集上与最新的6种方法进行对比实验,本文方法优于现有的自动裁图方法,在最新裁图数据集GAICD(grid anchor based image cropping database)上,斯皮尔曼相关性和皮尔森相关性指标分别提升了2.0%和1.9%,其他最佳回报率指标最高提升了4.1%.在ICDB(image cropping database)和FCDB(flickr cropping database)上的跨数据集测试结果进一步表明了本文提出的DAIC-Net的泛化性能.此外,消融实验验证了各模块的有效性,用户主观实验及定性分析也表明DAIC-Net能裁剪出视觉效果更佳的裁图结果.结论 本文提出的DAIC-Net在GAICD数据集上多种评价指标均取得最优的预测结果,在ICDB和FCDB测试集上展现出较强的泛化能力,能有效提升裁图效果.
其他文献
本文提出一种电动汽车引射空调系统,该系统将车内蒸发器设计成前后排分离形式,并在其间加入引射器,以提高压缩机吸气压力,形成梯级蒸发,从而优化系统性能.实验研究了在不同蒸发温度、冷凝温度工况下电动汽车引射空调系统的性能,并与传统空调系统进行了对比.实验结果表明:在不同制冷工况下,电动汽车引射空调系统性能始终优于传统空调系统性能,且随着蒸发温度的升高或冷凝温度的降低,电动汽车引射空调系统性能改善幅度逐渐增大.在实验工况范围内,相比于传统空调系统,电动汽车引射空调系统制冷量增大约11.10%~14.57%,系统C
众多临床观察认为妊娠期及产后女性普遍存在学习和记忆等认知能力降低的情况,但机制不明,可能与妊娠期内分泌、神经和心理因素的变化相关.以实验动物行为学为主的基础研究提示妊娠相关的激素在中枢神经系统结构和功能重塑方面发挥关键作用.妊娠对于人类女性认知功能和行为的影响研究受到样本量较小、方法学不同以及实施者对相关定义的理解偏差等限制,尚未取得共识性结论,但妊娠导致女性工作记忆缺陷的证据较为充分.这些研究成果为识别和深入探索妊娠引起的中枢神经系统结构变化、认知和记忆功能变化奠定了理论基础,并能够帮助医护人员为广大孕
新能源电动汽车热管理系统与传统乘用车不同,对采用热泵空调系统并利用液冷冷却电池的新能源电动汽车,制冷剂充注量比传统汽车空调增加了400~800 g.若使用可燃制冷剂,泄漏扩散至乘员舱,燃烧风险将增大.本文通过数值模拟对R1234yf制冷剂在蒸发器破损泄漏随送风进入乘员舱后的浓度变化过程和最高浓度进行了动态监测.结果表明:汽车后排制冷剂较前排易聚集.制冷剂在完全泄漏后,4个出风口最高平均R1234yf体积浓度为1.58%,4位乘客呼吸点最高平均R1234yf体积浓度为0.99%,4位乘客脚部最高平均R123
压缩机是蒸气压缩蒸发系统的核心设备,会显著影响系统的能耗和运行稳定性.本文搭建了基于罗茨压缩机驱动的蒸气压缩蒸发实验台,蒸发温度为80~100℃,蒸发压力为46.60~101.64 kPa,压缩机压升为17.86~36.03 kPa,蒸发量为125.72~424.85 kg/h,实验研究了吸气流量、压缩比功、容积效率和等熵效率随蒸发温度的变化规律.结果表明:随着蒸发温度的升高,吸气流量(7.10~11.74 m3/min)逐渐升高,压缩比功(310.69~158.54 kJ/kg)逐渐降低,容积效率(52
11月30日,由重庆欧亚食品安全评估中心、芗村(重庆)农业科技研究院共同主办,重庆渝城红食品有限公司承办的以“创新创品创未来”为主题的“2021年食品企业发展战略研讨会”在江津区德感食品工业园区隆重召开.
近年来,鸡屎藤在食品应用中逐渐得到关注,而广西境内鸡屎藤属植物资源丰富,亟待开发利用.通过查阅大量资料,本文系统分析了广西境内鸡屎藤的种类、分布及其营养成分,并从地域和民族等方面对广西鸡屎藤食用现状进行归纳总结.发现鸡屎藤种类繁多且营养价值丰富,常做成具有浓郁民族特色的传统小吃,成为广西节日必不可少的餐桌美食.本文为鸡屎藤在食品中进一步的研究和推广提供了理论支持和现实依据.
目的 为建立3维模型语义部件之间的对应关系并实现模型自动分割,提出一种利用隐式解码器(implicit decoder,IM-decoder)的无监督3维模型簇协同分割网络.方法 首先对3维点云模型进行体素化操作,进而由CNN-encoder(convolutional neural network encoder)提取体素化点云模型的特征,并将模型信息映射至特征空间.然后使用注意力模块聚合3维模型相邻点特征,将聚合特征与3维点坐标作为IM-decoder的输入来增强模型的空间感知能力,并输出采样点相对于
动画形象是一种兼具商业性与艺术性双重属性的图像类型,将其运用到旅游食品的包装上,可以有效突出当地旅游产业的特色,进行个性化的旅游文化宣传.本文针对动画形象在旅游食品包装设计中的问题,进行详细分析与阐述,为相关领域的设计人员提供一定参考.
目的 智能适配显示的图像/视频重定向技术近年受到广泛关注.与图像重定向以及2D视频重定向相比,3 D视频重定向需要同时考虑视差保持和时域保持.现有的3 D视频重定向方法虽然考虑了视差保持却忽略了对视差舒适度的调整,针对因视差过大和视差突变造成视觉不舒适度这一问题,提出了一种基于时空联合视差优化的立体视频重定向方法,将视频视差范围控制在舒适区间.方法 在原始视频上建立均匀网格,并提取显著信息和视差,进而得到每个网格的平均显著值;根据相似性变化原理构建形状保持能量项,利用目标轨迹以及原始视频的视差变化构建时域
在科技进步的推动下,我国现代分析仪器不断发展创新,在食品检测领域应用广泛,运用分析仪器对食品化学组成与物理性质进行数据分析,确保检测的精准性及高效性,对食品质量监督具有重要意义.本文介绍了现代分析仪器在食品检测中的应用分类,并提出现代分析仪器在食品检测中具体可行的应用措施,以期为现代分析仪器在食品检测中更好地应用提供参考.