面向自然场景文本检测的FPPMAC模型

来源 :通信技术 | 被引量 : 0次 | 上传用户:zhanghui1860
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为进一步解决自然场景下文本方向多变、形状不规则以及分布密集等分割问题,提出了一个由特征金字塔网络(Feature Pyramid Network,FPN)和并行多空洞卷积(Parallel Multiscale Atrous Convolution,PMAC)模块构成的FPPMAC模型.其中,PMAC模块由4个空洞卷积层组成,可同时提供4种不同大小的感受野.此外,使用循环收缩算法从已知文本区域得到多个形状相同的子文本区域,并将其与FPPMAC模型所生成的多个分割图相匹配,由此可作为分割图的真实标签.利用标准数据集ICDAR2015、CTW1500进行实验,实验结果表明,FPPMAC模型的准确率分别达到了88.49%和89.17%,相较于其他经典模型,能够更准确地定位文本区域.
其他文献
为解决现有的链接预测模型不能有效考虑三元组之间潜在关系的局限性,提出了一种融合图注意力网络(Graph Attention Networks,GAT)和胶囊神经网络(Capsules Noural Networks,CapsNet)的知识图谱链接预测模型,使用图注意力捕获每个实体邻域中的实体和关系特征,引入胶囊神经网络来解码三元组,通过胶囊神经网络节点嵌入特征的学习,生成连续向量与权重向量做点积运算,再构建评分函数用于判断三元组的准确性.在WN18RR和FB15K-237数据集上进行实验,结果表明该模型可
针对音频水印算法在隐藏信息时鲁棒性差的问题,提出了一种基于小波包分解(Wavelet Packet Decomposition,WPD)和指数-对数运算(Exponential Operation-Logarithm Operation,EO-LO)的变换域盲水印音频隐藏算法.该算法先将载体音频进行分帧处理并选取能量最高的L个音频帧;再对选中的帧进行小波包分解,将EO应用于选中的小波包子带系数;然后通过自适应改变小波包子带前后两部分的能量状态来嵌入信息;最后利用LO恢复出载密音频.由仿真结果可知,所提出的
由于传统通信电源远程监控系统监控模式单一、监控效果不好,因此设计基于虚拟专用网络(Virtal Priate Nework,VPN)的通信电源远程监控系统.硬件上,设计整流器与CIP-51微控制器;软件上,建立远程监控设备采集模块,完善远程监控系统信息.设置通信电源远程监控指标,使远程监测更加精准.基于VPN设计通信电源远程监控组网,优化通信电源远程监控的安全性能.采用系统测试的方式,验证了新系统拥有多样化实现远程监控的能力,可以正常稳定运行.
风力发电机组混凝土塔架结构非常复杂,塔门的存在对整体塔筒的力学特性有着不可忽视的影响,因此有必要进行门洞处水平承载力研究.参照《高耸结构设计规范》(GB 50135-2006)、《烟囱设计规范》(GB 50051-2013)和美国混凝土协会标准(ACI 307-08)进行预应力混凝土塔架门洞处截面极限状态验算,对比了不同规范所采用的计算方法的优缺点.采用ANSYS建立了相应的预应力混凝土塔架有限元模型,对决定截面抗弯承载力的一个重要影响因素进行了数值研究,即受压区的半角系数α或ACI 308-08标准中采
在我国社会经济与科学技术的协同发展下,移动通信网络技术的发展十分迅速.尤其是在当今时代,移动网络通信技术更是在4G技术的基础上实现了突破性的发展.目前,5G技术已经成为了一项十分完善且成熟的移动网络通信技术.在该技术背景下,其传输网络的规划也开始备受社会所关注.基于此,对5G移动传输网络的主要规划措施进行分析,以此来为其后续的应用与发展提供相应的技术支撑.
随着我国通信网络的智能化发展,物联网(Internet of Things,IoT)、区块链技术的升级与运用,为军事领域通信开关电源运行的稳定性带来了挑战.基于通信开关电源电磁特性,明确各类电磁干扰的机理与实际影响,包括功率开关管引发的电磁干扰、二极管反向恢复引发的电磁干扰、磁性元件引发的电磁干扰以及战场复杂电磁环境引发的电磁干扰等,分析多种技术在通信开关电源电磁干扰抑制方面的应用效果及优劣势,从源头抑制、切断干扰抑制、屏蔽抑制3个方面提出技术的应用措施,降低电磁干扰,强化其在军事领域的应用与发展.
中文分词(Chinese Word Segmentation,CWS)是自然语言处理(Natural Language Processing,NLP)中一项重要的基础任务.由于不同领域中文词汇的特殊性以及缺乏相关领域的标记数据,面向特定领域的分词任务是近年来中文分词研究面临的挑战之一.因此,提出了一种基于双向长短时记忆网络(Bidirectional Long Short-Term Memory,Bi-LSTM)的分词模型,其中分别使用了大规模的中文通用语料以及少量中文医学语料训练模型来构建这种全新的分词
针对不同分辨率的遥感影像融合时存在鲁棒性差、算法复杂度高的问题,提出了一种双尺度分解的高分遥感影像融合方法.该方法首先采用高分1号、高分2号不同分辨率的遥感影像作为实验数据,通过YUV提取多光谱影像的灰度分量Y;其次利用联合引导滤波的滚动引导滤波的方法将影像分为结构层与能量层,在能量层和结构层设计能量属性和梯度能量有效的影像融合规则并进行融合得到Y′分量;最后通过YUV逆变换得到最终的融合影像,并与其他4种方法进行对比实验,实验证明该方法是一种可行的高分辨率遥感影像融合方法.
当前,现场可编程门阵列(Field Programmable Gate Array,FPGA)因其显著的优越性,已经成为构建数字系统的主角.随着FPGA外围电路规模和复杂程度的增大,逻辑功能正确的FPGA设计在某些场景下可能遇到时序问题,导致通信失败.结合工程实践,提出了一种基于FPGA实现两个介质访问控制层(Media Access Control,MAC)互连的方法,并针对互连接口的性能问题,提出了有效的时序优化解决方案.通过测试证明:该方案对FPGA与其他类型的外围接口的时序设计同样具有借鉴意义.
为了提升220 kV智能变电站常规化管理水平,要整合继电保护处理机制,融合自动化技术方案,打造更加合理的保护体系,维持智能变电站综合应用效能,实现经济效益及社会效益的双赢.介绍了220 kV智能变电站继电保护的要求和内容,并着重对自动化方案展开讨论.