【摘 要】
:
随着人工智能的兴起,深度学习技术在多个领域有了广泛的应用与发展,将深度学习技术与PCB芯片文字识别相结合,实现具体的场景应用,具有重要意义.基于深度学习进行文字识别,完成图像中文字信息的自动获取,进一步提高了准确率,极大地节约了人工及时间成本.但传统深度学习模型巨大的参数量以及内存消耗等限制了其在小型设备如移动终端上的应用与发展,难以满足人们日益增长的需求.基于此,该文提出了一种基于轻量级网络的文字识别算法LWTR.该算法框架主要包括卷积神经网络(进行特征提取)、循环神经网络(进行标签预测)以及CTC(实
【机 构】
:
南京航空航天大学 计算机科学与技术学院,江苏 南京 211106
论文部分内容阅读
随着人工智能的兴起,深度学习技术在多个领域有了广泛的应用与发展,将深度学习技术与PCB芯片文字识别相结合,实现具体的场景应用,具有重要意义.基于深度学习进行文字识别,完成图像中文字信息的自动获取,进一步提高了准确率,极大地节约了人工及时间成本.但传统深度学习模型巨大的参数量以及内存消耗等限制了其在小型设备如移动终端上的应用与发展,难以满足人们日益增长的需求.基于此,该文提出了一种基于轻量级网络的文字识别算法LWTR.该算法框架主要包括卷积神经网络(进行特征提取)、循环神经网络(进行标签预测)以及CTC(实现转录),最终得到预测序列.为减小模型参数量,进行通道数的统一并采用多路小卷积及堆叠Dense Layer充分提取特征.同时,为加速网络的收敛,提高模型的泛化能力,引入BN归一化.结果表明,该算法在PCB芯片数据集中文字识别准确率达到了89.58%,与现有文字识别算法相比,在准确率几乎没有下降的情况下具有更小的模型与更快的速度.
其他文献
由于网络流特征会随时间和网络环境的变化而发生概念漂移,不同类别应用的流发生漂移情况不同,导致基于机器学习的流量分类方法精度明显降低.同时,随着互联网网络技术的不断提高,使得过去采集并做好标签的大量视频流样本数据会发生很大变化,导致可用的训练集较少,需要实时采集和标注大量的新数据.针对上述问题,提出一种结合Jensen-Shannon距离、MultiTrAdaBoost和RandomForest算法的分类方法.该方法的核心思想是:度量新老视频数据流之间的相似性,根据度量结果判断采用何种模型进行分类,其中的迁
软件缺陷预测研究中,研究人员通常使用有标记的数据进行预测模型的构建.但是在实际应用中往往会存在有标记样本不足的情况,为了应对这种状况,专家学者引入了半监督学习.尽管近年来不断有学者提出项目内的半监督缺陷预测方法,这些方法的预测准确度还有很大的提升空间.该文提出了一种新的半监督极限学习机软件缺陷预测方法,即基于改进SMOTE的半监督极限学习机方法.首先提出了一个改进的SMOTE采样方法来缓解类不平衡问题,其次使用了栈式去噪自动编码器来保留和获得更好的特征表示,最后为了提高模型的学习速率,获得更好的泛化性能,
政府公文内容多,涉及范围广,从中挖掘出有价值的信息,可减轻政府工作人员的压力,比如应用实体关系抽取技术挖掘人事信息.采用远程监督的关系抽取方法可以减少人工标注成本,提高关系抽取效率,进而保证了获取重要信息的质量和实效性.该文提出一种ALBERT预训练语言模型和胶囊网络相结合的远程监督实体关系抽取方法,抽取公文中的人名职务关系.ALBERT通过字嵌入和位置嵌入的方式,提取文本中深层的语义信息,胶囊网络通过传输低层到高层的特征,提高关系分类效果.实验结果表明,提出的关系抽取模型的准确率、召回率、F1值均高于基
联邦学习(FL)是一种分布式的机器学习方法,它通过中心服务器汇总各个移动终端在本地训练的机器学习模型,使得多个参与方能够协作进行高效率的机器学习.同时,FL不需要将终端的私人数据发送至中心服务器,从而保护了数据隐私.但是与普通的训练数据集不同,终端系统中的数据分布不平衡,这将导致FL的通信效率下降.针对该问题,提出了一种基于数据分布加权聚合的FL算法.通过计算参与方的本地数据集与平衡数据集之间的海林格距离对本地数据集的平衡程度进行了量化,并据此调整了参与方在聚合时的权重,以减少算法收敛或达到目标准确率所需
深度神经网络由于其良好的非线性逼近能力与泛化能力而被应用于物联网数据的分类和预测.智能家居作为典型的物联网应用场景,通常将家庭中采集的数据传输到云端,使用深度神经网络单智能体集中处理.以云计算中心的数据处理方案会导致较长的网络延迟以及用户隐私数据的泄露.文中将采用多智能体模型,在深度神经网络模型上添加分支结构,利用分支点将神经网络分为可以部署在不同智能体的浅层部分和深层部分,设计了基于多智能体协同的深度神经网络的数据分类算法;基于边缘计算模型,在边缘设备上部署浅层神经网络智能体,云服务器设备上部署深层神经
在大数据背景下,企业管理思维和营销思维发生转变,企业为促进自身发展,重视产品进退与市场营销结合带来的影响,若能准确地把握产品在市场上的投放或退出,有助于提高企业整体营销思想,能够为企业带来良好的经济效益,但产品进退与市场营销的结合蕴含着潜在的市场风险,因此在企业产品管理中还需讲究一定的科学策略.基于此背景,该文主要针对如何运用产品进退将企业管理与市场营销相结合,根据影响产品进退的多维指标:上柜率、再购率、同价类销量比、商业存销比、订足率、销售年限、是否进入衰退期,提出在大数据环境下多维指标结合改进BP神经
随机森林是由很多决策树组成,而各棵决策树之间没有关联,每棵决策树训练产生基分类器,根据最后决策树投票结果决定分类模型.随机森林算法比一般的单分类器具有更高的分类准确度和更低的泛化误差,因此被广泛应用于各方面.但是随机森林算法在处理不平衡数据上存在分类准确率下降等问题,分类结果更偏向于多数类.针对上述问题,提出了一种基于混合采样的改进随机森林算法(hybrid sampling random forest,HSRF).首先采用随机欠采样和SMOTE算法相结合的方法对不平衡数据集进行预处理,同时结合聚类算法对
随着成像技术的发展,人们使用普通成像设备采集的图像分辨率越来越高,细节越来越清晰,能更加准确地呈现真实自然场景中事物之间的关系.然而传统的图像处理方法在处理分辨率相对较高的自然场景图像时,效果和效率并不理想.针对现有的随机游走图像分割算法在处理背景复杂、分辨率大的自然场景图像时,目标边界难以贴合以及效率较低的问题,提出了一种基于超像素随机游走的自然场景图像分割方法.将超像素的思想引入到随机游走过程当中,先对图像进行超像素分割处理,然后以超像素为节点,对每个超像素区域提取颜色特征及LBP纹理特征构建无向加权
为了实现低功耗的图像分类识别系统,设计一种基于卷积神经网络的图像分类识别系统方案,该方案研究基于ARM+FPGA异构系统的实现方法,系统搭载于Xilinx的PYNQ嵌入式开发平台.在电脑端对待测试的数据集搭建卷积神经网络模型并完成MNIST和CIFAR-10数据集的训练验证.随后设计特征参数提取函数完成权重和偏执参数的提取及格式转换,转换为硬件平台可以进行读取的二进制格式.接着使用Xilinx VIVADO HLS设计工具,设计实现图像分类识别系统中卷积神经网络的自定义IP核模块.完成自定义IP核的设计之
针对目标检测算法应用在车辆类型检测的场景中,检测速度较快,但检测精度相对较低的问题,该文对CenterNet算法进行改进.首先,使用ResNet作为主干网对车型图像进行特征提取,并在特征提取网络中引入通道注意力和空间注意力,对不同通道以及不同位置的特征进行权重划分,获取更多需要关注的特征,抑制无用的特征,进而提升车型检测算法的分类及定位准确率;其次,针对小目标车型检测精度不高的问题,将不同尺度车型特征进行融合,更好地提取细粒度车型特征,提升检测精度.为验证结合注意力机制的车型检测算法的有效性,在KITTI