基于深度学习的多方向维吾尔文区域检测算法

来源 :新疆大学 | 被引量 : 0次 | 上传用户:muyi_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字作为信息交流的重要载体,在人类实际生活中扮演着重要的作用。自然场景文本普遍存在于街道商店牌匾、道路标志、交通标志、车牌和海报等标志牌之中。自然场景的多方向文本区域检测与识别有助于理解自然场景和进行文本内容分析,它主要应用在机器翻译、无人驾驶、文本分类和图像检索等多个领域。但自然场景文本存在的背景复杂、分辨率低、光照不均匀、出现阴影和部分被遮挡等不利因素会给自然场景文本检测与识别的研究带来很大的困难,因此很有必要对自然场景中图像文本的检测与识别进行深入研究。自然场景文本拥有字体众多、大小各异、排列方式多变和多方向等特点,说明了自然场景文本检测还具有一定的挑战性。本文鉴于自然场景文本的复杂性、位置的随机性和方向的任意性,提出了基于深度学习的多方向文本检测算法来提升文本检测的效果和精确度。本文针对自然场景多方向文本研究提出了改进的多方向文本区域检测算法Yolo(You Only Look Once)。自然场景多方向文本区域检测算法与Yolo原模型相比,具有更好的特征学习能力和多方向文本检测能力。该文本检测算法在人工拍摄收集的自然场景维吾尔文数据集、多种语言数据集和公开的多方向数据集上使用了K-means方法并重新优化聚类候选框,通过生成3种固定宽度的预设锚点来实现文本区域和背景的分类;然后对候选框的高度和宽度进行位置回归,近而形成固定宽度的矩形预测框;之后通过预测框的置信度、不同的连接算法、文本左右偏移量和高度差距离的处理等步骤,在多方向文本上生成倾斜固定宽度的矩形检测框;最后使用多方向文本融合算法来融合预测框并检测多方向文本区域,达到减少对角线上出现多余背景的情况,解决了原模型水平检测的局限性。为方便网络管理和文本图像处理,本文设计了基于深度学习的多方向文本检测系统。该检测系统界面直观、操作简便且具有很强的实用性。本文的实验主要在多方向维吾尔文数据集、多种语言数据集和公开的多方向数据集上进行,其准确率达到了77%、58%和64%。实验结果表明,改进的文本检测算法在自然场景多方向维吾尔文场景文字区域检测任务中具有很好的鲁棒性和应用性。
其他文献
许江先生作为中国著名油画艺术家的代表者之一,在艺术与文化界域建树颇佳,其表现主义艺术在中国当今艺界也代表着最新成果,在国际上其艺术创思与叡作也同具影响力。画作中构意循思与艺术语言往往令观者深感各中诗言与深情间相宜并蓄、以诗情入绘写的创作规律。身为一名艺术工作者,多年来许江先生创作颇丰,在中国接纳西方现代思潮与艺术表现形式的步调中,于共生撕磨又相互冲击的历史阶段中,他理性看探并勇毅前行,终究成全了他
近年来,随着计算机技术、多媒体技术、人工智能技术等诸多技术的迅猛发展,图像识别技术的应用越来越广泛。图像识别的难点就在于图像数据本身具有很高的维度,要实现图像识别
语境对理解语篇语义具有重大意义,离开了话语语境,语言将无法解释。“语境”概念包罗万象,不仅涉及到上下文、语言知识,还包括交际发生的时间、地点、方式、话题、交际者的身
随着石油工业的不断发展,海底油气管道已经广泛的应用在石油和天然气的开采以及运输中。在海底油气管道的安装以及输送过程中,由于海上作业、平台操作、锚定处理、拖网活动、海上运输船只等第三方的人类活动,可能会经常发生由坠落物撞击管道而产生的各种意外事故,使得海底管道管壁产生较大的凹痕或者较大的裂缝。海底油气管道一旦发生失效,不仅可能会影响人类正常的生产经营活动,造成巨大的社会经济损失,甚至会严重污染海洋生
当今日益严重的生态环境和人类不利于环境的消费行为不仅对人们生活造成困扰,给自然界带来极大损害,也与人们对幸福感的日益增长的追求相违背。环境问题不仅给人们自身生命健康造成了威胁,也大大降低了人们的幸福感。根据以往研究表明,亲环境消费行为对幸福感具有重要影响,但亲环境消费行为对幸福感影响的具体机制及作用条件还有待深入探讨。因此本研究基于消费者视角,对于亲环境的消费行为对幸福感的影响进行研究探讨,从而改
新一代信息技术产业作为我国的战略性新兴产业之一,其发展对我国整体产业结构的调整以及经济发展方式的转变具有非常重大的意义。随着市场竞争加剧与技术变革的升级,单一的技术创新等手段已无法满足组织维持以及提升竞争优势的要求。业界和学术界普遍认为商业模式作为技术商业化的重要工具,已逐渐成为企业获取可持续竞争优势和提升绩效的重要途径与中坚力量。然而新一代信息技术企业商业模式与企业绩效关系及其影响因素仍未得到充
目的:探讨肥胖、高雄状态对多囊卵巢综合征糖脂代谢及甲状腺功能的影响。方法:随机选取2016年1月-2019年12月我院就诊的多囊卵巢综合征患者213例作为观察组,随机选择同期月经规则,卵巢功能正常,且年龄匹配的健康女性185例作为对照组。其中观察组根据BMI分为肥胖型PCOS患者55例,非肥胖型PCOS患者158例;根据雄激素水平或高雄激素临床表现患者分为高雄型PCOS患者105例,非高雄型PCO
结构加固是延长结构服役寿命的有效手段之一,目前的加固方法主要有碳纤维(CFRP)板加固和黏贴钢板加固等。这些方法在短期内具有良好的加固效果,但在应对已加固桥梁再次承受连
三维视觉技术能极大增加自动化生产的柔性、智能化、提升生产效率和降低工人劳动强度。在工业自动化生产过程中,工件的自动化上料是必不可少的工序。本文以三维视觉系统为研究对象,研究了三维视觉系统的标定方法与散乱物料的识别及定位方法。通过标定三维视觉系统与处理3D视觉传感器获取的图像实现散乱物料中工件的识别、定位及抓取,完成的主要工作如下。研究三维视觉系统的标定,提出了一种非接触的三维视觉系统手眼标定方法。
化学链重整制氢是当前最具有潜在优势的新型制氢技术,但这一制氢技术对载氧体种类的选取有较高要求。通式为ABO3或A2BO4的钙钛矿型复合载氧体,具有较高氧化还原催化活性和耐