基于自然语言处理的名片识别系统设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zjflxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学字符识别(OCR)在身份证、驾驶证、名片等卡证识别中有广泛的应用。与身份证等样式固定的证件相比,名片样式繁多,信息提取和识别的难度更大。传统的OCR算法大多依赖于人工设计特征,通过模板匹配的方法实现特定场景的识别泛化能力较差,处理名片识别的任务时效果不佳。而自然语言处理(NLP)技术擅长处理不同语境下的语义理解问题,具有较强的鲁棒性和适用性。本文提出了一种使用NLP领域中的文本分类技术作为OCR后端的名片识别方法,对字级和词级的文本特征融合进行了深入的研究,同时探索了神经架构搜索技术和超参自动调优技术在文本分类上的应用。本文的主要研究工作如下:(1)采用了一种结合逻辑规则匹配和文本分类的名片识别方法,解决了歧义词导致的分类结果误差以及长文本截断后的识别不全问题;将OCR识别中的字符层LSTM改为LSTM+CRF,提供了一定的纠错能力。与传统方法相比,整张名片的识别率由86%提升至94%,服务端识别速度为600-800ms。(2)将命名体识别领域中的Lattice LSTM模型用于文本分类任务,在模型端融合字级和词级的文本表征;优化了 Lattice LSTM模型的速度,使其支持mini-batch进行训练和预测;在Embedding层后使用不同卷积核尺寸的卷积层,以获取不同的n-gram信息。与TextCNN相比,识别准确率由97.4%提升至98.7%,速度相较于原始Lattice LSTM有近十倍的提升。(3)基于DARTS设计了一套适用于文本分类任务的搜索空间,通过搜索得到最佳网络结构后,对该结构使用贝叶斯优化算法搜索最佳超参组合。实验证明,经过搜索得到的模型准确率可达到98.84%,逼近Lattice LSTM模型。
其他文献
11月25日,龙亭洒庄文化体验馆举办了一场“最美时节遇见你”的感恩节主题活动,借用了一个西方的节日,在这个优雅皇城风的建筑中向龙亭酒庄的合作伙伴、重要客户以及专家媒体朋友等表示感恩之情.
区块链是近些年来迅速兴起的一种分布式存储技术,它拥有去中心化、不可篡改和开放性等优势,得到社会各界的广泛关注,区块链技术在快速发展中,国家的支持、开发社区的活跃以及各界企业的关注为区块链发展提供了巨大动力。然而传统的区块链在数据的存储与检索上存在很多缺点,如上传速度慢,不支持隐私数据存储,大量数据操作成本高,不支持字段查询等,为了解决问题,本文采用了 IOTA分布式账本技术。IOTA作为第三代区块
11月25日,由中国食品工业协会牵头制定的《益生菌食品》团体标准(以下简称“团标”)在京发布.团标已经通过专家组审查,并于11月8日正式在协会官方网站及全国团体标准信息平台等发布及实施.据悉,团标第一次从行业统筹的层面,赋予“益生菌食品”的定义;第一次从行业规划的角度,明确“益生菌食品”使用的益生菌菌株应当满足的法规依据四方面技术要求,填补了行业市场空白,有望促进益生菌食品消费的高质量发展.
火灾一直是困扰人类社会的问题,给人类社会带来沉重的经济,人身灾难。人类与火灾之间的斗争延续数千年。近年来,随着计算机科学技术的发展,基于特定场景的图像处理技术得到飞速发展。计算科学相关科研人员也把最新图像处理技术应用到烟雾检测,并且发展出一系列切实可行的算法。本文通过分析视频图像烟雾检测国内外研究现状,通过算法创新提高烟雾检测率,降低烟雾误报率。提出了三帧差法与混合高斯背景建模法相结合的方法来确定
近年来,移动无线网络和物联网技术的快速发展,导致网络连接的设备和传输的数据量得以飞速增长,传统的云计算模型逐渐无法满足日常需要。因此,边缘计算这一新型计算模型逐渐成为热门。作为云计算的补充,边缘计算旨在减轻骨干网压力与降低数据的传输成本。但是,在实际的应用环境中,由于边缘业务通常部署在移动通信基站内或附近,导致不同运营商之间存在计算资源的隔离,这会造成一定的计算资源浪费以及用户计算任务无法得到实时
随着移动互联网技术的迅猛发展,用户能够便捷地从网络中获取需要的资源,尤其是多媒体领域逐步成熟,使得用户对文件共享高度依赖。这种依赖对资源共享技术提出了更高的要求,而移动P2P技术成为文件资源高度利用的有效途径,移动终端能够利用自身的闲置带宽和存储空间为其提供物理支持。移动网络中的节点往往不会处于同一位置,会更加频繁地退出或者加入网络进而改变拓扑结构,具有更高的不稳定性和动态性。频繁的节点离开和用户
毫米波通信技术缓解了现有通信带宽的压力,而大规模MIMO与波束成形技术可补偿毫米波的高路损,有效提高通信的频谱效率,因此毫米波与大规模MIMO的结合成为5G关键技术。然而在高动态场景下,终端的快速运动导致信道变化加快,为了保证通信双方链路质量,需要频繁进行波束切换。如何降低切换开销、实现快速波束切换成为了亟待解决的问题。与此同时,超密集网络的应用提升了系统容量,但是小区半径的缩小又进一步增加了波束
智能交通建设是落实我国交通强国战略的重要建设内容。人工智能对科技革命、产业变革、社会变革发挥着极其重要的引领作用,人工智能技术的飞速发展带动了计算机视觉、自然语言处理等技术快速进步,推动智能交通由2.0时代跨越到了 3.0时代。共享化和协同化成为智能交通发展的主要特征,更面向服务和需求响应;数据驱动应用提升、移动互联运营服务,人工智能促进了智能交通产业数字化转型、升级、快速发展,城市智能交通产业生
人工智能技术的发展推动着传统零售行业的不断升级转型,催生出智慧零售为这一新兴零售模式。在智慧零售这一零售模式下,商户可以通过智能设备采集顾客在购物过程中的行为信息,高效地响应顾客购物关注度的变化,优化商品在货架的布局,更加有效地提升零售效率和顾客购物体验。在顾客的行为信息采集过程中,行人的检测与3D定位技术是至关重要的一环。本文主要面向智慧零售场景。基于智慧零售场景下的硬件系统,研究一套可以在多变
“十四五”时期,是我国推动高质量发展的关键时期,扬州也由高速增长向高质量发展转型.其中,扬州特色餐饮小吃以独特的手工技艺、地理优势和历史文化积淀,已成为扬州文化的一部分,是扬州经济的重要组成部分.不过,目前扬州特色小吃的经营者大部分是散落在街头巷尾的摊点,只有少部分是正规连锁餐饮企业,这为扬州特色小吃的高质量发展带来挑战.