中文地址相关论文
随着深度学习的发展,基于深度学习的命名实体识别抽取过程中,作为基础步骤的预训练模型也愈发受到重视。中文预训练语言模型能够更好......
地址分词是实现地理编码的重要基础。本文基于条件随机场模型对中文地址分词进行研究,实现了中文地址的快速、准确分词。文中先综......
为了解决传统基于规则的方法在处理中文地址分词的过程中,存在的分词效率低、需要人工维护字典且对中文地址中有歧义的字段无法正......
现有的中文地址匹配研究方法集中于对文本特征的研究,忽略了中文地址所包含的建筑特征、地理位置特征、统计特征和行业特征的数据,......
命名实体识别与翻译是自然语言处理的一个基础性的工作,同时也是很多应用中的关键性技术,如信息检索、信息抽取以及机器翻译等。近......
机器翻译简单地说就是用计算机将一种自然语言翻译为另一种自然语言。作为信息的主要承载者,命名实体的翻译质量对译文的整体翻译......
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人......
通过对邮政标准地址进行结构化解析、构建地址要素词典和基于编辑距离算法计算地址相似度,实现了描述性、非规范化、机器难以理解......
地址切分标注是把文字地址字符串切分为地址要素词串,并给出地址要素词串类型的过程。它是地址地理编码(Address Geocoding)过程中......
随着我国经济社会的逐步发展,城市管理问题日益突出。由于地理信息系统的快速发展,利用地理信息系统解决城市管理问题成为了相关部门......
地理(地址)编码技术是GIS中的一项基础性技术,它是将自然语言描述的地址信息,通过地址标准化、地址分词、数据库匹配、空间定位等......
信函自动分拣系统在我国的一、二级邮区中心局普遍使用。系统采用先进的OCR技术识别和人工(单字)补码技术,对六位邮政编码进行识别,......
地址是一个连接广大的人、物、事的关键桥梁,在商业竞争、舆情管理、智慧城市建设过程中发挥了不可或缺的作用。地址标准化能够将......
由于中文地址命名的不规范性和中文的书写特点,造成中文地址的清洗工作异常困难.中文地址是由地址元素和特征字两部分构成的,在对......
由于长期以来我国地址的使用习惯复杂多样,使得电力系统业务部门中的地址数据不规范,阻碍了电力大数据的研发。针对此问题,在分析......
针对当前在电力中文地址匹配中存在部分地址歧义的问题,结合自然语言处理的基本原理,提出一种基于贝叶斯算法的中文地址精确匹配方......
随着位置服务LBS的应用普及,任何人无论在何时何地都可以通过计算机通信网络,方便的查询到目标位置及其周边的信息。中文地址的自......
现有燃气IC卡地址数据与用户管理数据无法直接关联,地址数据复杂以至于常规解决方法工作量大、时间长、投入高,针对此问题,研究地......
数据仓库中脏数据处理的热点问题是识别与消除相似重复记录。针对中文地址类重复信息的处理,提出了一种基于特征字符的分词策略,在......
当前中文地址的分词法主要采用基于规则和传统机器学习的方法。这些方法需要人工长期维护词典和提取特征。为避免特征工程和减少人......
在对中文地址编码技术进行研究的基础上,把中文地址切分为地址要素和特征字,提出了中文地址清洗模型,制定了对中文地址要素的编码......
针对中文地址非结构化、不规范的特点,在构建中文地址模版和中文地址词典等重要知识库基础上,基于中文地址模版引入了中文地址分词......
中文地址具有广泛的应用领域和应用价值,地址标准化是地址编码的基础,而地址编码技术是利用好地址数据的重要一环。本文基于双数组......
在日常生产与生活中,地址是最常见的使用自然语言描述地理位置的参考系统之一。地址地理编码技术被认为是大量业务数据的G IS实现......
随着互联网技术的发展,网页中所涉及的地理信息也越来越多,成为地理信息获取和更新的重要途径。网页中的地址信息是以文本化的形式......
数据清洗中,中文地址类信息对于重复记录的检测起着非常重要的作用。中文地址按照行政归属可划分为五级,通过组建地址信息数据库对......
地址模型是进行地址解析和地址匹配的基础。针对非规范中文地址,在层级地址模型、有限自动机模型的基础上,提出空间关系地址模型,......
该文研究了一种规则和统计相结合的中文地址翻译方法。首先利用区划词典、关键字词典和模式表进行分词及词语类型标注,并根据词语......
中文地址由行政区划地址和详细地址两部分组成,行政区划地址的处理可通过构建地址词典、分词、补充特征字等方式清洗,目前技术较为成......
数据仓库中相似重复记录的识别与消除是数据清洗的热点问题,其中地址类信息对相同实体识别起着非常重要的作用.针对中文地址类信息......
地址解析是地理编码的核心任务之一,而混乱的地址标准、随意的中文地址表达给地址解析带来了极大困难。该文提出一种基于条件随机......
由于中文的内涵多义性和形式多样性的特点,使中文地址长期以来存在着难以标准化的问题,对进一步开展地址定位、区域网格分析和社情、......
地址文本作为描述地理位置的字符串,通过对文本信息的解析可将自然地址描述转化为可被计算机识别的地理空间位置。通过分析地籍数......
针对在传统单节点计算模式下,处理海量中文地址数据时不能直接地进行复杂空间数学计算,并且容易受节点硬件条件限制而出现内存溢出和......
地址关系多样复杂阻碍信息业务发展,严重影响基于中文地址的大数据分析结果。针对此问题,调研地址关联工作并设计了一种三维关系评......