【摘 要】
:
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLS
【机 构】
:
自然资源部城市国土资源监测与仿真重点实验室,南京师范大学虚拟地理环境教育部重点实验室/江苏省地理信息资源开发与利用协同创新中心
【基金项目】
:
自然资源部城市国土资源监测与仿真重点实验室开放基金项目(KF-2019-04-025),国家自然科学基金项目(41631177),国家重点研发计划项目(2017YFB0503602)。
论文部分内容阅读
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异
其他文献
为了持续发挥工业生产对大英县域经济的促进作用,本文通过分析大英的三次产业结构,调查企业生产经营现状,总结了大英工业强县战略取得的三大成效,剖析了今后面临的四大制约因
对建筑工程中的防渗漏技术进行分析,总结防渗漏施工的必要性.认识到建筑工程项目中防渗漏施工中存在的问题,核心是根据引发问题的原因细化施工管理方案,稳步提升行业的竞争力
随着经济的发展和社会的进步,环境土壤问题日益突出,对其的保护和治理是现阶段环保工作的重心.基于此,本文按照土壤污染状况调查的流程对某违法炼油厂污染地块进行初步和详细
为了解决医疗器械研发过程中的各种问题,本文就临床工程师在医疗器械研发中的作用进行研究,提出明确临床需求、寻求研发问题、提出改进意见以及做出应用评估等解决策略,以期
针对移动互联网技术在无线通信网络中的具体应用,需要结合当前我国基础通信网络设施的部署现状,采取有针对性地改进措施.为此,本文对5G无线通信系统进行研究,对关键技术进行
分析发电厂电气设备的存在问题和检修方法,及时排查电力设备中可能存在的故障和不稳定因素,同时按照检测结果信息数据及时进行维修,保证电气设备的正常运行.降低电力设备故障
为了解决仪表自动化应用的发展趋势和问题,本文以仪表自动化的控制优势为基础,对仪表自动化控制进行分析,近年来自动化发展有快速增长的趋势.本文中提出了仪表自动化优化的主
综合医院建设项目环境影响评价(以下简称环评)要点在医疗废水、医疗废物、以及外环境对医院的影响.本文通过介绍综合医院建设项目的选址,医疗废水、医疗废物对周边环境的影响
随着经济飞速发展,城乡居民的生活水平不断提高,汽车保有量成持续快速增长趋势,居民对住宅小区停车位的需求量也越来越大,然而我国的《物权法》及《房地产法》等相关法律政策
北部湾城市群作为我国西部陆海新通道、海上丝绸之路的重要门户,地理位置极具战略性和特殊性,精准谋划北部湾城市群交通一体化发展蓝图,对于北部湾城市群向国家级城市群迈进具有重要战略意义。该文以北部湾城市群综合交通路网为研究对象,基于空间句法,对北部湾城市群路网拓扑性和节点城市交通控制力强度进行多尺度形式一体化评价,并结合GIS高级空间统计、交通需求量预测以及城市研究重力模型,进行城市群功能性特征指标量化