古地名及其地理位置关系获取的研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:haha7289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用计算机通过某些方法自动地从海量的网络信息中抽取出我们感兴趣的有价值的形式化的知识,即文本挖掘(Text Mining),已成为人们迫切需求的一项技术,而且已经成为人工智能研究领域的一个热点问题.其中,命名实体识别 (Named Entity Recognition,NER)是文本挖掘的一项必要的基础工作和关键技术.本文从以下几个方面对古地名及其部分地理位置关系获取进行研究. 1.句型的设计及实现.本文提出了一种基于句型的古地名及其地理位置关系获取的方法,进而设计一个基于该方法的识别系统.我们给出了句型设计的思想、表示方法及其匹配结果的生产方式.在这里,我们根据获取地名相关句型的特点,对句型库进行了分类,这对古地名及其部分地理位置关系的获取和验证都起着重要作用. 2.古地名及其部分地理位置关系的获取及验证.依据上述句型的设计,我们获取自由文本中的古地名及其地理位置关系.接着,我们提出基于地名构词法和特定验证句型的古地名候选词的验证方法.同时,结合古今地名对照知识库相关规则,对获取的部分地理位置关系进行验证. 3.古今地名对照相关知识学习.依据系统获取的古地名及其部分地理位置关系,我们探讨从中学习古今地名对照的相关知识.其中包括:古今地名对照释义中知识的学习、今溯古地名知识的学习及古今地名对照知识库的构建和验证.@2 4.句型及系统的总体评价.我们利用测试语料对系统进行实验,依据句型准确率、精确率和召回率等指标来评价句型及整个识别系统.从而,提出改进和完善句型及识别系统的有效方法.
其他文献
作为一种基于无监督学习的知识获取方法,文本聚类是文本挖掘领域的一项重要技术。文本聚类在文档组织、信息检索、话题检测与跟踪等诸多领域都得到了普遍的应用,受到研究者的广
目前,互联网综合实验验证主要基于运行网络实现,周期过长,投入过大,一旦失败代价极为沉重。而且基于运行网络利用测量分析方法进行的实验验证面临诸多难以克服的挑战,如网络行为的
学位
软件演化已成为软件生存周期中最重要的形态之一,对软件演化过程的研究成为了软件演化领域研究的热点。由于软件演化过程具有迭代性、并行性、反馈驱动等特征,因此更有必要对软
近年来,无线传感器网络由于其巨大的应用潜力成为人们关注的焦点,而其QoS保障技术是无线传感器网络商业化应用的必要条件。本文针对无线传感器网络传输相关的QoS保障技术进行了
学位
传统以内置磁盘计算机为主体的分散存储模式,虽然在一定程度上满足了人们对系统扩展性和开放性的要求,但在动态性、易用性和管理性等方面存在明显的缺陷.国家高性能计算机工
E级高性能计算系统的节点规模将达到十万量级,高性能互连网络在性能、扩展性、成本和功耗等方面都面临严峻挑战。在成本和功耗约束条件下,单一追求性能最优的设计方法不再适用,
面对日益复杂的设计要求和有限的设计时间,如何有效地进行性能分析评估以指导完成SoC的设计,是摆在每一位SoC设计人员面前的问题.仅仅依赖直觉,经验和一些基础规则来完成SoC
地理信息系统(GIS)是人们将计算机引入地理相关学科后出现的一项新的技术。随着计算机技术的发展与普及,GIS技术也逐渐成熟。一方面,利用二维的图形图像描述与分析现实世界已经
基于视频的人体运动分析和理解是近年来计算机视觉十分活跃的一个研究方向,不仅具有重要的学术研究意义,而且有着广阔的应用前景.人体运动分析技术在智能视觉监控、高级人机
无线传感器网络是由大量静止或移动的传感器节点以自组织多跳的方式构成的网络,其目的是协作地感知、采集、处理和传输网络覆盖区域内感知对象的监测信息。传感器网络具有分布
学位