网页文本中POI信息获取方法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:niannian827
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和移动通讯技术的迅速发展,空间位置服务行业需求急剧上升。空间位置服务的质量很大程度上取决于兴趣点(Point of interest,POI)信息的数据量、准确性和现势性。POI信息包含:名称、类别、位置信息和属性等。POI采集主要有专业公司生产和VGI大众采集两种方式,前者生产效率低下,后者管理起来较为困难,而且均存在POI信息的位置描述尚不完善的问题,普遍缺乏相对位置和绝对位置描述。目前网络资源发展迅速,其中包含了大量的POI信息,成为POI信息的重要来源。从网页文本中抽取POI信息成为一种新型的POI信息采集手段。本文重点研究网页文本中POI信息的获取方法,为大规模获取POI信息探索了一条新途径。主要内容包括以下几个方面:  (1)基于主题网络爬虫的POI相关网页抽取:在总结POI各类别的名称关键字的基础上,利用搜索引擎将POI信息的类别作为主题检索词进行URL聚焦再用网络爬虫技术爬取这些空间敏感网页实现各个类别的POI相关网页的获取。  (2)网页文本中POI信息获取采用条件随机场模型的方法来识别出非嵌套简单地名以及POI名称信息。在分析中文地址模式的基础上提出?  
其他文献
近几年在各地的中考试卷中,频繁出现有关二次函数的图象与系数之间关系的试题.此类问题由于题设的部分条件蕴含在函数的图象之中,给我们的分析思考带来一定难度,但它能较好地考查二次函数的相关知识.该类试题常以选择题、填空题的形式出现,解题的关键是准确分析二次函数解析式中有关的量与函数图象的形状、位置的关系,正确地进行数与形的转换.现以2013年中考试题为例加以说明.  一、抛物线y=ax2+bx+c(a≠
公路地质灾害数据包括反映区域地形地貌、交通、气象等情况的基础地理数据,反映区域经济、人口等状况的社会经济数据,反映区域地质构造、水文地质、地层岩性的地质数据,以及区域
山东黄河段位于黄河下游,是典型的“地上悬河”。受大陆性季风气候的影响,在每年的3-4月、6-8月、9-11月、12月至翌年2月容易发生春汛、伏汛、秋汛和凌汛,对山东黄河段的经济发
党的十五届四中全会《中共中央关于国有企业改革和发展若干重大问题的决定》中指出:“坚持党的领导,发挥国有企业党组织的政治核心作用,是一个重大原则,任何时候都不能动摇
武汉城市圈在中部崛起战略下应运而生,给武汉城市圈的重要组成成员咸宁带来了发展契机。而咸宁的发展不仅要借助外部力量的推动,更需要发掘自身的潜能使其内部力量不断壮大。咸
石漠化是喀斯特地区较为严重的生态问题和环境问题,通常会导致基岩大面积裸露,地表的土层变薄,土地生产力严重退化,生态系统自我恢复能力减弱,各种灾害频发。石漠化是区域日益增加
主要对智能变电站中的电子式互感器、真空度传感器和短路接地故障传感器的技术特点、应用场合和适用范围作了论述,指出电子式互感器具有无磁饱和、动态响应好等特性,但其可靠
植被是联结大气、土壤和水分的自然纽带,而植被类型作为影响流域赋水强弱的主要因素之一,即植被的变化情况可以从侧面反映水资源丰欠的变化。本文利用2005-2011年间美国USGA发
土地利用转型是当前土地利用变化研究的热点和前沿。随着我国经济的快速发展,城市化进程导致城市人口数量的不断增多,经济发展与生态环境之间的矛盾越来越突出。开展典型地区土
高分辨率遥感影像能够详细的描述地面物体的细节信息和复杂程度,与中低分辨率遥感影像相比,其在地物纹理、形状、光谱特征等方面都有更出色的表现,因此被广泛应用于地物分类、地表观测、自然资源动态监测等领域。而针对中低分辨率遥感影像的基于像元的分类方法和浅层机器学习算法无法满足高分辨率遥感影像的分类需求,如何使高分辨率遥感影像的分类效率和精度得到提高,已成为当前研究的热点。随着计算机性能的不断提高与人工智能
学位