面向网页文本的地理要素变化检测

来源 :地球信息科学学报 | 被引量 : 0次 | 上传用户:jcd041991
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地理要素变化检测已成为国家地理信息“十二五”规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。研究成果表明,以网页文本为数据源的地理要素变化信息获取方法,能提供一种快速检测地理要素变化的新途径,与实地调绘和遥感影像检测等方法结合应用具有较好的优势互补性,可作为有力的辅助手段解决地理要素的持续更新和实时更新问题。 The detection of the change of geographical elements has become an important part of the national geographic information “Twelfth Five-Year Plan” and the national geographical survey. Web page contains a lot of geographical elements of information, in particular, news, government, social networking sites such as web site frequently updated text, changes in the detection of geographical elements to provide a positive data source. This paper aims at the characteristics of language description of the geographical elements in Web page text, constructs the semantic knowledge base which expresses the change of geographical elements, designs the web crawler which combines the search engine and the general theme, and achieves the efficient retrieval of the relevant web page texts. Conditional random field model, we extract the change information of geographical elements in the web page text, including the geographical element name, location (place name), time and attribute. The experimental results show that the web crawler designed in this paper has a high ability of retrieving the relevant webpage texts, and the accuracy of extracting geographic information changes can reach more than 70%. However, the completeness of the semantic knowledge base has a great influence on the information extraction performance. The research results show that the method of obtaining geographic change information using web page as a data source can provide a new way to quickly detect the change of geographical elements. It can be used in combination with field mapping and remote sensing image detection to achieve better complementarity , Which can be used as a powerful aid to solve the problem of continuous updating and real-time updating of geographical elements.
其他文献
合理使用是著作权法中为平衡著作权人的个体利益与公共利益而创设的一种制度。图书馆只有深刻解读图书馆合理使用的条件,正确掌握合理使用的基本原则,创新图书馆合理使用制度
目的探讨依达拉奉联合尼莫地平对急性脑梗死患者神经功能的影响。方法选择2012年12月—2014年2月山东省德州市中医院收治的急性脑梗死患者78例,随机分为对照组和治疗组,各39
为对高血压脑出血的急诊抢救现状进行研究,并分析其发展情况,笔者对已有的临床资料进行大量的阅读、分析,并对不同程度高血压脑出血的抢救现状进行分析研究,具体综述如下。
目的探讨经阴道彩色多普勒超声联合尿妊娠试验早期诊断异位妊娠的价值。方法回顾性分析2005年8月—2011年8月随访的临床症状疑似异位妊娠、尿妊娠试验阳性或弱阳性、经阴道彩
文章介绍了临界底坡和临界水深在工程设计中的应用范围,临界水深和临界底坡计算,实例应用。 This paper introduces the application scope of critical slope and critical
结核病很难治愈,需要至少6个月的使用多种抗生素的治疗。少数菌体能够耐受抗生素,在感染对象肺部长期存在,但细菌生存仍然需要一些代谢活动。我们在豚鼠(其可利用缺氧,并且发
Hepatitis C virus(HCV)infection represents a major health issue worldwide due to its burden of chronic liver disease and extrahepatic manifestations including c
GB系列止水新材料◆GB系列止水材料已在近百项大中小工程成功应用,并经20多年的工程实践检验,其安全可靠性是用户信心的保证。◆GB系列止水材料适用于高面板堆石坝混凝土面板
Understanding the dynamic traffic and usage characteristics of data services in cellular networks is important for optimising network resources and improving us
通过对文献计量学三定律相似性的解析,探究了情报系统的自组织结构现象、产生机制以及它们共同的结构特征。 By analyzing the similarities of the three laws of bibliome