基于R树的空间—文本混合索引方法

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:yrrej86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线空间信息的主流存在方式是动态空间信息,而互联网空间信息系统是主要的动态空间信息提供者。空间信息搜索引擎研究在空间信息共享和地理信息服务等方面都有着十分重大而现实的意义。应用于空间信息搜索引擎的地理信息检索技术作为传统信息检索的分支,包括了传统信息检索的所有核心领域,但更关注空间索引和检索。地理信息检索将文本中丰富的地理参考信息作为数据源,显示地理空间或地理范围内的对象,通过对文本的解析和利用,处理与一个或多个空间位置相关的关系信息,为用户提供更多的地理信息服务。本文在总结国内外地理信息检索索引方法的基础上,通过分析文本中的地理参考信息特征,利用基于条件随机场的地名识别方法和空间关系抽取方法,研究适用于根据地理相关性从文本集合中检索相关文本的索引方法。主要研究内容如下:(1)文本空间语义计算模型。分析影响空间语义计算的因素,根据地名出现次数、空间关系、上下文距离和空间分布情况,提出空间语义计算模型,该模型通过分析文本中地名的上下文距离关联度和地名与文本空间语义的关联度,计算地名与文本主题语义的关联度。实验结果表明,该模型能够有效地获取文本所关注的地理区域。(2)基于R树的空间-文本混合索引。在研究与比较空间索引方法和文本索引方法的基础上,分析两种索引方法的算法和特征,探讨空间索引、文本索引的融合方法,并分别构建三种混合索引机制:空间优先索引、文本优先索引以及空间-文本双重索引,比较这三种索引方法在存储、效率等方面的优劣。实验表明,空间优先索引和文本优先索引在效率上高于空间-文本双重索引,但存储空间较大;文本优先索引与空间优先索引相比,查询效率较高,存储空间相差较小(3)系统设计与实验验证。设计并实现了了基于R树的空间-文本索引。该系统包括地名识别模块、空间关系抽取模块,空间语义计算模块和空间-文本索引模块。
其他文献
近年来,新一轮乡村建设运动开始在中国土地上兴起,乡村发展与遗产运动的结合推动了传统村落遗产申报的热潮,“传统村落”成为当下社会广泛关注的热点。文章首先从行政部门、
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
伴随着电子信息技术的发展,电力自动化技术与计算机管理技术、电子通讯技术和网络信息技术等先进技术相互融合,积极地推动着我国电力行业的发展。文章通过电力自动化技术的内
制药工程是通过转型或新建形成的新兴专业,各门课程的教学体系需要规范、完善和提高,生物化学在制药工程专业占有重要地位。通过优化教学内容,采用多样化的教学方法与手段,构
针对天然气长输管道的腐蚀问题,首先对防腐的重要性进行分析,再从增设涂层和采取电化学防护两个角度分别提出多种防护措施,为我国天然气管道的运行维护提供建议。研究表明:在增设
骡鸭又称为半番鸭,是公番鸭和母河鸭的后代。种属间杂交,使骡鸭表现出了较强的杂交优势,其食性杂、耐粗饲,采食量少、抗病力强、瘦肉率在80%以上,肉质细嫩,味道鲜美,是当今世
本实验用国产硅凝胶人工晶体经氢化可的松浸泡,然后在体外让其在生理盐水中放出,用放射免疫方法测定,证明人工晶体本身确实可携带氢化可的松,并可缓慢放出,以达到控制人工晶
官赈、教赈以及义赈是“丁戊奇荒”中基本的三种救灾形式,是晚清赈济体系的重要组成部分。虽然官赈、教赈与义赈在救济的性质、程序及款项来源方面均存在很大差异,但在实际救
当前,随着全国各个区县融媒体中心的建成,新的设备、多种平台、新组的机构,为区县思想宣传工作的开展在技术上提升了条件,也给区县媒体人带来新的机遇与挑战,区县媒体朝着融
2018年度,上海市浦东新区人民检察院深入学习贯彻党的十九大、十九届二中、三中全会和中央经济工作会议精神,以深化司法体制改革为动力,积极服务保障上海"五个中心"建设重大