路网空间中面向时间区间的空间文本查询研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:resident_2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基于位置的服务和地理定位技术的快速发展,产生了越来越多具有位置信息和文本描述信息的空间文本对象。空间文本对象的相关查询,在时空数据库领域中成为了人们研究的热点,一些研究成果也应运而生。然而现有的大多数研究工作主要考虑空间文本对象的空间邻近性和文本相关性,忽略了其具有的时间信息并且仅适用于欧式空间。而在很多实际的问题中,空间文本对象和查询均处于路网空间中并且用户需要考虑更多的信息,如开放时间,价格等来做出更好的选择。现有的研究工作和相关技术不能有效地利用时间信息来满足用户的查询需求。本文研究了路网空间中面向时间区间的空间文本查询(TASK),查询中除了具有传统的空间文本约束,同时也考虑了空间文本对象的时间信息。本文的主要工作有以下三点。第一,本文提出了关键字热值的概念,通常是文本属性的值,例如关键字频率,价格,评分等。并针对TASK查询设计了一种新的相似度函数,该函数同时考虑了空间,文本和时间三个维度的信息,从而更好地评估空间文本对象和查询之间的相似性。第二,设计了一种新的层次索引结构GI-tree,将空间文本对象有效地组织起来。其中,距离矩阵(DM和SC)记录位置信息,关键字信息列表(KAI)记录了文本信息、文本属性值以及时间信息。提出了一种相似度函数来计算GI-tree节点与查询之间的分数。基于此,提出了基于最佳优先搜索策略的基础查询算法BM来处理TASK查询。实验结果表明,提出的算法是有效的,具有一定的应用价值。第三,为了提高查询效率,设计了一种由SBT-trees和GI-tree构成的新型混合索引结构SGI,它通过同时利用空间、文本和时间信息对不满足查询条件的空间文本对象进行剪枝。利用空间文本对象具有的时间信息,将对象有效地组织在相关的SBT-trees中。在此基础上,设计了高效的剪枝算法,缩小了搜索空间,提出了更合理的相似度函数来估计GI-tree节点与查询之间的分数,并通过启发式搜索策略来进一步优化,设计了一个高效的搜索框架来获得top-k的结果。在真实数据集上的实验结果表明了 SGI索引和相关算法的高效性以及可拓展性。
其他文献
写作能力是现代人应具有的基本素养,而初中阶段是系统学习写作知识,形成写作个性的关键时期,对个人的终身发展和社会发展都至关重要。但在体校,许多初中生的写作状况着实堪忧
互联网产业的飞速发展推动了移动多媒体技术的日渐成熟,随之而来的是移动终端的数据传输业务越来越多,如何保护数据传输过程的安全成为无线通信技术研究的热点。为了解决信息
图像时代的到来,不仅意味着人们的日常生活被形形色色的图像所包围,还表现在人们思维方式与认知方式由传统的语言文本向图像文本转变。图像作为一种以信息传递为表征的价值符
本论文主要由三部分组成:第一部分简单介绍了进行电子结构计算以及光解离反应机理研究所使用的理论方法;第二部分详细介绍了苯硫酚光解离反应机理的研究;第三部分简单介绍了
二语研究者们对如何修改二语习得者在习得目标语言时所犯的错误一直很感兴趣,Truscott(1996)最初认为书面纠正反馈是无效的,并且可能对第二语言学习者有潜在的危害。与Trusco
在全球化的发展趋势下,国与国之间的交流日益密切,培养具备跨文化交际能力的优秀人才日渐重要。2017版《普通高中英语课程标准》中明确提出的英语学科核心素养已经被科学地细
目的:随着人才培养模式的转变,以及协作式医护模式的发展,近年来医学教育积极提倡跨专业合作学习,且逐渐成为医疗体系中不可或缺的一部分。本研究通过了解医学院校学生跨专业
由于互联网的全面普及,互联网上的文本数据呈现指数级别的增长。这些文本数据来源于新闻、博客、微博、论坛等平台。如何让计算机更好的理解自然语言文本是目前的研究热点。
“一带一路”倡议令中国在世界上有更多的伙伴,与此同时,与这些国家间的交流需要语言教育跟随世界脚步,为构建人类命运共同体储备人才。文化意识是学生发展核心素养和2017课
议论文写作是高中英语教学的重要组成部分。然而,由于受到现有写作能力和写作焦虑的影响,高中生往往在议论文写作中表现欠佳。有学者提出对比续写可提高学生的议论文写作能力