地理数据文本库上Top-k模糊查询技术研究

来源 :第31届中国数据库学术会议 | 被引量 : 0次 | 上传用户:huai0407
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络变得日益普及,互联网上生成的数据越来越多地与地理信息联系起来,包括带有地理标签的微博、社交网络的登录信息以及信息点(POIs).根据报告显示,53%的移动搜索以及20%的谷歌搜索与地理位置相关.同时越来越多的研究开始关注如何对这些带有地理信息的数据进行有效地检索.现有的方法是对这些带有地理标签的数据进行关键字的匹配,但这种匹配仅局限于精确的匹配,不能支持模糊查询.当用户由于疏忽而键入错误的查询关键字时,系统可能按照错误的输入而输出错误的结果.基于这种情况,对Top-k关键字模糊查询进行研究:给定一组带有地理信息以及文本信息的数据(地理文本对象),检索出与查询关键字相关性最大的k个数据.首先定义相关性函数,综合考虑关键字匹配程度以及距离因素,数字化地计算出数据与查询的相关性.并基于一种"棋盘"索引结构,以查询产生的地点为起点,向四周扩散地检索数据.理论分析和实验结果表明,该方法可以快速有效地处理地理数据文本库上的Top-k模糊查询,并具有良好的可扩展性.
其他文献
蔚然的烟瘾,是在不知不觉中染上的。最初只是好玩,一帮姐妹去迪厅玩时,各叼了一支烟,蔚然也不好太另类,便也偶尔跟着吸着玩。开始有了烟瘾,是在 Cigarette smoking is uncon
随着大数据时代的到来,数据正呈现量大、类型繁多、价值密度低等特征,因此快速且有效地发现异构数据中有价值的信息将极具挑战,其中,构建支持多种类型数据的索引是主要的研究
会议
抽取数据的不确定性使得为why-not问题提供数据溯源解释变得越来越有必要.尽管已经提出了一些模型来得到why-not问题的最小化解释,但是当数据量很大时,这些模型的解释效率就
会议
港口、 腹地、 港口供应链、 港口—腹地供应链与西部陆海新通道及其建设深深地“镶嵌”在一起.文献梳理进一步表明,港口—腹地供应链的合作或管理与西部陆海新通道的建设具
技术发展趋势 回顾过去一年网络应用的发展,我们不难看到,以IP为核心是网络技术发展的重点。包括普通数据、视频和话音在内的信息表达形式及相关的应用,已经开始聚集到交换
随着数据爆炸式增长,如何及时有效地对大数据进行分析成为一项研究热点.连接算法在数据分析、数据库查询等众多领域具有广泛应用.非等值连接中的范围连接经常用于查找连接属
会议
“九七”日近,数代中国人翘首以盼的香港即将回归祖国怀抱。本文拟对香港名称的来历作一介绍,以期加深人们对这颗历经跨世界沧桑的“东方明珠”的了解和认识。 Recently, on
2020年初暴发的全球性新冠肺炎疫情对全球众多产业链造成了重大冲击,并引发了系统性的断链风险.文章通过研究具有代表性的国家和企业疫情中的供应链实际策略和供应链策略变化
江苏电力工业发展的历史,如果从1897年苏州苏纶纱厂安装自备直流发电机组算起,至今已有近百年的历史。这100年来,江苏电力工业从无到有,从小到大,成绩喜人。特别是建国后的4
事业单位人力资源管理工作开展对强化单位内控管理发挥着重要作用,激励机制能够提升人才竞争意识与工作积极性,是人力资源管理工作开展的一部分,还需要加强这方面的管理工作.