本地搜索领域POI缩略词词典的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:beehxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的日益信息化,人们越来越强烈地希望能够通过计算机获取到大量的信息,尤其是对生活信息的获取。人们有强烈的愿望通过自然语言语句的查询搜索到和他们的什么密切相关的信息。本地搜索就是一个致力于帮助人们实现对生活信息检索的技术,可能检索到诸如餐饮、娱乐、金融机构、旅游景点、地标建筑、加油站,甚至是停车场的信息。这个技术极大的丰富人们的生活,使人们足不出户就可以获取大量的生活信息。目前的本地搜索技术的主要搜索内容是一个被称作为POI的信息。POI(point of interest)的全称为地理兴趣点,顾名思义,就是令人感兴趣的点。每个不同的POI都分布在地图上不同的坐标点上,而本地搜索的任务就是根据用户输入的检索语句将可能的POI输出出来。为了能够满足用户的需求,就需要各种不同技术手段提取检索的准确率。但是由于存储在数据库中的POI地理兴趣点一般都为该信息点的全名,所以名称一般都比较长,而用户在输入查询语句时有时并不愿意使用全称查询。一般会选取关键字查询,或者会使用该信息点的缩略词查询。对于关键字查询,目前已经有较好的办法实现,但是对于缩略词的查询有时确无能为力。因为大量的名称缩略词和它所指的POI之间存在复杂的关系。一个有效的办法就是将这些存在复杂关系的名称缩略词和它所指代的POI之间所构成缩略词关系构造成缩略词词典。这样在进行搜索时,可以首先判断用户查询是否是一个缩略词表达形式。本文首先讨论POI信息点简介等资源的获取,随后介绍条件随即场的相关内容,并展示通过条件随机场模型来对这些资源进行命名实体识别,最后将这些提取出来的命名实体和POI信息点进行模式匹配,最终从这些资源中提取出缩略词词典的信息。实验表明通过这种方法提取出来的缩略词具有很好的效果,并且具有很好的现实意义。可以通过这样一个提取缩略词的机制扩充缩略词的词库,并最终提高该类词本地搜索的准确率。
其他文献
二十一世纪科技不断发展进步,随着IP网络和现有电信网络(PSTN,ISDN,移动网等)的融合,必然需要在IP网络上传输现有电信网络中的SS7电话信令。IP网络和电信网络是两个独立的网
在“地球村”高速发展的推动下,智能视频监控将迎来大数据时代,如何在每天产生的大量的数据中,提取有效的信息和服务,是智能视频监控必须面对的巨大挑战。多目标检测和跟踪技
随着计算机网络技术的高速发展,计算机病毒越来越猖獗,给人们带来的危害越来越大,因此如何对计算机病毒进行防治对于计算机安全来说就显得非常关键。 本文分析了计算机病毒的
数据库技术从20世纪80年代初开始,就得到了广泛的普及和应用。伴随着近年来数据量的急剧增长,以及数据仓库和Web等新型数据源的日益普及,人们面临的主要问题不再是缺乏足够可
目前高校在学籍管理、成绩管理、师资管理等方面积累了大量的数据资源,如何发挥数据挖掘技术的优势,将数据挖掘技术应用于高校的教学管理中,成为了当前国内外关注的学术热点和前
随着计算机网络的普及和分布式计算的应用,保证网络安全愈加重要。研究表明,70%以上的网络都是很脆弱的。网络漏洞管理系统在特定范围内扫描网络中各个主机存在的各种漏洞,并
因云计算的兴盛与普及,越来越多的企业选择引入云计算技术改造原有的企业数据中心,一些企业则开始租赁大厂商的云服务。学术界和业界研究人员投入了相当多的精力,专注于提高
原子团簇的基态结构研究是当今物理学和化学中的一个重要的前沿课题。团簇的诸多性质都依赖于其基态结构,但是通过实验方式获得团簇的基态结构存在很大困难,于是学者们依据实验提出了一系列适用范围不同的势能模型来描述团簇中原子的相互作用,借助理论化手段,利用现代计算机技术,对原子团簇的结构进行模拟研究,以求得团簇的基态结构。现今用来描述原子间相互作用的主流势能模型有经验势、基于第一性原理的自洽势和紧束缚势。应
我国在欧洲的DVB、MHP等标准的基础上制定了相关的数字电视标准。在2003年,我国确定了《数字电视中间件技术规范》标准的草案,目前正处于审批阶段,而在该草案中Java技术被列
科学计算可视化是20世纪80年代后期提出并发展起来的一个新的研究领域。它的应用范围十分广泛,几乎涉及自然科学及工程技术的一切领域。计算流体力学就是科学计算可视化中重