基于语义扩展的垂直选择系统的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:kcl770514
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,Internet上的信息量不断地扩增,这其中每天更新的信息就有数以万计之多。要在这样的一个庞大的信息库中找到自己有用的信息需要一个高效的检索工具来完成,而网络资源本身已经从文本格式变得多元化了,面对多领域、多元化的信息数据,出现了领域搜索—垂直搜索。这时,问题也随之而来,如果用户知道自己要检索的信息属于哪个领域,可以直接在该领域内检索。但是如果用户不知道,那么就涉及到当查询出现时垂直归属问题。本文正是在这一问题上进行研究的。本文采用了本体语义扩展,来对用户查询实现查询串上的预处理,对初始查询经过本体语义扩展,扩展为以初始查询为中心的概念集合。对于扩展后的查询集合,设计并实现了利用查询日志建立倒排索引,通过倒排索引对扩展后的查询集合进行修剪。以将查询扩展带来的噪声影响降到最低。最后的垂直选择部分涉及到了两部分文档得分的计算,分别是初始查询的文档得分及扩展后查询的文档得分。初始查询文档的得分通过文档的反转频率及词频来计算得到;而后一部分的查询则利用了查询日志中与查询有关的文档点击频率及顺序,通过抽取这些信息,得到文档的反转频率及文档权重因子,并由此计算文档得分。最后将两部分得分的和值做为文档的综合得分,并将各文档得分的加权值作为领域得分。以此做为垂直选择的依据。实验表明加入本体语义扩展和日志倒排索引的系统,对于垂直选择的准确性有了很大的提高。
其他文献
随着互联网上诸如VoIP、实时视频等服务的部署,端到端的网络性能越发的引人关注,尤其在报文延迟和丢失方面。研究表明,路由协议对故障事件的反应特性,特别是路由收敛时间,对
随着互联网的蓬勃发展,各种新兴网络应用不断出现。这些应用在为用户提供各种网络服务的同时却消耗大量带宽,影响网络关键业务的正常进行。网络应用采用的新型加密方法和动态端
随着计算机技术的发展,嵌入摄像头的移动终端逐渐普及,相应的图像和视频应用也迅速发展,而移动终端屏幕尺寸导致的交互局限性使得图像和视频浏览管理系统更需要人性化、智能
计算机早已经大范围普及,智能手机等多媒体通信终端设备也在迅猛发展,伴随着3G(3rd Generation)牌照在中国的颁发,中国的电信产业也进入了一个全新的时期。人们对于移动通信
随着网络技术的发展,网络规模越来越大,而且网络用户及承载业务种类与日剧增。用户需求不仅仅是网络可达性,而是针对不同业务种类从经济、性能方面提出不同的需求。传统互联
智能交通系统(IntelligentTransportationSystem,简称ITS)是将先进的无线通信技术、传感器技术以及计算机技术等有效地应用于整个交通运输网络,从而建立起一种在大范围内、全
搜索引擎技术给人们的生活、工作和学习都带来了非常大的影响,随着互联网上信息的不断丰富,人们在信息筛选上需要付出的时间也越来越多,如何应用语义匹配技术来优化搜索引擎
包分类问题是路由器、交换机等网络核心设备的关键问题,同时在高速防火墙、高速入侵检测等系统中也具有重要作用。下一代互联网提供的各种增强服务,如不同级别的服务、安全网关
挖掘机称重技术在工程中非常重要,准确的称重保证了货物装载和卸货过程中快速、有效。挖掘机在其工作过程中往往没有在线的计量装置和设备,工作人员的工作量计算常常以车次计量
随着XML (eXtensible Markup Language)数据已逐渐成为网络上信息的主要表示和交换标准,对于XML数据检索的需求越来越多。由于XML数据自身的特性,使得对XML进行数据检索面临