【摘 要】
:
随着计算机和互联网的普及与发展,网络上各种信息资源的数量也在爆炸性的增涨。互联网用户在享受海量数据信息带来便利的同时,也必须面对如何从这庞大的信息中提取自已所需信
论文部分内容阅读
随着计算机和互联网的普及与发展,网络上各种信息资源的数量也在爆炸性的增涨。互联网用户在享受海量数据信息带来便利的同时,也必须面对如何从这庞大的信息中提取自已所需信息的问题。信息检索技术为解决这一问题提供了帮助。然而传统的信息检索大多基于关键词的匹配进行查询,从而忽略了语义信息的作用。这使得检索系统不能充分理解用户的真实查询意图,从而导致检索出来的相关文档集合可能与用户的真实查询意图并不相符,致使检索系统的性能严重下降。因此,如何让信息检索系统充分理解用户查询的真实意图成为了信息检索领域中的一个热点研究课题。本文将知识概念的思想加入信息检索系统,使检索系统在知识层面上更好地了解用户的查询意图,提高检索结果的精确度。具体的工作如下:第一,利用中文维基百科作为额外的大型知识概念库,提出了一种基于知识概念的文本表征方法。该方法将中文维基百科中的每个条目作为一个独立的知识概念,通过比较每个知识概念的描述文本(条目)与待表征的自然语言文本的关联度来衡量该知识概念与自然语言文本的相关度,从而选择出合适的知识概念对文本的语义进行概念的表征。第二,将知识概念表征文本语义的方法融入到传统的信息检索系统中。通过对查询条件与待检索文档集进行知识概念的表征,得到基于知识概念的信息检索。最终,将基于知识概念的检索与传统“词袋”检索方法相融合,并且结合伪相关反馈的方法,提出一种全新的检索策略。第三,实现本文中所提出的检索方法,并且在NTCIR-5中文信息检索测试集上进行测试实验。最终经过实验证明,相对于传统伪相关反馈技术,本文方法在平均准确率(MAP)和前10选的精度(p@10)上都有了进一步的提高,从而证明了本文方法的有效性和实用性。
其他文献
无线传感器网络(Wireless Sensor Networks, WSNs)数据融合(DataAggregation),是指将多个传感器节点的数据进行处理,以消除数据冗余传输,并将融合结果发送到基站的一种技术。通过降
近几年,随着移动互联网技术和地理信息技术的发展,基于位置服务应用逐渐兴起,从而使得空间定位信息的数据量呈现以指数级增长。而在地理位置信息相关的空间数据查询中,RkNN (
系统拥有高的安全性和可靠性意味着工作人员的人身安全能够得到更好的保障,同时也可以提高经济效益和生产效率。容错控制(Fault Tolerant Control, FTC)能在系统发生故障的情
随着中国城镇化脚步的不断跨步,城市人流量及机动车等呈现爆炸式的增长,由此带来的一系列管理问题正给交警部门带来了前所未有的严峻挑战。过去十年,交警部门的信息化建设相
随着多媒体技术的发展,三维重建技术被广泛应用于电影特效、数字城市、三维游戏、人机交互、非物质文化遗产保护等领域。近年来,基于多视图的立体三维重建更是计算机视觉领域
随着信息技术的快速发展,云计算和重复数据删除技术也得到了迅速的发展。云计算凭借其强大的分布式计算能力以及低成本高可靠性的优势,在海量数据处理方面占据主导地位,但是Hado
云计算作为一种新的计算服务模式,通过互联网相连接,利用开放的技术和标准把硬件和软件抽象为动态的资源,对外以服务的形式提供给用户。但作为新兴发展领域,其大部分相关问题
随着互联网技术的不断发展以及网络信息资源的飞速增长,人们对于网络的依赖性越来越强,对网络信息搜索的要求也愈来愈高,而搜索引擎成为了连接个人和网络资源的一个不可或缺的渠
随着互联网和大数据技术的不断发展与应用,产生了源源不尽的数据流。数据流的产生具有无限性、连续性、动态性和实时性,因此对数据流的分析处理要求快速有效地获取结果,以便
多约束QoS组播路由问题是下一代网络发展亟须解决的一个关键问题。对其展开研究具有重要的应用价值和学术价值。多约束QoS组播路由问题被证明是一个NP难问题,所以传统的图论方