需求概念图导引下的网页检索结果分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lllljx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代社会,网络是信息的重要来源,而搜索引擎是网络资源的主要入口。能否快速准确地获取所需信息很大程度上取决于搜索引擎性能的优劣。目前的搜索引擎大多基于布尔模型、向量空间模型和语言模型,将需求和网页视为离散的词汇集合,只考虑词汇的共现。这些模型割裂了词汇间的联系,忽略了文本蕴涵的语义信息,带来大量噪声,导致精确度偏低。针对上述问题,学者们提出多种基于语义的检索模型。  基于内涵语义的概念图模型试图构建文本的概念图,还原文本所表达的概念并重建概念间的关联。由于概念图能够较好地表示文本语义信息,可以将概念图作为文本的语义表示方法,应用到语义检索。  本文的工作包括四个部分。第一部分提出基于概念图的网页检索结果分析框架,并在该框架下对若干实例进行人工分析。  第二部分在需求概念图导引下对网页摘要进行标引生成精简摘要概念图,这种方法避开网页标引,关注相对简单的摘要标引,自动化程度高且不依赖完全句法分析。  第三部分分析网页检索的错误结果归纳错误类型,提出两种基于需求概念图和精简摘要概念图的方法对网页检索的错误结果进行过滤。实验表明同时使用两种方法能够有效提高检索精度。  第四部分试图改进过滤方法使它们能够应用于网页检索结果排序,是对需求概念图导引下的网页检索结果排序的有益尝试。  本文探索在需求概念图导引下对网页检索的结果进行分析,希望能够为基于概念图的语义检索模型的研究提供一些思路。
其他文献
教授主页信息管理与发布系统是中国地质大学(北京)数字校园建设中的子系统。原有的教授主页信息管理与发布系统是基于ASP技术实现的,其代码执行效率不高,由于运行在IIS服务器
为了获得一个符合日益复杂要求的服务组合解决方案,大量的精力投入在服务选择和服务组合的研究中。但由于服务组合问题的难解性,在这个领域任然存在一些待攻克的技术难点,本文主
无线传感器网络的研究始于20世纪90年代,是当前国际学术界和工业界的研究热点内容。该技术具有广泛的应用前景,已经或正在被广泛应用于军事国防、环境监测、智能家居及护理、灾
家庭信息化程度正随着3C行业的快速发展而逐步地提高,网络化、智能化的趋势已经成为数字家庭产业的共识。数字家庭网络化的目的在于通过建构完整的家庭网络架构,进行内部设备
近年来,随着社交网络、微博等新兴网络应用的普及,因特网中的信息传播规模呈现指数级增长。在海量的数据中,如何找到网络里最有影响力的节点成了数据挖掘领域和社会网络分析领域
目前,Internet的高速发展使得网络上的信息日益膨胀,Web已经成为人们获取信息的重要手段。为了使人们从庞大的网络信息中找到自己所需要的信息,就需要对网络上的信息进行组织和
超高频射频识别技术(简称RFID技术)作为物联网中的一项关键技术,已经广泛应用于物流、安保、后勤保障等行业中,同时被视为条形码系统的替代品。但是因其计算能力较弱,传输完全依赖
近年来,移动互联网正逐渐发展起来,而移动设备也正变得越来越普及。因此对移动应用程序,特别是那些集成多样信息的应用有着很大的需求。而Internet开放网络环境中存在大量包含信
随着电子产品的普及和网络的发展,数字图像受到广泛应用。数字图像易于存储,复制。在为图像的传输提供便利的同时,却为版权保护带来了困难。  数字水印就是为了满足这一需求而
论文讨论的是无线路由通信协议在Ad_hoc网络无线节点移动理论模型以及智能交通系统上的实际道路模型的通信性能分析和研究。随着无线网络技术的发展,人们越来越多的把重心放在