基于查询与内容的文档表示模型研究

来源 :南华大学 | 被引量 : 0次 | 上传用户:himiro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的飞速发展,互联网上的信息呈指数级增长。庞大的数字化信息与人们获取所需信息的能力之间的矛盾日益突出,怎样快速准确地检索相关信息已经成为当今信息领域的研究热点。在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一。根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体。当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈。本文首先对当前国内外经典检索模型及其文档表示方法进行了介绍,接着阐述了全信息理论及认识论信息,概述了语用信息在查询扩展、排序算法及文档表示中的应用现状,重点讨论了最具代表意义的“基于查询集的文档组织方法”。针对该方法的不足进行改进,给出了“查询样本空间稳定性判定”的概念,提出了一种整合用户查询与文档内容的文档表示模型,将用户隐性反馈的语用信息和文档自身的语义、语法信息相结合,动态地调整索引库关键词权重,以期提高信息检索的查全率和查准率。实验结果表明我们的新模型更好地表示了文档的主题信息,对检索精度的提高效果明显。为了深层次地挖掘共现词语蕴涵的信息,本文还提出了一种基于共现查询与共现内容的文档表示模型,给出了运用关联规则抽取共现词的过程及模型的形式化描述。最后,基于Lucene架构开发了一个面向南华大学新闻网的站内搜索引擎——“石鼓新闻搜索”,能够实时跟踪用户兴趣并且根据集体兴趣的迁移动态调整检索结果,效果优良。
其他文献
视频具有直观明了、生动形象的表现能力,并且随着科技的发展,网络基础设施与各种计算机外设产品日益完善,数字影像设备争奇斗艳,视音频处理硬件与软件技术推陈出新,所以数字
伴随信息技术与互联网技术的发展,网络入侵行为变得越来越普遍,它给网络的安全带来了隐患,网络信息安全成为互联网时代不可避免的问题。网络安全态势感知是近几年新兴起来一
移动传感器网络MSN(MobileSensorNetwork)是一类特殊的无线传感器网络,可以广泛应用于军事战场、灾难救援、环境监测、交通管理、跟踪报告、医疗卫生等许多领域。移动传感器
随着网络技术的发展和新型设备的应用,EPON(以太无源光网络)以其低成本、高带宽、扩展性强和灵活重组的特点,成为接入网的最佳选择。EPON作为PON(无源光网络)技术和以太网技术结合
随着旅游业的快速发展和科学技术的不断进步,游客对于景区导游系统的功能要求逐渐提高,如何满足景区内游客实时定制游览路线和回避景点拥堵的需求成为当前导游系统的研究重点
纹理是一种区域视觉线索,在图像中普遍存在而又难以描述,是一种描述图像中各个像素之间的空间分布关系,一直以来都没有较好的定义。由于纹理信息能够充分地利用到图像中的信息,因
人工微结构材料是一种人工功能材料,具有自然材料所不具备的电磁特性,且其特性可视具体需求而人为设计。人工微结构材料的出现导致了全新的操控电磁波的技术和方法,大大拓展了传统的电磁学领域。围绕这一国际电磁学领域的研究热点,本文着重研究了人工微结构材料调控电磁波时空特性的机理,并探讨了其潜在的应用前景及实现方式。主要工作概括如下:第一,基于等效介质理论,首次给出了人工微结构材料的等效电磁参数收敛的厚度条件
无线传感器网络(Wireless Sensor Network,WSN)是对信息进行采集、处理并传输的信息监测网络。传统的WSN由于其对信息传输及计算处理能力已无法满足越来越高的应用要求,常常
目前的互联网应用已经进入了WEB2.0时代,互联网应用对于数据库的支持提出了更高的要求,总的来说,挑战来自两个方面,一者是数据规模越来越大,二是读少写多的操作特点。针对这
图像聚类与检索作为计算机视觉领域中高层语义理解层面下的两大研究方向具有广泛的应用价值。其主要研究方向集中于如何形成合理的图像特征表达和设计优化的推理求解算法。使