信息检索算法在Web中的应用与研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户：cwy198783

【摘要】

：

随着Internet技术的高速发展，Web已经成为人们获取信息的一个重要途径，由于Web上的文本信息日益增长，如何有效地检索用户所需信息成为一个非常重要的研究课题。信息检索是指信息

【作者】

：

岳文

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2006年期

【关键词】

：

信息检索向量空间模型查询扩展文本分类用户兴趣模型内容过滤

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet技术的高速发展，Web已经成为人们获取信息的一个重要途径，由于Web上的文本信息日益增长，如何有效地检索用户所需信息成为一个非常重要的研究课题。信息检索是指信息按一定的方式组织和存储起来，并根据用户的需要找出有关信息的过程，是处理海量信息的重要手段。本文主要研究Web中的信息检索算法及其应用。本文首先介绍了信息检索的发展概况和相关技术，其次分析了信息检索技术中三类典型的检索模型，系统地研究了大范围检索系统中基于内容检索算法、基于超链分析检索算法以及混合检索算法的特点，并针对目前搜索引擎的个性化、智能化趋势，介绍和分析了个性化信息检索的发展状况和几种基本模型。针对短查询式造成的查全率高而查准率低的问题，本文将查询扩展和文本分类技术融合辅助检索，提出了一种基于查询扩展和文本分类相结合的信息检索算法。该算法引入了查询扩展和文本分类，增加了短查询式的信息，避免了传统的查询扩展算法的时间复杂度过大缺点。实验结果表明，新算法提高了检索精度和时效，并有效地克服了查询主题发生漂移的缺陷。对于传统检索技术不能根据用户兴趣检索信息的问题，本文引入用户兴趣模型并将内容过滤和文本分类方法相结合，提出一种基于内容过滤和分类的个性化信息检索算法。该算法通过观察用户的浏览文档的行为，采用机器学习的方法不断地更新兴趣模型，从而使该模型越来越贴近用户的真实兴趣；同时，根据用户兴趣模型，算法采用内容过滤和文本分类的方法有效地检索用户感兴趣的信息。实验结果表明，该算法具有较高的查准率和查询速度。最后，本文将提出的算法和技术相结合，实现了一个的信息检索原型系统。

其他文献

基于BP网络的实时入侵物体检测系统

现有的视频入侵检测方法主要是利用普通监视器，而且在对指定地点进行监视的时候通常都需要人的参与，使得监视效果随着人的本身状态的波动或者不同监视者间有较大不同。然而改用

学位

BP神经网络入侵监视自适应

基于拓扑分析的海洋特征结构的提取研究——海洋水团自动划分的Morse-Smale分解途径

自从我国将发展“数字海洋”列入“十五”和2015年国家海洋科学技术发展计划以来，研究、发展有关海洋信息可视化的理论、技术与方法就成了一个急需面对的问题。特征可视化

学位

水团分析特征提取拓扑简化数据建模数字海洋拓扑分析特征可视化

面向服务的动态演化软件模型研究

为了适应Internet开放环境和用户需求的不断变化,软件系统需要不断地调整自身。这种调整,或称之为演化,通常采取静态或动态的方式。动态演化虽然在技术实现上有很高的难度,但

学位

动态演化上下文有关文法软件体系结构求精

基于OGSA的网格服务的应用研究

随着Internet的普及，人们对Internet上信息的各种需求也急剧增加，网格计算也伴随着互联网而迅速发展起来。结合新的Web Service技术，形成了新一代的网格体系结构OGSA。以服务为

学位

网格计算开放网格服务体系网格服务信息获取

基于短信数据通信的自动抄表系统研究与应用

物联网是通信网和互联网的拓展应用和网络延伸，它利用感知技术与智能装置对物理世界进行感知识别，通过网络传输互联，从而进行计算、处理和知识挖掘，实现人与物、物与物信息交互和

学位

物联网自动抄表系统短信息CMPPSOCKET

基于邮件的行程信息归并系统设计与实现

互联网的发展越来越贴近生活、服务生活，越来越多的用户使用互联网预订预定火车票、酒店、航班等等出行服务。作为订票商会向用户发送通知邮件以确认订票的相关信息。但是用户

学位

邮件解析行程订票通知邮件正则表达式

基于Folksonomy用户偏好的推荐方法研究

随着“以用户为中心”为主要理念的Web2.0的深入发展，Folksonomy秉承了这一重要思想因而得到广泛推广，同时也因其自由性、灵活性和共享性等特点逐渐成为当前网络最流行的应用之

学位

Folksonomy标签用户分类协同过滤个性化推荐

基于图像的高精度三维模型网络展示技术及其应用

随着三维获取设备以及个人计算机性能的飞速发展,通过互联网浏览高精度三维模型成为了可能,而这不论对于各个领域专家的研究或者普通用户的参观都具有较大意义。本文通过基于

学位

网络三维展示实时性远程可视化混合渲染

基于自适应传输控制视频会议的研究

目前,随着多媒体正在成为信息传送的重要组成部分,视频会议系统作为一种新型的通信和交流工具,突破了地域的限制,可以提供更为便捷、灵活、全面的音、视频信息的传递和服务,

学位

视频会议自适应拥塞控制QoS分层视频

元数据与XML技术在气象信息发布系统中的应用研究

在经济飞速发展、人民生活水平日益提高的今天，信息资源的地位越来越高，信息的流动也倍受重视，尤其是与衣食住行密切相关的气象信息更是成为了人们生活中不可或缺的一部分。

学位

气象信息元数据XML异构数据信息发布

信息检索算法在Web中的应用与研究

与本文相关的学术论文