基于Agent的网络文本信息检索研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:helloliuhh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对目前网络中信息检索系统所存在的不足,结合Agent技术对网络信息检索的智能化和个性化发展进行了研究.文章首先分析了信息检索的基本原理和基本模型;介绍了数据挖掘、信息过滤等相关的理论知识,以及这些理论在信息检索中的应用;分析了Agent技术的特性以及其在网络信息检索领域中的应用.然后结合国内外研究给出了一种基于Agent的网络文本信息检索模式,使用三层Agent结构来实现网络文本信息的检索,并对信息收集Agent、信息处理Agent和用户接口Agent的功能进行了阐述.本文的主要工作是着重于文本特征提取的研究和用户兴趣模型的构建研究.通过对传统的特征权重算法的分析,提出了一种改进的基于信息熵值的特征项权重算法;分析研究了用户个性化兴趣模型的构建方法,利用潜在语义索引技术实现查询的匹配和文本的过滤,并且建立了信息反馈和用户兴趣模型完善的机制.
其他文献
本文的研究面向移动设备的主题服务,针对特定的应用领域,以比较高的自动化程度,实现了主题地图数据的生成工具——面向移动设备的主题地图精简和定制工具(MMT)。MMT的主要服务对
数据库服务外包是近几年兴起的一种新的数据库应用模式。外包数据库模型中数据的完整性检测是为了防止外包数据库提供商内部和外部人员对数据库内容篡改,保证查询者获得正确
  ENUM技术是近年来网络资源寻址定位方式研究的热点。在三大网络逐渐融合的趋势下,ENUM有着很乐观的前景。ENUM的使用和推广有利于服务提供商和运营商更方便地以较低的成本
新一代计算模式促使人机交互方式必须从以“计算机为中心”向“以人为中心”转变,这种转变的核心是建立支持人类思维过程并与人类思维趋同的人机交互方式。以手写体和手绘草图
本文介绍了“北京大学网格计算资源服务中间件”子项目“北京大学网格元数据服务”所做的工作。该子项目围绕支持语义的资源描述模型的建立与表示、以及基于该模型的元数据服
  多媒体消息服务是按照3GPP的标准和WAP论坛的标准开发的最新业务。它最大的特色就是支持多媒体功能,它以应用层协议为载体传送视频片段、图片、声音和文字。对用户而言,多
遗传算法是一种有效的解决优化问题的方法,它是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,其思想源于生物遗传学和适者生存的自然规律,是一种迭代过程的搜索算法
  视频会议系统的建设是中科院院信息化建设的重大项目。近些年来,随着网络的普及和不断发展,网络带宽已经不再是网络应用的瓶颈,这使得很多基于互联网的新的应用应运而生。利
本文在阐述数据仓库基本理论的基础上结合某运营商的具体案例说明了数据仓库技术在国内电信业的应用。本文首先从基础理论、建设原则、基本体系结构、关键技术等几个方面比较
在人类语言中存在着多种的书写系统writing system,这些书写系统大致可以分为两类:一类是水平书写,大部分的西欧语言和现代亚洲语言都属于这一类,例如英语、汉语等都属于水平