基于Web信息检索系统的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:xsxt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,人们获取信息的方式正发生着很大变化.基于Web信息检索系统已成为获取Internet上有用信息的一种非常有效的工具.然而目前基于Web信息检索系统普遍存在着检索响应速度较慢,检索结果质量较差,信息存储困难,信息抽取困难等问题,文中着重对以上存在的问题进行了深入的研究.主要工作包括以下几个方面:1.针对现有的一些信息检索系统中存在的这些问题,文中提出了一个基于Web的分布式信息检索系统模型WEBIR,特别是对WEBIR系统中的Web服务器提出了一系列新的管理策略,有效地解决了上述问题,从而可以更快速地处理用户的查询请求.2.我们通过对查询请求进行预处理,在此基础上,再对搜索所产生的结果进行进一步处理,从而既显著提高了查准率和查全率,又提高了搜索的效率.在查询预处理方面,文中提出了一种新的查询预处理方法Pretreatment.在对查询预处理所返回的搜索结果集进行进一步的处理方面,文中提出了一种新的排序方法Ranking.较好地解决了现有的一些排序方法普遍存在的问题.3.文中提出了一种从Web文档,特别是从HTML文档中抽取信息的新方法.4.根据Web上数据的特点,文中提出了利用多agent技术对Web上的信息进行管理的系统模型Datamanagement.5.综合前人的成果和自己所提出的新成果,我们设计并实现了两个信息检索系统AIRS和PIRS.
其他文献
电子商务和信息技术快速发展以及人们对Internet上各种信息的需求急剧 增加,要求WEB开发与应用具备灵活性、可靠性及安全性。这就给WEB应用程序 开发人员带
学位
软切换是CDMA系统特有的关键技术之一,它在系统无线资源控制与优化方面起到重要的作用.软切换算法的选择直接影响系统的容量和服务质量.混合动态系统作为控制系统领域中一个
该文主要研究和实现了汽车牌照的自动分割与识别,从整体上来看,该文可以划分为两大部分,即:牌照的自动定位和分割部分和牌照字符的自动识别部分.对牌照的自动定位和分割技术,
转炉炼钢的终点控制就是通过调节吹氧量和冷却剂加入量使得吹炼终止时同时获得成分和温度都合格的定量钢水。由于转炉炼钢环境恶劣,过程复杂,其间难以准确地进行连续不断的测量
传统卡通动画因其强大的表现力和非常丰富的艺术内涵,在今天仍然深受人们的喜爱,有着非常广阔的市场前景。但卡通动画的制作方法主要依靠动画师手工绘制大量的动画帧来完成,其制
学位
将嵌入式设备接入INTERNET是一个研究人员正在探索的课题,网络协议的实现本身就是一件复杂的事情,而在嵌入式设备中实现它,将会更加复杂,这是由于嵌入式设备的多样性引起的.
随着互联网应用的发展,企业之间及其内部不同部门之间的数据格式不兼容、数据交换以及共享困难的现象日益突出,在这样的背景下,XML(可扩展标记语言)为企业、软件开发者、WEB站点和
该文讨论的分布式多视点需求工程采用多视点技术将系统需求划分为多个视点需求,降低需求分析的难度;采用形式描述技术或非形式描述技术对视点进行建模和描述,处理视点间的相