概念检索若干关键技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:iqplll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索是电脑中最基础最重要的应用之一。但以往的信息检索基本都是基于关键词匹配的,只要发现某个文档(网页)中含有这个 关键词,就将该文档(网页)作为查询结果返回给用户。因为在基于 关键词匹配的检索过程中参与匹配的是关键词的外在形式,而不是它们所表达的概念,所以很少能完全地反映用户需求,因此,在词检索过程中,人们被迫要求扩展到同义词检索,实际上就是要求应让概念检索来替代词检索。概念检索突破了关键词匹配局限于表面形式的缺陷,从词所表达的概念意义层次上来认识和处理用户的检索请求。 概念检索与传统的信息检索相比,有着如下优点:1.打破了关键词障碍,把信息检索从目前的关键词层面提高到概念层面;2.概念检索能提供较好的自然语言接口;3.概念检索具有较高的人机交互水平。 本文对概念检索中的若干关键技术进行了研究,在以下几个方面取得了一些成绩和突破。 1.讨论了概念的定义及其与表述形式间的关系,提出了概念网(ConceptNet)的结构组织,以《主题词表》为基础,结合同义词词林、知网、金山词霸的相关词汇,建立了一个蕴涵“属、分、代、参、用”关系的概念网。并且对基于概念网的检索提问扩展和基于概念网的语义联想检索进行了研究,使得信息检索系统具有较高的人机交互水平。 2.对全文索引的存储结构进行改进,将维(field)的概念加入索引项。实现了常用查询概念的索引库,进一步提高了检索系统的性能。还利用索引项中维的概念提出了检索提问中日期项的处理方法。 3.对检索结果定序算法进行了研究,通过对服务器的访问日志进行信息挖掘,提出了基于用户反馈的网页重要度的评定算法,使得检索结果更加符合用户的需求。 基于以上的研究,作者与实验室的其他同学合作实现了一个原型系统。该原型系统的特点是易于移植配置,支持多种检索方式,支持HTML文档,TXT文档等多数据源,具有多元排序功能,并对索引过程和检索缓存做了优化。
其他文献
本文首先提出了一种新的网络应用,无线终端通过AP接入校园网,从而实现校园网中无线终端之间的语音通信,校园网的宽带为这一应用提供了必要条件。接着,本文从基于H.323协议的VoIP
NMG(Network Management Gateway)网关是一个功能强大的网络管理网关,为Intranet连入Internet提供了有效的手段.不仅为客户提供了各项基本接入服务,而且提供了虚拟专用网VPN
随着网络业务的复杂化,传统的TCP/IP网络架构已不能满足人们的需求,为此互联网研究人员提出了一种把控制平面与数据转发平面相分离的新的网络架构,即软件定义网络(SDN)。SDN把控
无线传感器网络由大量部署在监测区域内的微型传感器节点通过自组织、自适应的方式构成,这些传感器节点具有一定的感知能力、数据处理能力和通信能力。无线传感器网络中的节
音乐是人们日常生活中不可缺少的组成部分,它作为一种独特的抒情方式和重要的交流媒介,其中携带着丰富的信息。近几年来,互联网成为音乐的新载体,互联网的高速发展使网络上音
群智能优化方法是一类相对较新的优化问题解决方法,它的灵感主要来自于自然界中昆虫及其他动物的社会性行为。蚁群优化算法的灵感来自于蚂蚁的觅食行为,蚂蚁在觅食过程中通过
本文针对彩色图像的人脸检测跟踪问题,提出了一种比较新颖的方法。整个算法包括以下三个主要模块。 首先基于颜色和形状分割出人脸候选区域,其中,皮肤检测采用HSCC颜色空间方
该文针对一个数据分析和预测的数据挖掘应用,提出了基于知识库的数据挖掘系统概念.并且设计和实现了该数据挖掘系统,在设计和实现的过程中,该文主要解决了以下一些主要问题:1
该文尝试将GIS应用在农业环境信息管理中,同时力图解决部分 关键技术问题.以将GIS应用融合于农业环境信息管理的业务流程为出发点,该文就基于GIS的农业环境管理支持系统(AESS
Sun公司提出的Jini技术为构造面向服务的分布式系统提供了一个很好的框架.建立在Jini技术上的服务可以适应高速动态网络环境,并且可以自动管理.然而,对于这些分布式服务,我们