面向图书检索的图书摘要概念图标引研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:eastwood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前人们越来越依赖于图书检索技术从海量的图书资源中获取图书信息。图书检索也成为了当前信息检索中一个比较活跃的课题,它广泛地应用在数字图书馆、网上购书网站等系统中。然而目前几乎所有的图书检索系统都采用基于关键字的检索方法,其核心是关键字符的机械匹配,召回率和准确率都比较低,导致检索系统的整体性能并不理想。因此,我们开展了基于概念图的图书检索模型的研究。这种检索模型将图书信息和用户需求标引为概念图,通过概念图的匹配运算寻找用户所需的高质量检索结果,能够有效地弥补关键词检索存在的语义缺失。本文的研究工作是基于概念图的图书检索模型研究的一部分。本文针对图书摘要的概念图标引进行了深入研究,希望解决基于概念图的图书检索模型中图书信息的概念图标引问题。本文的主要研究工作如下:(1)定义了图书摘要的概念图标引形式。本文首先为图书摘要的概念图标引建立了一个规范的关系类型集合,然后对概念图中的概念结点进行了扩展,使得图书摘要的概念图标引形式更有利于概念图的自动标引。(2)提出了一种图书摘要的概念图自动标引方法。本文利用领域文本的句法和语义知识,将浅层句法分析和分层次的句法语义分析结合起来实现了图书摘要概念图的自动标引。其中浅层句法分析识别出句子中的基本名词短语,并标注出基本名词短语的语义类别;分层次的句法语义分析利用预先建立的句法语义模板库,首先对句子分别进行主干分析,标引出句子的顶层概念图,然后对句子主干分析划分出的组块分别进行非主干分析,标引出组块的概念图,从而得到句子的完整概念图。(3)对本文提出的图书摘要的概念图自动标引方法进行了实验,本方法概念图标引的正确率为66.1%,概念图标引的正确系数为76.7%,是一种有效的图书摘要的概念图自动标引方法。
其他文献
网络的安全性问题也越来越受到广泛的关注,各种网络安全相关的技术和产品不断涌现。入侵检测技术是其中一个重要的技术。本文针对现有的入侵检测系统的不足,提出了将数据挖掘
信息资源集成可以屏蔽底层信息资源的异构性,提供给用户一个全局的信息视图,实现分布式、异构信息的统一访问。传统的集成方法无法解决语义异构问题,而本体具有良好的概念层
知识流是在一定上下文情景下,有关知识在知识处理参与方之间产生、转化、传播和应用的动态过程。知识流普遍存在于企业知识管理过程中,具有重要的研究价值。然而,传统的知识流研
在二值图像传真和文档管理系统等应用中,半色调图像压缩技术有着极大的实用价值。论文研究了国内外半色调图像压缩的现状,介绍了二值图像和二值文档压缩的国际标准JBIG2,通过
多机器人系统不但可以代替人类完成许多单调繁杂的工作,还可以帮助人们执行很多危险困难的任务。对多机器人系统的研究,不但可以有效的降低人类的劳动强度,提高工作效率,还可
电力变压器是电力系统中最为重要的电气设备之一,它的运行状况直接关系到电力系统能否安全经济运行。变压器出现故障的主要原因是绝缘损坏,局部放电又是变压器内部绝缘劣化的
脉冲耦合神经网络(PCNN)是一种新型的神经网络,该模型是针对于动物大脑视觉皮层实验中所观察到的与特征有关的神经元同步行为现象而提出的。PCNN直接来源于哺乳动物的视觉特
数据仓库和数据挖掘是数据库研究、开发和应用最活跃的分支之一,也是决策支持系统的关键因素,数据仓库是一个支持管理决策过程的、面向主题的、随时间而变的数据集合,它是集
车载自组网(Vehicular Ad Hoc Networks,简称VANETs)为车辆之间(Vehicle to Vehicle,简称V2V)、车辆与基础设施之间(Vehiclue to Intrastructure,简称V2I)的通信创建了一个重
本论文介绍了图像融合的应用背景,深入研究了各类传感器图像的成像特性和基于多分辨率技术的图像融合方法,并实现了使用拉普拉斯金字塔、比率低通金字塔、FSD金字塔和小波变换