基于情报检索语言互操作技术的集成词库构建研究——以教育词库为例

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:sheng285292970
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于目前存在多种标题表、叙词表、分类表和网络分类法,同一主题概念在不同网站和系统之中采用不同的主题词或分类号表达,网络信息检索变得十分困难。用户最理想的方式是用一个提问式可以获取多个数据库中的检索结果。要实现这一方法,最主要的就是实现各种情报检索语言之间的互操作。近年来,国内外学者一直在探讨检索语言的互操作问题,提出了多种解决方法,主要包括:自动匹配转换;中介词典;集成词表;映射;翻译等,并在此基础上完成了很多互操作的项目,为用户的信息检索带来了很大的方便。 本文拟通过对检索语言互操作技术的研究,借鉴国内外实现不同词表之间互操作的经验和方法,建立一个以《中国分类主题词表》为核心的兼容体系,即建立一个可以不断扩充的集成词库。这个集成词库包括:《中图法》与国内外分类法的互操作,《汉表》与专业叙词表的互操作以及受控语言与自然语言之间的互操作。拟以教育类为试验对象,选用多部中外叙词表、分类表构建词库。数据来源包括《中国分类主题词表》、《中国科学院图书馆图书分类法》(简称《科图法》)、《杜威十进分类法》(DDC)等分类表的教育大类;《教育主题词表》、《社会科学检索词表》等主题词表及下载、抽取的关键词和关键词串。 本文主要研究内容包括:不同词表到《中分表》的互操作,包括各分类法与《中图法》、各主题词表与《汉表》以及受控语言与自然语言的互操作三部分。对不同分类法的互操作拟采用同现映射和类目相似度计算等方法,并针对各种算法的不足提出了新的修改意见;对不同主题词表之间的互操作,拟采用基于结构的自动匹配、基于同义词表的映射等方法;另外,还研究了自然语言到受控语言的转换,为用户提供自然语言入口,方便用户检索、查找。通过上述映射完成词库的构建,本丈采用兼容矩阵的结构形式来存储词库,分为两种形式:字顺兼容矩阵和分类兼容矩阵。为了便于浏览和使用词库数据,采用单机模式、XML文档格式及本体对词库兼容数据进行可视化显示,进而为用户提供各种服务。 利用Visua1 Basic语言、Access2000、XMLspy等工具开发设计了教育词库的构建和应用系统。
其他文献
为促进经济与科技的互动发展,世界各国都将产学研合作作为有效的途径,将大学和科研院所的科研优势和企业的资金优势互补衔接,利用企业的资金促进科技的发展,利用科技的进步增强企
商标(Trademark)俗称“品牌”(Brand),是商品生产者、销售者或服务提供者为商品、服务设立的标志。如何高效快捷地组织和检索商标图像,是当今商标信息爆炸时代面临的重要课题
高校图书馆硕士点集中诞生于21世纪初,经过10年的探索和创新,图书馆硕士点克服生源缺乏、师资不足和没有培养经验等困难,初步形成特色鲜明的培养模式。山东理工大学图书馆情
档案是文明的产物,它与文化之间有着千丝万缕的联系,档案本身就是一种文化。档案文化是人类文化的基础,是社会文化的重要组成部分。我国大力发展社会主义文化的形势,使得档案文化
图书馆的决策和活动能够影响社会和环境,是图书馆承担社会责任的缘由。ISO 26000拓展了图书馆社会责任理论与实践的领域。详述ISO 26000各条款内容,阐述其对图书馆社会责任发