【摘 要】
:
知识组织工具是信息检索领域的重要理论研究课题之一。基于对信息检索基本原理及其所涉及的知识组织问题的认知和理解,作者在本文中首次提出并阐述了检索系统中知识组织工具构建的5个技术(理念)维度,即分类vs主题、先组vs后组、受控vs非受控、形式化vs非形式化、弱结构vs强结构,并据此进一步抽象、概括出“知识组织工具的更新和演替是影响信息检索活动发展演变的基本动因之一”的学术判断。
【机 构】
:
北京大学信息管理系,北京 100871
论文部分内容阅读
知识组织工具是信息检索领域的重要理论研究课题之一。基于对信息检索基本原理及其所涉及的知识组织问题的认知和理解,作者在本文中首次提出并阐述了检索系统中知识组织工具构建的5个技术(理念)维度,即分类vs主题、先组vs后组、受控vs非受控、形式化vs非形式化、弱结构vs强结构,并据此进一步抽象、概括出“知识组织工具的更新和演替是影响信息检索活动发展演变的基本动因之一”的学术判断。
其他文献
国防科技情报事业已有50年的发展历史,其中始终重视紧紧跟踪信息技术的飞速发展,坚持不懈地开展国防科技情报工作的现代化进程。根据作者的初步认识,国防科技情报现代化进程经历了三个主要阶段:新型检索方法的探索、计算机技术的普及应用和网络技术的全面应用。本文对国防科技情报工作现代化发展进程进行了简要回顾,并且展望“十一五”,国防科技情报现代化进程必将得到更大的创新发展。
在知识标引的研究中,自动标引研究常集中于词表的运用和组织以及分词方法的研究,对于自动标引系统中规则的相关研究比较少。规则引擎是由java社区推动的旨在分离商业决策逻辑和技术决策的新技术。规则引擎可以为规则的建立和使用提供高效、方便的接口。本文在研究和分析自动标引系统和规则引擎的基础之上,提出了基于规则引擎的自动标引系统的结构和工作流程,为在自动标引系统中规则的建立和使用提供一个途径,为提高自动标引
本文提出一种适合数字图书馆特定专业领域小文档(如摘要等)的文本自动分类算法。该方法以同义词集合概念代替词条,建立分层的概念层次结构,使得在训练过程中更容易提取出代表类别的高层次信息。实验结果表明,当训练文本数量不大时,该方法比基于词频的方法能获得更高的检索准确率。
分析了当前网络环境下信息资源的特点和用户的需求,从《装备科技信息分类表》在网络建设中的应用探讨了当前面向网络的专业信息分类表的编制。
本文对2000至2006年国外研究用户网络搜索行为的文献进行了调查,主要探讨了影响用户网络搜索行为的因素以及不同群体的搜索行为特征方面的研究成果。最后,本文评述了该两方面的研究现状并对未来的研究发展进行了展望。
针对目前的基于内容的图像检索系统的速度和效率问题,本文提出基于分类技术的图像检索方法。本文首先介绍了基于SVM的多类图像分类的研究,然后介绍了在分类基础之上,构建的基于内容的图像检索系统的原理,最后做出评价。
当前的用户兴趣模型大多采用基于向量空间模型的加权关键字的方法,当一个关键字在不同的领域中有不同的含义时,会导致模型失效。本文提出类别与关键字结合的构建用户模型的方法。根据用户日志,对用户浏览过的网页分类,建立用户兴趣的类别模型。再从各类网页中提取关键字,建立与类别相关连的关键字模型。两种模型综合,构成了用户兴趣模型。
语义标注是语义检索、知识挖掘、智能推理等研究领域的一个基础研究课题。本文给出一种基于文本语义相关度计算的中文文本语义关系标注方法。该方法首先构建了主题特征量和文本特征向量,采用基于《HowNet》的词语语义相似度和文本语义相似度计算方法进行主题特征量与文本特征向量的语义关系计算,同时,对文本的类别、语义关系进行有效标注。
只有教会电脑能理解人的自然语言,能够用自然语言与人进行交流,人才能真正地成为电脑的主人,本文介绍了作者领导的研究者们在成功地教电脑理解中文自然语言所走过的道路、认识的飞跃和基本方法。
知识描述与组织是知识服务的基础,它是知识管理的核心。本文具体讨论了信息对象的知识点描述与获取、知识存储与索引机制;并对知识抽取与本体论方法进行了探讨。