机构规范文档结构及构建方式研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:WIN_Hardy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机构规范文档是将机构所有名称形式以及属性信息有序集中、梳理机构组织结构的一种方式,可有效解决信息检索、计量评价等科研活动中机构名称著录混乱、层级结构模糊的瓶颈问题。文章在充分调研机构规范文档建设实践项目的基础上,深入探究机构命名规则及属性特征,梳理机构实体关联关系,构建机构规范文档的元数据框架,设计机构规范文档构建流程。  根据元数据的设计及规范理论,文章在复用都柏林核心元数据集的基础上进行扩展,为机构规范文档定制了描述性元数据集以及管理性元数据集,并借鉴ISO/IEC11179标准,对机构规范文档的元数据进行了语义定义。为实现清晰展现机构关联关系之目的,文章借助本体的构建思想,构建机构树体系。  基于机构名称特征词字典对机构数据中的各级机构名称进行识别,利用NLPIR分词系统对机构地区、邮编等特征进行提取,采用基于K-近邻算法与编辑距离相似度算法相结合的机构名称归一方法,通过人工收集以及频次统计的方式确定机构样本数据,实现一级机构名称、二级机构名称归一。  最后,以100种期刊论文中的267996条机构数据为数据源,从中筛选我国内地高校19800条记录作为目标数据,进行具体的归一实证,并从归一准确率、归一覆盖率两方面对归一结果进行了评估。
其他文献
基于引文评价与同行评审方法相结合进行论文评价的思路,利用F1000数据库随机获取同行评审指标论文131篇,利用WoS、JCR、ESI及ImpactStory检索工具获取每篇论文的常用网络计量
指出LibGuides具有组织清晰、后台管理灵活,用户交互性强、社会服务性好等特点。重点分析中国人民大学图书馆协作式学科服务平台建设实践,认为学科馆员主导、用户协作的建设
当前国际科技竞争日益激烈,科技创新能力越来越受到各国政府的重视,科技创新不仅能提高国家的竞争力,而且还能加快企业的技术升级。目前,产学研合作已经成为推动我国科技进步和创
自从我任教以来,一直 在乡村中学任教,面对的学生成绩参差不齐。重要的是学生来源也比较复杂,绝大部分来自农村偏远山区,家庭条件比较差,父母基本没有多少知识,绝大部分是留守儿童和单亲家庭,有的同学一提到作文,则谈虎色变,说手头无材料,脑子空空荡荡,无从下手。在语文教学中,流传这样一句话:“一怕文言文,二怕写作文,三怕周树人”这就是广大中学生学习语文畏惧心理的生动说明。结合语文教学中的重要任务是“写”,
档案是人类活动的原始记录,是文化传承的纽带。然而档案制成材料可以作为大量害虫的营养物质,库房日常管理不善,往往发生虫害,给珍贵文化遗产造成无法挽回的损失。本论文首先
基于Web of Science(WoS)数据库,利用科学知识图谱工具CiteSpace、HistCite构造国外政府信息资源研究的主题、研究趋势与热点等网络,并借鉴网络科学理论及Gephi工具,对国外政
随着全球范围内“回归自然”浪潮的涌起,人们越发重视包括中药在内的植物药,欧美地区市场潜力巨大,是我国中药全方位进入西方国家最为重要的两个地区。长期以来我国中药主要以饮
  本文陈述了选题背景、研究内容与方法、研究现状、研究目的及意义。第二章档案馆信息服务定位概述,论述了与档案馆信息服务定位相关的一些基本概念及档案馆信息服务定位的
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的
《图书馆学情报学大辞典》一书在继承已有成果的基础上,紧贴学科发展趋势,在内容和体例上有诸多修订完善和革新之处,是值得向图书情报工作者和研究者推荐的工具书佳作。全书