论文部分内容阅读
摘 要:来源元数据作为档案元数据核心集重要的组织部分,描述了社会实践主体的特征及背景信息。本文以组织机构为基点建立了来源元数据实体—联系(E-R)模型,并以天津外国语大学为例,阐述了组织机构实体元数据和联系元数据的构成,分析了如何著录两类元数据的变更信息。组织机构元数据模型为档案来源元数据系统提供了数据设计框架,使系统在记录组织机构的历史沿革、提供整理档案的客观依据、提高档案检索利用效率方面具有广泛的应用价值。
关键词:组织机构;实体;联系;元数据;天津外国语大学
依据魂系历史主义思想[1]构建的档案元数据核心集,是一个以“历史”为本原的、由档案历史联系的三维结构要素(来源、事由和年代)及要素之间关系组成的,包括来源、事由和年代三种元数据。本文以社会实践活动主体的主要构成形式——组织机构为基点,将其作为一个实体,提出了组织机构元数据实体—联系(E-R)模型,研究实体和联系元数据的构成及其变更信息,从而构成了档案来源元数据。
1 组织机构元数据模型的构建研究
1.1 以组织机构为基点建立来源元数据模型的缘由。马克思说:“主体,即人,是自身异化的存在物……是作为现实的,活生生的,特殊的个人——就是这种存在物。”主体是有头脑能思维的、从事社会实践活动认识活动的个人或集体,主体可分为个人主体,集体主体,社会主体。[2]在档案学领域,社会实践主体为档案的来源,包括个人、组织机构和国家三个层次。
组织机构是指依法设立的机关、企业、事业单位,社会社团以及其他组织机构。[3]为什么以组织机构为基点来建立来源元数据模型呢?因为一个国家是由众多组织机构构成的,同时每个组织机构中内设了多个部门,在每个部门中又工作着多个个人。作为档案来源的中间层次,组织机构是社会实践活动主体中最典型的存在方式,其自身存在的实体属性及联系属性构成了档案来源元数据。
1.2 组织机构元数据模型。我们将采用实体—联系(E-R)数据模型来设计组织机构元数据模型。实体—联系(E-R)数据模型是基于对现实世界的这样一种认识,世界是由一组称为实体的基本对象及这些对象之间的联系组成。[4] E-R模型力图描述数据的含义,正与我们研究组织机构元数据的初衷不谋而合。
2.1 组织机构实体元数据。表1列出了24项组织机构实体元数据,其中组织机构代码是指由国家编制并赋予组织机构在全国范围内唯一、不变的法定标识,它是组织机构实体元数据的主标识,用它可以唯一的标识组织机构。例如天津外国语大学,其组织机构代码为401359209,可以用401359209唯一的标识这所大学。
2.2 部门实体元数据。如表2所示,列出了16项部门实体元数据。其中部门代码是组织机构赋予部门唯一、不变的标识,它是部门实体元数据的主标识,用它可以唯一的标识一个组织机构中的部门。 GBT 31287-2014中将组织机构代码和组配码进行组合构成组合码,用于标识组织机构的内设部门。[10]组配码可以根据每个组织机构的特点,由所在组织机构进行设定。例如天津外国语大学,组配码可以由部门分类号和部门顺序号(即两位阿拉伯数字)组合而成。学校内设部门分为党群、行政、教学、教辅四类部门,分为用字母DQ、XZ、JX、JF表示。党委办公室属于党群部门,可以用分类号DQ表示,部门顺序号为01,那么党委办公室的组配码为DQ01,即党委办公室作为天津外国语大学的内设部门,其部门代码可表示为“401359209DQ01”,具体的构成见图2。
2.3 个人实体元数据。如表3所示,列出了31项个人实体元数据。其中个人的公民身份证号是国家法定的证明公民个人身份的有效证件号码,它是个人实体元数据的主标识,用它可以唯一的标识一个个人。
2.4 实体元数据变更分析。如表4,实体元数据主标识分为组织机构、部门和个人三类,它可以准确定位哪个层次的实体元数据有变更信息;实体元数据主标识的值,分别为组织机构代码、部门代码和公民身份证号;实体元数据名称和实体元数据值分别为待变更的元数据项目及现有的元数据值;变更内容表示变更后的元数据值;变更时间用8位阿拉伯数字表示;变更依据为变更所依据的文件号、材料名称等。
现以天津外国语大学为例,说明实体元数据变更情况。表4中第1条元数据变更记录,著录了组织机构层级实体元数据变更信息。其表示天津外国语学院的“组织机构名称”,在2010年3月18日更名为天津外国语大学,依据文件为教发函[2010]6号。
3 组织机构联系元数据及变更分析
组织机构联系元数据,将组织机构内部和外部联系有效地揭示出来,架构起组织机构关联网络,使用户了解其内部环境和外部地位。我们采用实体—联系(E-R)数据模型来设计组织机构联系元数据模型。
实体—联系(E-R)数据模型有特定的图示,矩形框表示实体,框中内容为实体名;菱形框表示联系,框中内容为联系名;实体与联系用直线相连,并在直线上标注联系的类型。联系分为3种类型:一对一联系(1∶1)、一对多联系(1∶N)和多对多联系(M∶N)。
3.1 组织机构内部联系元数据分析。
图3为组织机构内部实体之间的联系,包括组织机构与部门、组织机构与个人及部门与个人三类联系。
3.2.2 组织机构与部门。一个组织机构可以与其非内设的多个部门之间存在联系,即组织机构与部门之间是多对多联系(M∶N)。菱形框中联系名可以分别定义为兼管或代管。例如,北疆博物院现隶属于天津自然博物馆,因其坐落于天津外国语大学校内,故受天津自然博物馆和天津外国语大学的双重领导,此时天津外国语大学与北疆博物院形成了兼管关系。
3.2.3 组织机构与个人。一个组织机构可以与多个非专职工作于这个组织机构的个人之间存在联系,即组织机构与个人之间是多对多联系(M∶N)。菱形框中联系名可以分别定义为兼职或借调。例如,天津师范大学管理学院的王红导师,在天津外国语大学研究生院兼职为研究生授课,那么天津外国语大学这个组织机构与王红这个个人形成兼职关系。 3.3 组织机构联系元数据的变更分析。表6给出了组织机构与部门、组织机构与个人、部门与个人、组织机构与组织机构四种联系类型,分别用R1、R2、R3、R4表示;实体元数据主标识值可以准确定位待变更的组织机构、部门和个人;联系名内容类型标注了每种联系类型涉及的具体联系名称;联系名内容表示现有的联系名称;变更内容指更改后的联系名;变更时间用8位阿拉伯数字表示;变更依据为变更所依据的文件号、材料名称等。
下面以天津外国语大学为例,说明联系元数据变更的情况:如表6中第1条变更记录,联系代码为R1,著录了组织机构与部门的联系元数据的变化。其表示天津外国语大学(组织机构代码为401359209)与北疆博物院(部门代码为402609356JX01)原来是兼管关系,于2016年1月1日二者的联系变为内设关系,依据文件为教发函[2016]6号。
4 组织机构元数据模型的应用
4.1 记录组织机构的历史沿革。采用实体—联系(E-R)数据模型,在分析组织机构实体和联系属性的基础上,形成了组织机构实体和联系元数据及其变更元数据。实体元数据相当于组织机构的“简历”,联系元数据就像“所处环境”,变更元数据相当于“演变轨迹”。模型真实详尽地记录了一个组织机构的背景资料和沿革变化,对于档案用户研究组织机构历史沿革具有重要的参考凭证作用。
4.2 提供整理档案的客观依据。作为社会实践主体典型的存在形式,组织机构实体及其内外部联系时刻发生着变化。完整的档案整理方案应随其变化而变更,并能依据它有效地组织案卷、构成全宗、形成全宗群。模型可以提供档案室和档案馆两个层次的整理方案:在档案室阶段可以依据组织机构与部门、组织机构与个人、部门与个人之间的联系组织案卷,构成全宗。在档案馆阶段可以依据组织机构与组织机构之间的联系将全宗组织起来,架构起全宗群。模型提供了支撑档案实体系统存在的骨架,成为一种科学实用的档案整理方案。
4.3 提高档案检索利用效率。目前的档案检索是针对馆藏档案一般特征的检索,而组织机构元数据模型提供的检索,是依据档案历史联系特征的检索,即利用组织机构实体和联系元数据及变更元数据来检索档案的一种特殊方法。模型将隐藏在档案之间的历史联系有效揭示出来,有助于管理者了解组织机构的历史沿革,从而有效地整理及合理地保存档案。同时用户不用浏览档案实体本身,就能完整地获取所需档案信息,提高检索利用效率。
*本文系教育部人文社会科学研究项目《‘魂系历史主义’的档案元数据核心集的构建研究》(项目批准号:15YJC870007)的部分研究成果。
关键词:组织机构;实体;联系;元数据;天津外国语大学
依据魂系历史主义思想[1]构建的档案元数据核心集,是一个以“历史”为本原的、由档案历史联系的三维结构要素(来源、事由和年代)及要素之间关系组成的,包括来源、事由和年代三种元数据。本文以社会实践活动主体的主要构成形式——组织机构为基点,将其作为一个实体,提出了组织机构元数据实体—联系(E-R)模型,研究实体和联系元数据的构成及其变更信息,从而构成了档案来源元数据。
1 组织机构元数据模型的构建研究
1.1 以组织机构为基点建立来源元数据模型的缘由。马克思说:“主体,即人,是自身异化的存在物……是作为现实的,活生生的,特殊的个人——就是这种存在物。”主体是有头脑能思维的、从事社会实践活动认识活动的个人或集体,主体可分为个人主体,集体主体,社会主体。[2]在档案学领域,社会实践主体为档案的来源,包括个人、组织机构和国家三个层次。
组织机构是指依法设立的机关、企业、事业单位,社会社团以及其他组织机构。[3]为什么以组织机构为基点来建立来源元数据模型呢?因为一个国家是由众多组织机构构成的,同时每个组织机构中内设了多个部门,在每个部门中又工作着多个个人。作为档案来源的中间层次,组织机构是社会实践活动主体中最典型的存在方式,其自身存在的实体属性及联系属性构成了档案来源元数据。
1.2 组织机构元数据模型。我们将采用实体—联系(E-R)数据模型来设计组织机构元数据模型。实体—联系(E-R)数据模型是基于对现实世界的这样一种认识,世界是由一组称为实体的基本对象及这些对象之间的联系组成。[4] E-R模型力图描述数据的含义,正与我们研究组织机构元数据的初衷不谋而合。
2.1 组织机构实体元数据。表1列出了24项组织机构实体元数据,其中组织机构代码是指由国家编制并赋予组织机构在全国范围内唯一、不变的法定标识,它是组织机构实体元数据的主标识,用它可以唯一的标识组织机构。例如天津外国语大学,其组织机构代码为401359209,可以用401359209唯一的标识这所大学。
2.2 部门实体元数据。如表2所示,列出了16项部门实体元数据。其中部门代码是组织机构赋予部门唯一、不变的标识,它是部门实体元数据的主标识,用它可以唯一的标识一个组织机构中的部门。 GBT 31287-2014中将组织机构代码和组配码进行组合构成组合码,用于标识组织机构的内设部门。[10]组配码可以根据每个组织机构的特点,由所在组织机构进行设定。例如天津外国语大学,组配码可以由部门分类号和部门顺序号(即两位阿拉伯数字)组合而成。学校内设部门分为党群、行政、教学、教辅四类部门,分为用字母DQ、XZ、JX、JF表示。党委办公室属于党群部门,可以用分类号DQ表示,部门顺序号为01,那么党委办公室的组配码为DQ01,即党委办公室作为天津外国语大学的内设部门,其部门代码可表示为“401359209DQ01”,具体的构成见图2。
2.3 个人实体元数据。如表3所示,列出了31项个人实体元数据。其中个人的公民身份证号是国家法定的证明公民个人身份的有效证件号码,它是个人实体元数据的主标识,用它可以唯一的标识一个个人。
2.4 实体元数据变更分析。如表4,实体元数据主标识分为组织机构、部门和个人三类,它可以准确定位哪个层次的实体元数据有变更信息;实体元数据主标识的值,分别为组织机构代码、部门代码和公民身份证号;实体元数据名称和实体元数据值分别为待变更的元数据项目及现有的元数据值;变更内容表示变更后的元数据值;变更时间用8位阿拉伯数字表示;变更依据为变更所依据的文件号、材料名称等。
现以天津外国语大学为例,说明实体元数据变更情况。表4中第1条元数据变更记录,著录了组织机构层级实体元数据变更信息。其表示天津外国语学院的“组织机构名称”,在2010年3月18日更名为天津外国语大学,依据文件为教发函[2010]6号。
3 组织机构联系元数据及变更分析
组织机构联系元数据,将组织机构内部和外部联系有效地揭示出来,架构起组织机构关联网络,使用户了解其内部环境和外部地位。我们采用实体—联系(E-R)数据模型来设计组织机构联系元数据模型。
实体—联系(E-R)数据模型有特定的图示,矩形框表示实体,框中内容为实体名;菱形框表示联系,框中内容为联系名;实体与联系用直线相连,并在直线上标注联系的类型。联系分为3种类型:一对一联系(1∶1)、一对多联系(1∶N)和多对多联系(M∶N)。
3.1 组织机构内部联系元数据分析。
图3为组织机构内部实体之间的联系,包括组织机构与部门、组织机构与个人及部门与个人三类联系。
3.2.2 组织机构与部门。一个组织机构可以与其非内设的多个部门之间存在联系,即组织机构与部门之间是多对多联系(M∶N)。菱形框中联系名可以分别定义为兼管或代管。例如,北疆博物院现隶属于天津自然博物馆,因其坐落于天津外国语大学校内,故受天津自然博物馆和天津外国语大学的双重领导,此时天津外国语大学与北疆博物院形成了兼管关系。
3.2.3 组织机构与个人。一个组织机构可以与多个非专职工作于这个组织机构的个人之间存在联系,即组织机构与个人之间是多对多联系(M∶N)。菱形框中联系名可以分别定义为兼职或借调。例如,天津师范大学管理学院的王红导师,在天津外国语大学研究生院兼职为研究生授课,那么天津外国语大学这个组织机构与王红这个个人形成兼职关系。 3.3 组织机构联系元数据的变更分析。表6给出了组织机构与部门、组织机构与个人、部门与个人、组织机构与组织机构四种联系类型,分别用R1、R2、R3、R4表示;实体元数据主标识值可以准确定位待变更的组织机构、部门和个人;联系名内容类型标注了每种联系类型涉及的具体联系名称;联系名内容表示现有的联系名称;变更内容指更改后的联系名;变更时间用8位阿拉伯数字表示;变更依据为变更所依据的文件号、材料名称等。
下面以天津外国语大学为例,说明联系元数据变更的情况:如表6中第1条变更记录,联系代码为R1,著录了组织机构与部门的联系元数据的变化。其表示天津外国语大学(组织机构代码为401359209)与北疆博物院(部门代码为402609356JX01)原来是兼管关系,于2016年1月1日二者的联系变为内设关系,依据文件为教发函[2016]6号。
4 组织机构元数据模型的应用
4.1 记录组织机构的历史沿革。采用实体—联系(E-R)数据模型,在分析组织机构实体和联系属性的基础上,形成了组织机构实体和联系元数据及其变更元数据。实体元数据相当于组织机构的“简历”,联系元数据就像“所处环境”,变更元数据相当于“演变轨迹”。模型真实详尽地记录了一个组织机构的背景资料和沿革变化,对于档案用户研究组织机构历史沿革具有重要的参考凭证作用。
4.2 提供整理档案的客观依据。作为社会实践主体典型的存在形式,组织机构实体及其内外部联系时刻发生着变化。完整的档案整理方案应随其变化而变更,并能依据它有效地组织案卷、构成全宗、形成全宗群。模型可以提供档案室和档案馆两个层次的整理方案:在档案室阶段可以依据组织机构与部门、组织机构与个人、部门与个人之间的联系组织案卷,构成全宗。在档案馆阶段可以依据组织机构与组织机构之间的联系将全宗组织起来,架构起全宗群。模型提供了支撑档案实体系统存在的骨架,成为一种科学实用的档案整理方案。
4.3 提高档案检索利用效率。目前的档案检索是针对馆藏档案一般特征的检索,而组织机构元数据模型提供的检索,是依据档案历史联系特征的检索,即利用组织机构实体和联系元数据及变更元数据来检索档案的一种特殊方法。模型将隐藏在档案之间的历史联系有效揭示出来,有助于管理者了解组织机构的历史沿革,从而有效地整理及合理地保存档案。同时用户不用浏览档案实体本身,就能完整地获取所需档案信息,提高检索利用效率。
*本文系教育部人文社会科学研究项目《‘魂系历史主义’的档案元数据核心集的构建研究》(项目批准号:15YJC870007)的部分研究成果。