系列分享 | 电子文件(档案)元数据标准的前世今生三部曲之前奏曲
浏览量:笔者有话说:
最近看了很多行业大咖写的档案专业知识的解读,受益良多。
笔者一直以来对于电子文件(档案)元数据的由来、其组成颇感疑惑,明明OAIS参考模型,即:《ISO14721:2003空间数据和信息传输系统一开放档案信息系统一参考模型》(以下简称 OAIS参考模型)是最早被提出的,也被行业内诸多电子文件(档案)管理领域大佬所认可,为什么最后国内发布的各类电子文件或档案的元数据规范却选择了按《ISO23081—1:2006信息与文件一文件管理过程一文件元数据第一部分:原则》和《ISO23081—2:2007信息与文件一文件管理过程一文件元数据第二部分:概念与实施问题》的元数据框架来进行设计呢?
“知晓过去,方能感知未来”
接下来跟着笔者的思路,利用三篇文章,扒一扒电子文件(档案)元数据的前世今生。
壹:OAIS参考模型中
元数据顶层框架模型
OAIS参考模型是一个各领域通用的长久保存数字信息以便于检索利用的基础性标准。在该标准中,其给出了一个针对数字对象元数据的顶层框架模型,该顶层框架主要体现在OAIS参考模型的信息模型中,如图 1所示。
图1:OAIS参考模型的元数据模型
Ⅰ第一层
元数据框架是关于数据对象的
第一层元数据框架是关于数据对象的,即图1中的表征信息部分。其作用就是说明数据对象的特征,以便于显示和理解数据对象。在数据对象为数字对象时,表征信息的作用主要是说明数字对象的结构和语义,从而使‘0’和‘1’所构成的数字对象转化为人一机可读 的有意义的数据。
Ⅱ第二层
元数据框架是关于信息对象的
第二层元数据框架是关于信息对象的,即图1中的保存描述信息部分。其作用就是从信息长久保存的角度说明信息对象的特征,以确保信息对象可被确认和理解信息对象被创建时所处的环境。保存描述信息包括 四类:参考信息、来源信息、背景信息和固化信息。
Ⅲ第三层
第三层元数据框架是关于信息包的
第三层元数据框架是关于信息包的,即图1中的包信息与包描述信息部分。其作用是从总体上说明、描述信息包的特征,以便用户确认、定位与检索信息包。
在以上三层元数据框架中,第一层元数据框架的性质是属于信息对象在物理层面上的技术元数据框架;第二层元数据框架的性质是属于信息对象在逻辑层面上的长久保存元数据框架;第三层元数据框架,主要是从第二层元数据中抽取出来的、用于检索的元数据框架。可见,在这三层元数据框架中,第一层与第二层是关键。所以,在 OAIS参考模型的信息模型中,表征信息与保存描述信息实际上就构成该标准的长久保存元数据的顶层框架 。
贰:OAIS参考模型中
元数据框架的具体内容
在 OAIS参考模型的信息模型中,在信息对象物理层面上的第一层技术元数据框架,即表征信息,是由三个部分构成,即:结构信息、语义信息、其他表征信息。
1、结构信息
它包括数据格式的说明,以及对存取数据所需的硬件与软件环境进行的描述。结构信息主要是面向机读的信息。
2、语义信息
就是在由结构信息对数据结构定义的基础上提供更多的意义。
主要是面向直读(人读)的信息。
3、其他表征信息
理解结构信息和语义信息所需的其他表征信息。说直白点,如果把结构信息和语义信息看作是第一层表征信息,那么其他表征信息就是理解、说明第一层表征信息所需的第二层、第三层表征信息。
在信息对象逻辑层面上的第二层长久保存元数据框架,即保存描述信息,其框架是由四个部分构成,即:参考信息、背景信息、来源信息、固化信息。
1、参考信息
主要是为信息对象提供能唯一确认该信息对象的标识符,如系统中产生的内部标识符,或一个 ISBN的标识符。
2、背景信息
主要记录信息对象与其环境的关系,如关于信息对象被创建的原因以及信息对象与其他信息对象的关系,这些关系可以是内容主题上的相关关系或等级关系。
3、来源信息
记录信息对象的历史,说明信息对象的创建以及创建后所经历的各种变化,保管情况的变化。
4、固化信息
提供数据完整性校验,或提供用于保证特定的信息对象不被未授权改动的校验码,如:数字摘要码、数字签名串等。
在OAIS参考模型中,由表征信息元数据框架和保存描述信息元数据框架所构成的长久保存元数据的顶层框架,为国际范围内各领域的信息对象的长久保存提供了一个标准化的架构。所以,从整个国际范围内来看,OAIS参考模型的长久保存元数据框架作为基础性框架标准,其产生的标准化的作用与影响是巨大的,意义也是深远的。
叁:国际标准IS0/23081
第一部分文件实体类元数据的顶层框架
国际标准《ISO2308l一1信息与文件一文件管理过程一文件元数据第一部分:原则》(以下简称国际标准 IS0/23081第一部分)于2006年正式颁布,该标准是直接根据文件管理的需求标准——国际标准《ISO15489信息与文件一文件管理》起草制定的。国际标准IS0/23081第一部分提出了一个被称之为“法规三元组”的文件管理元数据顶层框架,这个框架实际上是一个关于文件实体类的元数据顶层框架,如图2所示。
图2:国际标准 IS0/23081 法规三元组 元数据模型
从图2看,法规三元组的具体内容包括:
1.文件实体类元数据:主要是关于文件自身的元数据;
2.责任人员实体类元数据:主要是关于责任人员的元数据;
3.业务实体类元数据:主要是关于业务工作或业务过程、文件管理过程的元数据;
4.法规标准实体类元数据:主要是关于业务规章制度、政策以及法规的元数据。
由于法规三元组框架没有显示动态的文件管理元数据框架部分,因此,国际标准ISO/23081第一部分又进一步规定了上述法规三元 组框架中的每一个实体类元数据,在文件捕获之前或之后同样适用,每一实体类的元数据都由下列两类元数据部分动态地构成:
1.与文件一起捕获的元数据:将元数据固化于自身的业务背景之中,使管理过程能够开始进行(如在文件捕获点上的元数据)。
2.不断创建与捕获的元数据(如过程元数据):这类元数据已不是由文件创建组织机构所生成的,但是任何一个负责 自始至终地管理文件的组织机构都必须确保这类元数据的创建与捕获。
由此可见,国际标准IS0/23081第一部分的元数据顶层框架是紧紧围绕文件的实体而提出的,对文件适用具有鲜明的针对性;又由于它是根据国际标准《ISO15489信息与文件一文件管理》的文件需求标准起草制定的,其框架实现文件管理需求的功能十分清晰,具有明确的目的性。
好了,鉴于篇幅有限
下期将继续展开讲
国际标准IS0/23081第二部分的元数据顶层框架。
敬请期待!