在“三态两化”视角下重构档案资源观
浏览量:档案部门首先是作为资源管理部门存在的,国家档案主管部门多年来一贯非常重视档案资源工作。2014年,中共中央办公厅、国务院办公厅印发的《关于加强和改进新形势下档案工作的意见》中就明确提出包含档案资源体系、档案利用体系、档案安全体系在内的“三个体系”概念。当前,档案对象空间正经历着从模拟态到数字态再到数据态的嬗变,如何完整理解档案资源,兼顾实体环境与数字空间、兼顾人机共读、兼顾存用需求,就需要多角度、多维度地对档案资源进行重新透视,构建适应新技术环境下的更高视野的档案资源观。
几种不同的档案资源观
“档案资源体系不是自然形成的,而是文件、档案的形成者、管理者有目的有意识地构建起来的。”秉持不同的价值取向和建设理念可以构建具有不同内容与特征的档案资源观。以历史的角度看,新中国成立后的档案资源观建设理念大致经历了从“国家档案观”到“社会档案观”再到“档案数据观”的演变。
1.“国家档案观”:基于馆藏,服务政府
新中国成立后,档案资源建设主体由包含各级各类国家档案馆、企事业档案部门的单一的国家主体承担。档案资源建设理念表现出明显的政治性、官方性、宏观性和权力服务性特征。档案资源建设内容重点在于党政机关、公共性事业单位和国有企业形成的官方记录。在“国家档案观”的指导下,我国从国家层面颁布了一系列相关的政策法规和标准规范,例如,《关于加强国家档案工作的决定》《中央关于统一管理党、政档案工作的通知》《各级国家档案馆收集档案范围的规定》《机关文件材料归档范围和文书档案保管期限规定》《企业文件材料归档范围和档案保管期限规定》等,使得党政机关和公共性事业单位、国有企业的文件归档和档案收集工作得以规范化开展。毋庸置疑,以官方记录为导向的“国家档案观”为档案资源体系建设起到了奠基性作用,在此资源观指导下的档案资源体系非常注重馆藏工作,对于馆藏所覆盖的职能来源与资源结构给予了高度重视。
2.“社会档案观”:超越馆藏,走向大众
改革开放以来,随着我国政治体制改革的深入、经济制度变革的加速和社会民主制度的加强,公众对档案的认识程度开始不断加深,公民的档案利用需求也开始逐渐增多。在此情况下,档案资源体系开始呈现出多元化趋势,建设重点也逐渐从“国家档案”转变为“社会档案”。从档案工作的定位来看,1987年,《中华人民共和国档案法》第五条规定:“档案工作实行统一领导、分级管理的原则,维护档案完整与安全,便于社会各方面的利用。”该条款强调档案工作要满足社会各界的档案利用需求,由此档案资源体系建设思路开始走向多元化。在此后历次的《档案法》修正和修订中,这一原则得到了延续和强化。从档案资源体系建设主体看,建设主体突破了单一国家主体的局限,民营企业、非公经济组织、民间团体、家庭与个人都参与到了档案资源体系建设活动中。从档案资源体系建设内容看,档案资源体系由侧重反映社会政治、经济、科技、文化活动的宏观层面转向关注集体记忆、基层民生、社区和家庭生活的微观层面。因此,“社会档案观”指导下的档案资源体系建设超越了以党政机关档案为主的、馆藏结构单一的“国家档案”,兼顾了社会、国家、社区、家庭和个人层面的文件资料的收集、归档和保存。《关于加强和改进新形势下档案工作的意见》中就明确提出“应归尽归、应收尽收”。冯惠玲教授提出的档案“记忆观”也认为档案应该尽可能全面地反映社会面貌,注重满足公众的需求和可获取性。
3.“档案数据观”:着眼数据,强调服务
在“5iABCD”(5G、工业互联网、人工智能、区块链、云计算、大数据)广泛应用的数据时代,数据逐渐成为不同业务场景的原始记录形式,相应的,档案管理对象也发生着由模拟态到数字态再到数据态的转变,数据管理开始成为档案工作的新常态。“档案数据观”旨在将具有长期保存价值的数据纳入档案资源范畴,通过档案化管理手段使其能够长期地可读、可用和可理解。“档案数据观”的内涵在于,首先将数据视为档案的一种存在形态,具有长期保存价值的数据自然就成为档案资源体系建设的重点内容。由此,档案资源体系建设开始走向全媒体类型,从模拟态、数字态资源建设走向数据态资源建设。其次,“档案数据观”强调以服务为导向的建设目标。传统的档案资源观重在对档案资源的有序化和系统化管理,其所提供的服务形式较少,服务内容较单一。“档案数据观”指导下的档案资源建设强调提供多元化、丰富化的知识服务和数据产品。再次,需要一系列对应的专业技术工具。基于“5iABCD”的技术体系有特定的适用对象与应用场景,需要面向具体的档案资源利用场景选择有针对性的专业技术工具进行档案资源建设与开发。
“三态两化”理论概述
前述不同的档案资源观亦可简单表示为“馆藏观”“记忆观”与“数据观”,这3类不同的资源观不是互斥的,而是相互之间具有内在的演化逻辑。不同的资源观不单影响到了档案资源体系本身的结构与内容,对于档案机构与人员的资源建设能力、软件环境、标准建设都有直接的影响。如何调和这几种不同的资源观需要回归到档案资源对象本身的演变过程来寻求答案。笔者近年来提出的“三态两化”理论有助于从一个新的视角来审视档案资源对象及其变化。
1.三态
技术环境变迁显著影响了档案对象管理空间的变化,使之正经历着从模拟态到数字态再到数据态的嬗变。三态用来指代基于传统的模拟技术环境、基于数字信号的数字技术环境和以数据驱动为核心特征的数据环境,为便于叙述,分别用模拟态、数字态和数据态予以表达。三态对象的核心差异在于信号性质与内容语义方面的特征不同,模拟态对象信号连续,语义连续;数字态对象信号离散,语义连续;数据态信号离散,语义离散。由于态别不同,导致三态对象的技术体系、管理环境、适用规范等要素迥异。模拟态空间重在统筹以载体为中心的有序管理和以库房为中心的安全管理;数字态空间重在维系以文件内容为中心的逻辑完整;数据态空间重在识别和描述以流程、模型和本体等为核心的规则空间。
2.两化
模拟态—数字态—数据态代表了文档对象管理空间的演化路径,相互之间的转换过程也蕴含着管理理念更新、技术手段转型、制度规范变化等重要内容。所谓两化即数字化和数据化,分别代表模拟态转化到数字态的过程和数字态转化到数据态的过程。数字化目的在于将模拟态文档转换为机器可以识读和处理的二进制比特流。数据化的目的更多地在于将档案内容对象进行解析,以便易于被机器理解、处理与利用。
“三态两化”理论不仅阐述了档案资源对象本身的变化历程,也为档案资源建设提供了全新的观察视角。具体而言,三态通过静态的视角来明晰档案资源对象的历时性变化,其关注重点在于原生档案对象。两化则从动态的过程性视角来关注档案资源对象态别转换过程中产生的衍生资源,如数字化副本、各类元数据记录、档案对象本体等。这些衍生对象也是构成档案信息系统资源的主体部分,有助于在此基础上开发更多的档案资源产品。因此,“三态两化”理论指导下的档案资源观能够将不同态别的原生档案对象与衍生数据灵活地组织在一起,满足馆藏管理、记忆保存、知识服务等多方面、多场景的综合利用需求。
“三态两化”视角下的档案资源
模拟态档案是以模拟信号(连续的物理信号)进行记录和保存的、基于文件形式的信息记录,我们所谓的传统档案基本都属于模拟态,如纸质档案、缩微档案、照片等传统载体类型的档案。从数量看,经过几千年的积累,模拟态档案已经拥有了庞大的数量,然而正是由于其信号具有连续性的特征,在迁移到数字空间时必须将其进行数字化后才能被机器所识别与处理。
数字态文档是以离散的数字信号进行记录和保存的、以文件为容器的信息记录,其构成要素和逻辑构建总体上还是按照便于人们理解的要求来设计的,因此,虽然信号离散,但是仍然具有语义连续性。与模拟态文档相比,这些海量的电子文件类型更加多元、格式更加繁杂、处理和利用手段也更加丰富。如电子公文、电子邮件、电子合同、数码照片、网页、电子政务审批文件等都属数字态文档类型。
数据态文档是以数字信号进行记录和保存的、以数据为颗粒度的信息记录,如关系型数据库文件、GIS数据、三维数据、数字交付模型等。数据态对象多数是由数据驱动类系统产生的、面向机器处理的、不同聚集程度的各类数据及其集合,在语义上呈现出离散的特点。理论上,具有长期保存价值的数据态文件是业务活动的原始记录,毋庸置疑具备档案属性,应当纳入档案部门的管理范畴。然而,囿于目前相关研究成熟度不高、实践技术手段滞后、归档保存策略体系性差等原因,档案部门还未能对数据态文件实施有效的管控。
数字化本身是将模拟信号转换为数字信号的技术过程,通过数字化我们可以将大量模拟态档案转换形成数字态,有助于积累档案数字资源。通过数字化工作,能将人们从繁重的实体管理任务中解放出来,从而投入精力从事档案资源内容的管理与加工。中国照片档案馆的“国家相册”项目就是对馆藏海量照片档案数字化后进行内容挖掘和编排的成果。
数据化工作与一般性著录工作存在较大差异,不仅仅是元数据描述与抽取,更重要在于对档案内容的语义表达、本体描述与关联建设等,从馆藏描述迈向语义描述,为后续的各类知识性服务奠定基础。不同层级的数据化工作本身会形成不同层次的数据产品,如数据库、语料库、知识库等。如国家地质资料馆开展的颇具特色的数据出版工作就是建立在对馆藏地质图纸数字化和数据化的基础上。
构建新型档案资源体系
从“三态两化”角度构建新型档案资源体系可以有效应对不同资源观视角的核心需求,满足馆藏管理、存证服务、记忆保存、知识服务等功能。原有的资源体系存在的问题在于馆藏结构通常局限在横向的载体类型,例如文书多而照片少,这就容易导致馆藏结构不合理,从“三态两化”角度构建新型档案资源体系,明确其功能需求和产品类型,在纵向上拓展加深档案资源的内容深度。主要策略包括:
1.把握静态对象,明确管理方式
构建新型档案资源体系应明确各态特定管理对象,选择不同的管理方式。模拟态的管理对象是各种传统的纸质文件、照片等,数字态的管理对象则是电子文件、数码照片等,数据态的管理对象是关系型数据库文件、GIS数据、三维数据等。从发展眼光看,未来馆藏资源结构中三态并存将是常态。档案工作者应了解各自态别的类型、边界,对于技术选型、平台、管理方式等做出有针对性的选择。
2.把握动态变化,做好转换衔接
构建新型档案资源体系应把握档案对象的数字化和数据化过程,树立状态观、转化观、过程观,注重对各态别档案本质的重新认识,注重转换过程中的技术实现,注重管理体系重塑,有意识地开展不同态别档案对象的转换和衔接工作。
3.要有新型资源产品和品牌意识
档案资源产品同样面临转型升级,除了传统的年鉴、大事记等编研编纂产品,应探索数字方式开发新型档案资源产品。档案机构应有针对性地开发特色档案资源产品,树立品牌意识。例如,全国地质资料馆建立了地质科学数据出版中心,将地理信息、地质图和数据库等常见共享数据和地质工作过程中产生的文献、档案记录、数据表格等多种实体数据类型进行出版,产生了具有权威性和针对性的品牌效应。
4.有意识地搭建满足多元需求的资源体系
为满足不同态别档案对象的管理、开发、利用需求,新型档案资源体系应有层次有重点,开发迎合时代潮流的多样化的资源产品,将其视为新型档案资源体系的有机组成部分。具体的,可以将新型档案资源体系的产品划分为数据基础产品、资源聚合产品、知识资源产品等类型。数据基础产品往往是档案数据、企业内部数据、外部关联数据等基础支撑数据,包括关系数据库之内的结构化关系数据、以文件形式存储的非结构化文本数据、各类音频视频等多媒体数据等。资源聚合产品是将从文本、多媒体数据中挖掘分析得到的处理结果与数据基础产品的数据分析结果进行聚合处理,形成各类专题数据集与数据库等形式。知识资源产品包括语料库、知识库、知识图谱、图数据库等,可以为用户提供基于档案的各类知识性服务。
总之,通过“三态两化”理论重构档案资源观,是对既有资源观的继承与扬弃,有利于对档案资源体系进行必要的调整,满足各方面对档案资源的多元利用需求。
[本文系北京市社会科学基金项目“数字人文记忆构建技术体系与产品研究”(项目批准号:17JDLSB006)阶段性成果]
参考文献:
[1]冯惠玲.档案记忆观、资源观与“中国记忆”数字资源建设[J].档案学通讯,2012(3).
[2]胡燕.我国档案资源体系建设多元化探析[J].档案学通讯,2013(5).
[3]张斌,徐拥军.档案事业:从“国家模式”到“社会模式”[J].中国档案,2008(9).
[4]钱毅.智慧档案馆全域对象与建设层级分析[J].档案学研究,2019(4).
[5]钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(2).
[6]钱毅.从“数字化”到“数据化”:新技术环境下文件管理若干问题再认识[J].档案学通讯,2018(5).
[7]钱毅.基于三态视角重新审视档案信息化建设[J].浙江档案,2019(11).
[8]于英香,孙逊.从文件结构演化看电子文件数据化管理的发展:基于技术变迁的视角[J].档案学通讯,2019(5).
[9]马仁杰,贾飞.开放政府背景下NARA档案资源开发实践及启示[J].浙江档案,2018(6).
文章来源:《中国档案》2020年第8期 ,如有侵权请立即与我们联系,我们将第一时间处理