档案部门一直积极推进从封闭性管理向开放性服务、从传统保管职能向现代服务职能的优化转型,以提升档案资源的社会化利用价值。档案开放利用是档案工作至关重要的环节,而档案开放审核是档案开放利用的前提和基础,其工作质量直接影响到档案开放利用的水平和效果。《中华人民共和国档案法》《“十四五”全国档案事业发展规划》等明确要求档案开放审核工作法治化、规范化、常态化。
在科技赋能的当下,智能技术在档案开放审核业务中的创新应用正逐步深化,呈现出明显的发展趋势。国内多家综合档案馆积极开展相关实践探索,《国家档案馆档案开放办法》进一步细化了档案开放的具体流程和要求,包括谁来负责开放、如何进行开放、开放哪些档案以及如何利用开放档案等问题。
当前档案开放工作面临三重瓶颈:
■审核标准不统一:人工审核受主观认知差异影响,相同内容可能因审核人员经验差异产生截然不同的判定结果。
■效率成本失衡:由于历史积累,大量初审工作完全依赖人工审核导致人力投入与开放进度严重不匹配,省级档案馆年均审核量往往需要数十人的投入。
■识别精准度困境:借助传统敏感词识别技术,往往存在关键词库覆盖不全、语义理解缺失等问题,导致漏报率居高不下。
基于政策和内需的双重驱动,光典提出AI智能开放审核解决方案,以光典智能鉴定平台为依托,基于档案审核大语言模型,通过深度网络模型、机器学习等技术对档案内容进行文本挖掘和分析,从控制规则库、涉密检测、AI算法等维度对档案进行推荐辅助审核结果,将复杂、繁琐、无序的人工鉴定,逐步向机器智能鉴定转变,并借助“AI智能初筛+专业人工复核”的双轨并行审核机制,推动鉴定工作从“经验主导”向“数据驱动”转型。
该方案一方面充分发挥人工智能技术优势,实现档案内容的自动化识别、分类和敏感信息标注;另一方面依托专业审核人员的经验判断,对系统识别结果进行精准复核和优化调整。
01 多模态内容智能预审
光典智能鉴定平台通过对馆藏档案内文档、图像、音视频等多模态电子文件的智能解析,可对敏感词、隐私数据自动识别,并标记待审内容生成鉴定建议,大幅提升工作效率与准确性,实现敏感信息95%+的初筛准确率。
该平台对导入的数据进行初步质量检查,主要包括自动识别元数据及全文内容,分析敏感信息、密章标注、语义规则。
该方案流程图
02 “AI+人工”双轨鉴定模式
该方案以“AI+人工”双轨鉴定模式开展,通过自然语言处理技术先进行初筛,再由档案人员在初筛的开放鉴定初审意见的进行判别,并由下一轮审核人员进行内容复审,最后提交档案开放鉴定领导小组确定最终鉴定意见,从而保障对结果进行精准复核和优化调整。
文本类AI审核
03 模型持续优化
为模型提供“学习素材”是关键。该方案除了根据数字档案馆建设情况及馆藏实际建立档案敏感词库,还具备模型自主学习优势。通过学习已鉴定档案的审核结果,模型能够训练出符合开放条件的算法模型,并利用训练好的模型,推断出待鉴定档案数据的开放鉴定结论,实现模型能力的自主进化。
04 全流程管理
该方案旨在打造从档案导入、任务分配到结果输出的一站式工作台,其中光典智能鉴定平台既可作为应用服务和档案系统集成,以在线方式对档案系统中数据进行智能审核。同时,也可作为独立的开放审核工具,实现从数据导入、数据管理、开放审核,数据获取等全流程业务闭环,完成档案的开放审核操作。
■ 档案提取自动化
根据开放审核年限要求,方案将提醒用户进行开放审核,并自动形成开放审核任务,自动调取到期未审核的档案。
■ 任务分配便捷化
方案支持灵活分配待审核档案数据,可按照比例或自定义范围将数据拆分为多个任务集,并分派至不同审核人员,实现高效协同处理。
■ 调档方式多样化
为灵活适应不同业务场景,方案支持多种调档方式,包括档案查询调档、到期档案自动调档、条件筛选调档等,提升档案管理效率。
■ 审核结果多维化
该方案支持依据档案密级、敏感档案门类、敏感文种、敏感词、全宗敏感性、控制文本相似度等维度,对档案进行智能鉴定,并输出审核结果及审核依据。
场景1:归档价值鉴定
在档案归档环节,档案价值鉴定功能依据归档范围与保管期限表,对档案条目全文进行分析,自动匹配保管期限,如“10年”“30年”或“永久”,为档案的科学分类与长期管理提供依据。在档案数字化过程中,该功能可对数字化成果进行价值评估,判断其是否具有继续保存的价值,辅助档案部门做出合理的数字化档案保存决策
场景2:到期鉴定
以优化档案馆藏为目的,从现实和潜在档案利用需求出发,兼顾馆藏的数量、结构、内容、形成时间等因素,对已满保管期限档案的价值进行鉴定。根据用户定义的到期规则,对档案条目全文进行分析,判断档案是否符合到期定义,并给出销毁、延期等处置建议。例如,对于已满保管期限的档案,系统可自动筛选出符合到期条件的档案,并根据档案内容的重要性,建议“销毁”或“延期10年”等处置方式,帮助档案部门优化馆藏结构,确保档案资源的合理配置。
场景3:开放鉴定
在对档案进行开放审核时,方案可依据预设或定制的审核的规则,对档案条目全文进行分析,快速判断档案是否符合开放条件,给出“开放”或“控制”的建议,提高审核效率。同时,在档案利用过程中,若利用者对某未开放档案有利用需求,档案部门可借助开放鉴定功能,根据利用者申请,对相关档案进行鉴定,满足合法合规的利用需求,推动档案开放工作与档案利用需求的紧密结合。
【某省级档案馆】
模型训练前:基于2,130条原始档案数据进行测试,未经训练的审核大模型直接输出推荐结果,综合准确率为74.50%。
模型训练后:创新采用真实业务数据训练模式,将58,236条经人工审核确认的档案数据直接用于模型预训练,无需额外人工标注。经实测,模型综合准确率显著提升至91.07%,较训练前提升16.57个百分点。
档案作为重要信息资源和独特历史文化遗产,价值日益凸显,加之人民生活水平的显著提高,对档案信息、档案文化的需求日益增长,开放具有历史文化价值、公共教育意义的档案资源是必然。光典AI智能开放审核解决方案以高度贴合业务场景的设计和便捷高效的操作特性,为档案开放工作提供了强有力的技术支持,助力档案单位实现现资源的高效开放与价值转化。