基于档案数据全生命周期治理,面向档案数据开展全面的数据质量监测、数据安全管控、数据分级分类以及数据挖掘分析应用工作。综合运用自然语言处理、计算机视觉、智能算法、数据智能分析等人工智能技术构建档案数据安全治理体系,包括数据质量模型、数据筛敏模型、数据筛密模型、数据分类分级模型及数据智能审核模型等。通过这些模型对档案数据的质量进行监测、治理、挖掘与分析,并对档案数据进行规范化的数据分析标注,形成规范化、资产化的数据资产,从而实现数据资产全链路闭环管理,确保其能够长期有序、可持续地得到管理与利用。
数据治理最终目的是数据应用,创造价值。只有数据为利用赋能,才能体现数据价值。档案数据由于其本身具有保存价值,随着人工智能、大模型技术的不断成熟,后续档案数据的利用价值将尤为突出。数据应用将基于档案现有数据,通过大数据进行分析、数据标注等,为用户提供智能问答、多模态检索、知识图谱、关联检索等应用服务。
数据质量监测
通过“规则匹配-智能检测-问题标注-智能审核”的全流程自动化机制,实现对档案数据质量的闭环管控。数据分类分级
基于语义理解、文本语义对比、深度学习等技术,通过学习分类分级保护原则及档案分级管理规范,根据档案业务属性、重要性、敏感性以及其一旦遭到篡改、泄露、丢失、损毁后,对社会秩序、公共利益以及公民、法人和其他组织的合法权益造成的危害程度,形成档案数据分类分级模型。智能开放审核
基于自然语言处理(NLP)和自然语言理解(NLU)能力,依据国家档案局发布的《各级国家档案馆开放档案办法》及多省开放档案实施办法规定,结合档案业务属性、重要性、敏感性现状,对档案文本内容预处理、档案文本内容分类等操作,形成符合档案行业的开放审核模型。数据挖掘分析
充分利用文本挖掘技术,建立数据挖掘模型,对档案全文内容分析,深入挖义关系,提取档案全文中的潜在特征,并生成语义标签,对档案内容资源作深度挖掘,为档案利用提供服务。渠道合作
联系电话:
400-720-0100