原文出处:《历史档案》2013年第4期,第126—128页
作者简介:赵雄,中国第一历史档案馆副馆长、研究馆员,邮编100031
明清历史档案整理数字化抢救保护项目,是落实上级指示,依法履行国家档案馆职责,实现明清档案安全保护、科学管理、有效利用的重要工作项目。
一 明清档案整理数字化的项目情况
中国第一历史档案馆(以下简称一史馆)保存明清两代中央国家机关和皇家档案1000余万件(册),分为74个全宗,是研究明清社会历史重要的第一手资料,是国家的记忆,是中华民族宝贵的历史文献遗产。到2010年,经过80余年几代明清档案工作者的努力,馆藏档案的案卷级整理已基本完成,文件级整理完成约300万件。
2 010 年11月,一史馆制定了《档案整理和数字化工作方案》,计划用5年时间(2 011—2 015年),对馆藏700万件档案进行文件级整理,彻底摸清家底。逐步推进档案数字化和缩微工作,做好明清历史档案的抢救保护。方案报请国家档案局批准,由中央办公厅主任办公会议研究通过。2012年初,财政部将“一史馆馆藏明清历史档案整理和数字化抢救保护专项经费”列入国家财政预算资金安排的支出项目。
2 011年初,人员调配、场地改造、经费预算、政府采购、跟踪审计等全线展开,整理、数字化、软硬件、安全监控、行政后勤保障工作立体推进。同年5月,在1800平方米的工作区域,大规模档案整理数字化工作正式启动。一史馆保管处、整理处、满文处、复制处、网络处、安保处等部门100余人直接参与各项工作,6家外包公司200余人投入项目实施。
截至2013年8月底,已完成整理档案约370万件、文件级秩序目录约370万条,扫描档案图像约142万件、1976万画幅,成果数据总量约1100TB。2013年第一季度,第三方评价机构从项目决策、项目管理、项目绩效三个方面,对一史馆2012年档案整理和数字化抢救保护专项经费的执行情况进行绩效评价,得分94.4分,综合绩效级别为“有效”。
二 明清档案整理数字化的基本概念
“纸质档案数字化采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。”(DA/T 31—2005《纸质档案数字化技术规范》)
“数字化工作 按科学的方法分门别类地以电子格式加工、处理、存储文献档案资料,并能对这些信息资源进行高效的插入、删除、修改、检索、通过访问接口和信息保护等操作的过程。”(GB/T 20530—2006《文献档案资料数字化工作导则》)
明清档案整理数字化,是为了更好地保护、管理、利用档案资源,应用现代信息技术,按照明清档案管理与数字资源管理的原则、标准、规范、方法,对实体馆藏(现阶段以传统馆藏为主)进行文件级秩序加工整理,并以之为底本,通过数字转换与有效控制,建立传统档案/对象数据/元数据相一致的再生型数字馆藏的工作。
三 明清档案整理数字化的总体要求
以安全为前提。整理数字化工作,场地、环境、装具、设备、人员各个方面,要尽量避免对档案原件的损坏。既要关注物理空间的安全,又要关注数字空间的安全,建设覆盖全时、全员、全区域、全过程的安全保障体系,确保档案实体、档案数据与档案信息的安全。安全责任,重在落实。
以质量为核心。档案整理数字化工作,关注传统馆藏整理质量,再生型数字馆藏采集加工质量,信息技术服务质量;既要关注产品的质量,又要关注优良的产品质量赖以产生的工作过程与管理体系的质量。制定质量规范,实施质量控制,注重质量管理体系的持续改进(PDCA)。质量目标,重在适用。
以进度为根本。档案整理数字化工作,要明确各个工作项目的边界(工作的范围、内容、深度),按照任务安排优先顺序和关联约束关系,计划需求与能力供应相平衡,业务流与资金流相配合。特别是项目实施计划和现场作业管理,保证前后衔接有序、左右配合有力。进度调控,稳中求进。
四 明清档案整理数字化的主要工作
包括传统馆藏整理(档案处理过程)、再生型数字馆藏采集加工(数据加工过程)与信息技术服务工作。档案业务、信息技术与科学管理三者融合,是档案整理数字化工作区别于档案馆以往工作的显著特征。
1.秩序加工整理。对于传统馆藏进行文件级秩序加工整理,实现传统馆藏在全宗、类别、项目、案卷体系之下的文件级管理(单一文件、一份文件、一组文件等),进行分件点面,系统排序,装套组卷,创建案卷级/文件级秩序目录库,完善传统馆藏的管理体系。
2.数字图像创建。以案卷级/文件级秩序目录库为依据,以经过文件级秩序加工整理的传统档案为底本,创建与之对应的数字图像,添加秩序目录数据(与数字图像创建相关的管理元数据),初步形成实体档案/数字图像/秩序目录库相一致的再生型数字馆藏。
3.数字图像编排与元数据加工。以添加了与数字图像创建相关的管理元数据的案卷级/文件级秩序目录库为依据,以与传统档案对应的数字图像为工作对象,以联机工作为基本方式,按照明清档案管理与数字资源管理的原则、规范完善数字馆藏。规范文种项、元数据著录、数据关联、进行数字图像编排与打包。将对象数据和元数据进行封装,按照发布利用需求和长期保存规范,进行转换、压缩、备份、存储。
4.信息技术服务工作。首先着手整理数字化工作平台建设与海量数据存储管理,搭建整理数字化工作基本技术环境。进而推动以数据安全为核心,以机房环境、基础设施、应用平台、数据管理为主要内容,以标准规范体系、安全保障体系为重要支撑的PB级数据中心建设。关注数字资源真实性、完整性、可用性、安全性保障及长期保存策略,探索明清档案再生型数字资源建设运行维护的基本规律,促进档案业务、信息技术与科学管理的有机融合。
五 明清档案整理数字化是一个连续体
档案整理数字化各项工作是一个连续体。档案整理数字化工作流程,包括档案处理过程和数据加工过程。两个过程根据实际需要,划分为多项工作。档案整理数字化工作,既不会一蹴而就,更不会一劳永逸,需要人力、技术、资金的长期持续投入。
档案,包括传统馆藏与缩微馆藏等实体馆藏,现阶段以传统馆藏为主。档案处理过程,包括秩序加工整理、修复展平、消毒除霉、编制秩序目录等工作,重在完善传统馆藏的管理体系,同时为数据加工打下良好基础。
数据,包括对象数据(图像数据、文本数据,以图像数据为主)和元数据(描述元数据、结构元数据、管理元数据)。数据加工过程,现阶段主要以传统馆藏为底本,包括数据创建、加工处理、打包封装、备份存储等工作,重在建立传统档案/对象数据/元数据相一致的再生型数字馆藏。
档案处理过程和数据加工过程,既相对独立,又彼此关联,共同构成档案整理数字化流程。整理数字化工作,不仅实现实体馆藏的数字转换,建立与实体馆藏相对应的再生型数字馆藏,而且实现传统馆藏、缩微馆藏、数字馆藏的有效控制。整理数字化工作中,数字转换与有效控制二者缺一不可,处于同等重要的位置,必须同步部署、同步推进。特别要结合档案事业发展与档案馆工作实际,遵从数字资源的技术标准、格式体系、质量要求与元数据规范,开展数字馆藏创建、描述、组织管理工作,加强数字馆藏长期保存与运行维护工作,推进数字馆藏整合与发布利用工作。
按照信息资源管理理论,档案整理数字化工作,以传统馆藏为基础,依次展开文献组织管理(重点是档案原件)、数字内容创建(重点是图像数据)、数字对象描述(重点是元数据)、数字资源组织管理等工作,具有从低层级向高层级发展的递进关系。其较低层级面向客观物质属性,是对于文献信息资源的初级加工;较高层级面向主观认知属性,是对于文献信息资源的深层加工。自低而高、循序渐进,逐步提升明清档案资源有序化、数字化、结构化、知识化水平。实现一史馆明清档案实体馆藏与数字馆藏长期安全保存,分期分批地将整合有序的再生型数字馆藏(包括对象数据与元数据),通过局域网和互联网提供发布与利用。
参考文献:
1.DA/T 31—2005《纸质档案数字化技术规范》。
2.GB/T 20530—2006《文献档案资料数字化工作导则》。
3.朱强、张春红、龙伟主编:《国家图书馆图像数据加工标准和操作指南》,国家图书馆出版社2011年版。
4.WH/T 46—2012《图像数据加工规范》。
5.王荟、肖禹:《地方志数字化模式与案例分析》,国家图书馆出版社2012年版。
|