《归档文件整理规则解读》 (归档文件整理规范)

归档文件整理规则全文,《归档文件整理规则解读》

电子文件归档时,各单位业务系统要以一定的格式组织和存储电子文件和对应的元数据,以便于电子档案管理系统可以方便有效地解析和读取。通过文档一体化模式开展电子文件归档时,电子文件的内容和元数据可通过网络自动传输到电子档案管理系统,档案管理人员可以不用考虑电子文件数据包组织问题。本节主要介绍通过数据接口形式开展电子文件归档时,其内容和元数据的组织形式。

一、归档数据包的产生

业务系统与电子档案管理系统无法实现数据互联互通情况下,应根据本单位电子文件管理实际,依据电子文件和元数据归档范围、归档时间和归档要求等,制定本单位业务系统和电子档案管理系统均能接受的电子文件和元数据归档接口格式。归档时业务系统按照接口格式导出应归档的电子文件和元数据(导出的电子文件可由用户选择或者由系统按照规则自动选择),形式归档数据包,电子档案管理系统则按照接口格式读取归档数据包,完成电子文件和元数据归档工作。

各单位在设计电子文件和数据归档接口时要着重考虑归档数据包的存储结构设计。在设置电子文件存储结构时应该以便于存储和访问管理为原则,可以和分类方案不完全对应。一般不建议采用将电子文件混淆、打乱的存储方式:即将电子文件比特流打碎成多份,随机存储在不同的存储地址中,需要访问时通过存储管理软件快速恢复电子文件;或者对电子文件进行加密、混淆处理。以上这些做法会使电子文件的存储、访问管理完全依赖于第三方管理软件,一旦软件系统崩溃,将给电子文件归档数据包解析产生不利影响。

常用的归档数据包有两种形式:即文件包形式和封装包形式,以下分别予以说明。

二、文件包形式归档数据包

文件包形式是将电子文件和元数据分别保存为格式文件,然后将这些文件按照一定的关系组织在一起,形成一个“包”形式的文件组合。

1、文件包结构

典型的归档文件包结构如图5-1所示:

归档文件整理规则全文,《归档文件整理规则解读》

2.文件包的内容与规范

说明文件命名为“说明文件.TXT",一个归档数据包只有一个说明文件,存放本数据包有关信息,包括数据包参数(如数据包容量、数据包基本内容等)、数据包编号、数据包归档单位、数据包检查单位、读取本数据包内电子文件和元数据所需要的软硬件环境及其他各种有助于说明本数据包的信息。

目录文件命名为“目录文件.XML”,存放有关电子文件的目录信息,目录文件中的每条记录与每份电子文件相对应,每条记录中包括数据包内电子文件顺序号、档号、文号、责任者、题名、日期、密级、页数、电子文件名称、备注等内容。目录文件XML信息格式如下( encoding 属性值可以是“GB18030”、“GB2312”、“UTF-8”):

归档文件整理规则全文,《归档文件整理规则解读》

其他文件夹命名为“其他”,存放各种其他存入载体的文件,主要包括:所采用的元数据规范、数据封装规范、分类编号规则、文件命名规则、XML模式及电子文件归档交接信息(包含交接、迁移、转换、保存等元数据和《电子档案移交与接收登记表》的扫描件或电子签名件)等等,这些文件应采用文本、XML和其他符合长期保存要求的文件格式。

电子文件文件夹(图5-1中的“全宗文件夹”及其内部包含的全部内容)一般按照档案管理的惯例以全宗号命名(没有全宗号的单位可以使用其他代码代替,只要能区分开不同的立档单位即可),用于存放电子文件及其元数据。电子文件文件夹一般按年度-类别-文件的层次设置最底一层文件夹。根据档案整理和分类方法以及实际情况可对存储结构中的类别、文件等层级进行取舍。

最底一层文件夹,也就是电子文件文件夹内最底层的存放电子文件内容和元数据的文件夹(图5-1中的“文件1文件夹”等)一般以文书处理号、件号、流水号命名,其中存放电子文件的元数据和电子文档。元数据包括过程信息、电子文档信息等内容。过程信息描述方式举例如下:

归档文件整理规则全文,《归档文件整理规则解读》