1.预处理
预处理(也称为预处理)是构建数字档案资源的第一步。它的主要内容包括选择,计数,注册,分类,清洁,恢复等。
识别和选择是指根据指定原则和方法,根据档案数字化的目的对数字化对象进行识别和选择。仅需数字化和转换满足要求的物理档案,包括纸质档案,缩微胶卷,录音,录像和照片。要对要数字化的对象进行计数并按其规格和数量进行登记,并应进行必要的整理,清洁和维修,以便对要数字化的物理文件及其目录进行整理,从而为进行数字化做好了充分的准备。接下来的数字转换,并提供可以直接数字化的标准化目录数据和实体。工作的具体内容包括目录的规范,完成和更正,以及对归档实体的清除,驱虫,拆包,分类和恢复。应当指出,在进行数字处理之前,还应修复旧的音频和视频磁带。电声指数下降,磁粉脱落,发霉,粘附等现象在旧磁带中很常见,这会影响它们的正常播放和原始录制信号的提取。必要的维修,清洁和加固处理可以确保正常的播放操作并获得高质量的信号源。
2.数字处理/转换
数字处理/转换的主要内容是通过模数转换技术和设备将传统载体中记录的档案信息转换为以数字形式表示的信息资源。不同类型的物理文件,ANALOg到数字的转换技术和设备各不相同。纸质文件,经过数字处理的照片主要用于扫描仪,数码相机等要扫描或照相的设备,缩微胶片数字化主要用于要扫描的缩微胶片扫描仪。录音文件的数字设备主要是音频采集卡,录音文件的数字设备主要是视频采集卡。录音和录像的输出设备通过特定的音频和视频传输线连接到音频采集卡和视频采集卡,并且音频采集卡和视频采集卡安装在计算机上。
此阶段的关键问题是相关技术参数的选择。选择技术参数时应考虑三个要求:
(1)原始信息的保真度,数字信息应尽可能清晰准确,以再现原始文件的外观。
(2)方便用户。数字信息应易于传输和浏览,以满足不同用户的操作需求。
(3)保护原始文件。数字处理应确保原始文件,尤其是濒临灭绝的文件不被损坏。
这些要求可能是矛盾的,例如从归档的角度来看数字失真低,失真越小,计算机文件容量越大;从利用率的角度来看,大容量文件传输速度较慢。通过积极吸收成熟,稳定的国际和国内标准,指南和手册的规定和建议,并掌握对数字信息资源的利用和管理的需求,这将有助于提高数字处理的水平。
3.信息处理
信息处理是指对数字图像和多媒体信息进行适当的处理以满足使用的需要。具体工作包括检查(针对原始文件),压缩,边缘去除,去污,噪声去除,干扰去除,使用光学符号识别(OCR)技术来识别图像中的文本,使用矢量技术进行转换将光栅图像转换为矢量图形等。如有必要,它也可以嵌入数字水印,以保护数字档案资源的知识产权。
4.信息组织
信息组织负责建立机器可读的目录和索引,创建目录,全文,多媒体和其他数据库,并将数字信息(图像,文本,音频,视频等)与目录和索引信息联系起来。
如果在数字化处理之前已经建立了有机阅读目录,则需要补充一些必要的记录项目,例如数字化文件信息资源的计算机文件名,存储位置,格式等;一些必要的描述性项目,例如关键字和摘要,也可能需要修订和完善。编目是档案情报控制的一种手段。机器可读编目中编目的质量与检查和维护数字档案信息的难度有关。它一直是理论和实践关注的焦点,而编目标准化是重中之重。对于具有研究价值的历史档案信息,现阶段可能需要进行必要的研究工作,例如对人的姓名和地名信息进行文字研究,并记录文字研究结果和文字研究基础资料。
5.信息存储
信息存储是指为数字档案及其目录信息选择适当的存储介质,存储模式和存储架构。数字档案信息资源的存储要求和存储方法与电子文件基本相同。
6.信息服务
易于传输和使用是数字信息的特征之一,在更大范围内为更多用户提供更及时,更满意的服务也是档案馆数字化的基本力量。综合档案馆的数字馆藏属于公共范围,建议通过互联网网站将其发布给公众,并提供给在线使用。内部用户应通过内部网络共享档案的数字信息。负责公共服务的机构还应考虑通过在线查询和就地查看向公众提供服务。
具体的使用方式取决于收集的具体情况。目前,国内外许多数字图像的在线服务是提供免费的在线目录搜索和浏览小尺寸和低分辨率的图像,而原始尺寸和高分辨率的图像需要申请付费使用。数字化手段大大提高了档案馆的服务能力和响应速度,部分档案馆达到了商业组织的服务水平。
7.信息维护
数字化档案及其目录信息应保存很长时间,并应保持其完整性,可读性和可用性以保护投资价值。数字档案信息资源的维护要求和维护方法与电子文件基本相同。