文档库 最新最全的文档下载
当前位置:文档库 › 纸质档案数字化技术规范

纸质档案数字化技术规范

纸质档案数字化技术规范
纸质档案数字化技术规范

纸质档案数字化技术规范

中华人民共和国档案行业标准DA/T 31—2005

1范围

本标准规定了纸质档案数字化的主要技术要求。

本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。

2规范性引用文件

下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。

GB/T 17235.1—1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南

GB/T 17235.2—1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试

GB/T 18894-2002电子文件归档与管理规范

3术语和定义

下列术语和定义适用于本标准。

3.1数字化digitization

用计算机技术将模拟信号转换为数字信号的处理过程

3.2纸质档案数字化digitization 0fpapeI喃ased records

采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。

3.3数字图像digital image

表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。

3.4黑白二值图像binary image

只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。3.5连续色调静态图像continuous—tone 8till image

以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。

3.6分辨率resolution

单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。

3.7失真度distortion measure

对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。

3.8可值度intelligibility

数字图像向人或机器提供信息的能力。

3.9 图像压缩image compression

清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式

表示。纸质档案数字化过程中,较常见的有TIFF(G4)、JPEG等压缩格式。

4纸质档案数字化基本要求

4.1基本原则

纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。

4.2数字化对象的确定原则

应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。

4.2.1符合国家法律法规的原则

纸质档案的数字化,必须符合国家档案开放规定以及有关规定。

4.2.2价值性原则

属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。

4.3基本环节

纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。

4.4过程管理

4.4.1应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。

4.4.2纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。

5档案整理

在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。

5.1目录数据准备

按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、

责任者、起止页号和页数等,应进行修改。

5.2拆除装订

在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。

5.3区分扫描件和非扫描件

按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描原稿。

5.4页面修整

破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。

5.5档案整理登记

制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。

5.6装订

扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。

6档案扫描

6.1扫描方式

6.1.1根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。

6.1.2纸张状况较差,以及过薄、过软或超厚的档案,应案,以及页面为多色文字的档案,可采用灰度模式扫描。方式以提高工作效率。

6.2扫描色彩模式

6.2.1扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。6.2.2页面为黑白两色,并且字迹清晰、不带插图的档案.可采用黑白二值模式进行扫描。

6.2.3页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。

6.2.4页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。

6.3扫描分辨率

6.3.1扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。

6.3.2采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择大于或等于100dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。

6.3.3需要进行OCR汉字识别的档案,扫描分辨率建议选择大于或等于200dpi。6.4扫描登记

认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。

7图像处理

7.1图像数据质量检查

7.1.1对图像偏斜度、清晰度、失真度等进行检查。发现

不符合图像质量要求时,应重新进行图像的处理。

7.1.2由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。

7.1.3发现文件漏扫时,应及时补扫并正确插入图像。

7.1-4发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。7.1.5认真填写相关表单,记录质检结果和处理意见。

7.2纠偏

对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。

7.3去污

对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。

7.4图像拼接

对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。

7.5裁边处理

采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

8图像存储

8.1存储格式

8.1.1采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。8.1.2提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。

8.2图像文件的命名

8.2.1纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。

8.2.2多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。

9目录建库

9.1数据格式选择

目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。

9.2档案著录

按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。9.3目录数据质量检查

采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。

10数据挂接

10.1汇总挂接

档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。

10.2数据关联

以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该

份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。

10.3交接登记

认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。

11数据验收

11.1数据抽检

11.1.1以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。

11.1.2一个全宗的档案,数据验收时抽检的比率不得低于5%。

11.2验收指标

11.2.1目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。

11.2.2一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,予以验收“通过”。

合格率=抽检合格的文件数/抽检文件总数x100%

11.3验收审核

验收“通过”的结论,必须经分管领导审核、签字后方有效。

11.4验收登记

认真填写纸质档案数字化验收登记表单。

12数据备份

12.1备份范围

经验收合格的完整数据应及时进行备份。

12.2备份方式

为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。

12.3数据检验

备份数据也应进行检验。备份数据的检验内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。

12.4备份标签

数据备份后应在相应的备份介质上做好标签,以便查找和管理。

12.5备份登记

填写纸质档案数字化备份管理登记表单。

13数字化成果管理

13.1应加强对纸质档案数字化成果的管理,确保其安全、完整和长期可用。13.2纸质档案数字化成果提供网上检索利用时,应有制作单位的电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。

纸质档案数字化的基本流程及技术要求

纸质档案数字化的基本流程及技术要求 一、概述 档案是人类社会实践活动的真实记录,是党和国家宝贵的历史文化财富。这些具有查考凭证作用、依据作用和参考作用的档案,是人们从事科研、生产等工作的必要条件和有力工具。档案也是各企事业单位运作各个环节的真实记录,是极其珍贵的原始资料和重要的信息资源。准确、系统、完整的档案是单位工作的重要参考资料,是社会的重要财富。 随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算机检索、阅读电子档案,为迎接档案信息服务新环境的挑战,提高管理水平、提高效率,增强档案业务部门的服务水平,为档案内部管理及面向客户服务提供高效率的全面服务。档案作为一种原生信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神文明建设服务。 二、基本原则 纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围,并按照《中华人民共和国行业标准(DA/T 31—2005)纸质档案数字化技术规范》对纸质档案进行数字化。根据档案幅面的大小(如A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪,如工程图纸采用0号图纸扫描仪进行扫描。纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。扫描过程中,确保不对档案原件造成破坏,保证档案扫描图像与原件一致、整洁、清晰。加强对纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。 三、基本流程及技术要求 纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、

DA/T32005纸质档案数字化技术规范标准

纸质档案数字化技术规范DA/T31-2005 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于用扫描仪对各种纸质档案的数字化加工处理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1 连续色调静态图像的数字压缩编码 GB/T 17235.2 连续色调静态图像的数字压缩编码 GB/T 18894?2002 电子文件归档与管理规范 ITU(CCITT)G3 二值图像压缩算法 ITU(CCITT)G4 二值图像压缩算法 DA/T18?1999 档案著录规则 档案管理软件功能要求暂行规定国家档案局档发[2001]6号 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化 Digitization 用计算机技术将模拟图像转换为数字图像的处理过程。 3.2 纸质档案数字化Digitization of Paper?Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。

3.3 数字图像 Digital Image 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像 Binary Image 只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。 3.5 连续色调静态图像 Continuous?tone Still Image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字 图像。 3.6 失真度 Distortion Measure 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原 件色彩、几何、压缩算法等差值。 3.7 可懂度 intelligibility 表示数字图像向人或机器提供信息的能力。 3.8 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。 3. 9 分辨率Resolution

纸质档案数字化技术标准

纸质档案数字化技术标准 1范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235 .1-1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南 GB/T 17235.2-1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试 GB/T 18894 - 2002电子文件归档与管理规范 3术语和定义 下列术语和定义适用于本标准。 3.1数字化 用计算机技术将模拟信号转换为数字信号的处理过程 3.2纸质档案数字化 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数

字图像或数字文本的处理过程。 3.3数字图像 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵 列。 3.4黑白二值图像 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 3.5连续色调静态图像 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。 3.6分辨率 单位长度内图像包含的点数或像素数,一般用每英寸点数( dpi)表示。 3.7失真度 对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。 3.8可懂度 数字图像向人或机器提供信息的能力。 3.9图像压缩 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。纸质档案数字化过程中,较常见的有TIFF (G4)、

纸质档案数字化管理暂行办法

纸质档案数字化管理暂行办法 1.数字化处理要求 1.1扫描方式 1.1.1文书档案和科技档案,不包括超大页面,采用黑白二值图像模式扫描~分辨率设置为每英寸像素。特殊需要时~根据原件的清晰度可适当调整分辨率~增减的多少以扫描后图像按原尺寸显示是否清晰为准。 1.1.2超大页面,页面大小超过A3幅面,采用黑白二值图像模式扫描~分辨率设置为每英寸像素。 1.1.3照片档案采用真彩色图像模式扫描~分辨率设置为每英寸像素。 1.2扫描仪选用 1.2.1文书档案和科技档案,不包括超大页面,应选用高速文档扫描仪。 1.2.2超大页面应选用图纸扫描仪。 1.2.3照片档案应选用真彩色扫描仪。 1.3图像保存 1.3.1文书档案和科技档案,不包括工程图纸,采用双层PDF格式保存~一件保存为一个文档。 1.3.2照片档案采用JPEG格式保存~一张照片保存为一个文档。 1.3.3工程图纸采用TIFF格式保存~一张图纸保存为一个文档。 1.4文件命名方式 采用档案实体中的档号,按卷管理的原件可参照档号编 制一个唯一标识的号码,命名PDF、JPEG、TIFF文档。 2.数字化基本流程 纸质档案数字化的基本流程包括档案出库、案卷,件,

整理、扫描、图像处理、质量检查、生成文档、存储、装订回库共八个环节~由档案员和数字化处理人员共同完成。纸质档案数字化基本流程 流程 1. 出库前检查一档案出库 2. 填写出库单 3. 办理出库 1. 编制页号(第一次) 2. 分类 二案卷(件)整理 3. 第二次编号 4. 取出超大页面 5. 填写加工单 1. 批量扫描 2. 建立文件夹并命名三扫描 3. 超大页面扫描 4. 超大页面插入 1. 纠偏 四图像处理 2. 去污 1. 图像初检 2. 初检纠错处理五质量检查 3. 复检 4. 复检纠错处理 1. 保存文档 2. 文档初检

档案数字化加工项目实施计划方案

新都建设局档案数字化加工项目 实施方案 目录 一、项目概述............................................................................................................ 错误!未定义书签。 1、项目需求分析.......................................................................................... 错误!未定义书签。 1.1档案内容及数量(现场调研)............................................. 错误!未定义书签。 1.2档案数字化环节及质量要求.................................................. 错误!未定义书签。 1.3档案验收.............................................................................................. 错误!未定义书签。 1.4档案安全要求................................................................................... 错误!未定义书签。 二、项目实施准备................................................................................................. 错误!未定义书签。 1、设备配套........................................................................................................ 错误!未定义书签。 2、人员配备........................................................................................................ 错误!未定义书签。 三、项目实施............................................................................................................ 错误!未定义书签。 1、总体实施原则............................................................................................. 错误!未定义书签。 2、人员岗位安排............................................................................................. 错误!未定义书签。 3、项目实施流程............................................................................................. 错误!未定义书签。 3.1档案借出.............................................................................................. 错误!未定义书签。 3.2档案整理排序分卷........................................................................ 错误!未定义书签。 3.3档案录入.............................................................................................. 错误!未定义书签。 3.4整理环节检查................................................................................... 错误!未定义书签。

《纸质档案数字化技术规范》(DAT 31-2005)

《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005) (2008-05-07 12:48:46) (中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施) 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于用扫描仪对各种纸质档案的数字化加工处理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB,T 17235.1 连续色调静态图像的数字压缩编码 T 17235.2 连续色调静态图像的数字压缩编码 GB, GB,T 18894—2002 电子文件归档与管理规范 ITU(CCITT)G3 二值图像压缩算法 ITU(CCITT)G4 二值图像压缩算法 DA,T18—1999 档案著录规则 档案管理软件功能要求暂行规定国家档案局档发[2001]6号 3 术语和定义 下列术语和定义适用于本标准。 3.1数字化 Digitization

用计算机技术将模拟图像转换为数字图像的处理过程。 3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。 3(3数字图像 Digital Image 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。 3(4黑白二值图像 Binary Image 只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。 3(5连续色调静态图像 Continuous—tone Still Image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。 3(6失真度 Distortion Measure 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值。 3(7 可懂度 intelligibility 表示数字图像向人或机器提供信息的能力。 3(8清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。 3. 9分辨率 Resolution 指单位长度内图像包含的点数或像素数。 3.10 TIFF Tagged Tmage File Format 标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑 白档案的复制储存。 JPEG Joint photographic Experts Group 3.11

纸质档案数字化技术规范

纸质档案数字化技术规范 Specification for Digitization of Paper-Based Records 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1 连续色调静态图像的数字压缩编码第一部分:要求和指南 GB/T 17235.2 连续色调静态图像的数字压缩编码第二部分:一致性测试 GB/T 18894 电子文件归档与管理规范 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.3 数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。

缩微胶片档案数字化技术规范

缩微胶片档案数字化技术规X (征求意见稿) 1 X围 本标准规定了缩微胶片档案数字化的主要技术要求。 本标准适用于缩微胶片档案进行数字化及数字化成果的管理。 2 规X性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 DA/T18-1999 档案著录规则 GB/T 18894-2002 电子文件归档与管理规X DA/T 31—2005 纸质档案数字化技术规X 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 缩微胶片档案 microfilm records 记录了档案缩微影像的微粒高解像力的胶片。 3.3 缩微胶片档案数字化digitization of microfilm records 采用缩微胶片扫描仪等设备将缩微胶片上的影像转换为存储在磁盘、磁带、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.4 密度density 在缩微摄影技术中衡量感光材料曝光和显影后变黑程度的物理量,也可用透射密度(D т)来表示,定义为不透明度的基10对数。即: Dт = log10 (1 / て)= log10( Ii / It ) Dт——透射密度

て——透射率,て =( It / Ii ) Ii ——光能 It ——透射光 3.5 解像力 resolution 衡量胶片影像细部能力的物理量,解像力的高低通常以在每毫米胶片上所能分辨的最大线条对数来表示。 3.6 对比度contrast 表示影像中明暗区域相互关系,是影像中最亮与最暗的色调之间差异X围的指数。高对比度可以使数字图像在黑白之间具有较少的灰色层次并且显示出较少的细节,低对比度具有更多的灰度层次及细节。 3.7 曝光亮度 exposure brightness 是决定数字图像明暗强度的指数。高曝光亮度可以使数字图像的色度加深并显示出较多的细节,可以突出浅色信息的痕迹,同时黑白之间出现的底灰加大。 4 基本要求 4.1 基本原则 保护档案原件,减少数字化工作环节,提高工作效率,使档案信息资源方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。 4.2 数字化对象的确定原则 4.2.1应确认档案的内容可以进行数字化。 4.2.2 应确认缩微胶片影像质量符合本规X5。 4.2.3 应选择第二代或第三代缩微胶片进行数字化。 4.3 基本环节 缩微胶片档案数字化的基本环节主要包括:缩微胶片检查、缩微胶片档案整理、缩微胶片档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。 4.4 过程管理 4.4.1 应加强对缩微胶片档案数字化各环节的安全XX管理措施,确保档案的安全。 4.4.2应对缩微胶片档案数字化各个环节的工作状况进行记录,并及时将记录的文字、表格等整理、汇总、装订成册。在缩微胶片档案数字化的同时建立起完整、详细的工作记录,便于查询、数据管理和数据移交。 5 缩微胶片检查

纸质档案数字化基本要求

纸质档案数字化基本要求 1、数字化对象的确定原则 应当对所要进行数字化的对象按照一定的原则和利用方法进行确认,属于归档范围且应永久或长期保存、符合国家有关规定的档案可列入数字化加工的范围。 2、基本环节 纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据挂接、数据验收、数据备份、成果管理等。 3、过程管理 加强纸质档案数字化各环节的安全保密管理机制,同时建立起完整、规范的记录。 4、档案整理 在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。 5、目录数据准备 按照《浙江省省直单位档案室电子目录数据库结构与交换格式》的要求,规范档案目录内容。包括确定档案目录的著录项、字段类型和长度,并对错误或不规范的目录数据进行修改。 6、拆除装订 在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。 7、区分扫描件和非扫描件

按要求把同一案卷中的扫描件和非扫描件区分开。扫描文件区分的原则是:无关和重复的文件,以及文件形成过程中所产生的最后稿本外的其他各种稿本、参考资料、文件处理单等要剔除。 8、页面修整 破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。 8、档案整理登记 制作并填写纸质档案数字化加工过程交接登记表单。 9、装订 扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,案卷不掉页、左边和底边整齐,做到安全、准确、无遗漏。

(完整)2019-2020年整理档案数字化加工方案汇编,推荐文档.docx

档案室、档案馆 馆藏档案扫描、数字化加 工整体解决方案

目录 第一数字化加工作前期准?????????1 一、数字化工作人准???????????1 二、数字化工作件、硬件准????????4 三、确定数字化内容、数量及用需求?????5 第二数字化加工流程及主要技方案???????6 一、入提卷、拆卷?????????????6 二、引著????????????????7 三、档案描????????????????8 四、像理????????????????11 五、全文 OCR、生成双 pdf、板式原及格式? 12 六、?????????????????14 七、批量挂接????????????????15 八、卷及数据份提交???????????15 第三量控制方案和保措施??????????17 一、加工量保障措施???????????17 二、多,多次的量体系?????17 三、段性收与相合的格收程序是量控制的 保障????????????????19 第四安全保密控制??????????????? 21

保密????????????????? 22 第五售后服?????????????????24 项目背景 —————————————————— 随着全国文化信息源共享工程与中国数字工程的起,信息化已成国潮流,信息源建成当之急。信息源建的重点是子文献、各数据、网源、子档案、子等新型数字化信息源的建。 在数字化信息源建中,很大的一个需求是将有的介印刷品数字化, 使之成能用算机、理解、、索的子文件,最将其用于 数据存,或通CD-ROM、Internet网行出版,或上数字档案供用 使用。 以体的保存方式,占据了大量的空,需要特殊的境,而且不方便,随 着的推移,面着腐、老化等。而将介文件信息行子化理,保存到光上,具 有存、管理、共享等功能,可以减少文件房占地,省保管和人方面开支,又方 便和行程。 因此,将档案、期刊、文件等料通描,描成像文件,再通理成子文档, 建立目和索引,制作成子文件,已是当之急。

纸质档案数字化加工方法

纸质档案数字化加工方法研究 中牟县档案局辛向阳 纸质档案数字化就是采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。 纸质档案数字化加工的范围是永久或长期保存的、社会利用价值高的档案。工作中,原则上只扫描密级为公开的档案,有电子稿的文件可以暂时不扫描(可在转换为PDF文档后挂接)。 纸质档案数字化的基本环节主要包括:档案整理、条目录入、档案扫描、图像处理、图像存储、数据挂接、数据备份、数据验收。 一、档案整理 纸质档案的归档是纸质档案数字化的基础。纸质档案的整理要根据文书档案整理办法归档。 纸质档案整理后,根据不同的保管理期限也可以很方便的区分需要数字化的范围。 二、条目录入

本文所讲条目录入、批量挂接、数据库等,都是指PDE 档案管理系统。 (一)选择目录数据库。新法归档用归档文件数据库,老法归档用卷内文件数据库。 (二)新法归档目录录入方法。打开归档文件数据库,点左上角增加,出现档案目录管理对话框,在相应的栏目录入目录著录项即可。如果数据库内已录入条目,点最新目录就把最后保存的目录调出来,在最新目录上修改就可以了,有些重复项目不用再录了,这样就更加方便快速了。 条目录入要求: 1、文件时间用8位数,不足8位的用“0”补齐,如文件时间:; 2、文件题名字数不宜超过50字,因为目录输出时只能显示三行,超过三行字体就不能完整显示(PDE系统自身的问题)。 3、全宗号、件号用三位数编号。如001、002……999。 三、档案扫描和图像处理、存储 档案扫描和图像处理、存储环节联系紧密,一并介绍 (一)扫描仪种类。扫描仪主要可以分为下面3种类型。 平板扫描仪:平板扫描仪有时也叫作CCD扫描仪,使用平板扫描仪扫描时,直接将图片或照片放在扫描仪的平台上即可开始工作。

档案数字化项目投标技术方案设计

一、项目实施方案 (一)项目实施的依据 1、《中华人民共和国档案法》 2、《机关文件材料归档范围和文书档案保管期限规定》(国家档案局第8号令) 3、国家档案局《CAD电子文件光盘存储、归档与档案管理要求》GB/T17678.1—1999 4、《归档文件整理规则》》(DA/T 22—2015) 5、《档案著录规则》(DA/T18-1999)。 6、《纸制档案数字化技术规范》(DAT-31-2017) 7、《电子文件归档与管理规范》GB/T18894—2002 (二)项目实施前准备 1、人员准备 (1)甲方人员 职务:现场交接管理人员 职责:①负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。②负责监督乙方规范化加工。③随时把握乙方加工进度并进行协调。④及时关注并抽查乙方加工质量。⑤代表甲方与乙方进行及时的沟通及问题协调,确保项目顺利完工。(2)乙方人员 2.1 管理人员:主要为熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙方负责人。 2.2 工程技术人员:主要为熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案管理等相关专业知识的乙方技术支持工程师。 2.3 数据采集作业员:主要为了解档案数据库数据标准和计算机软件应用等相关知识的乙方数字化制作工作人员

2、项目设备设施准备 (1)主要加工设备及其技术参数

数字化加工过程中使用的数字化加工管理软件,是档案数字化加工的主要应用工具,也是确保档案数字化加工工作效率和成果质量的关键技术。档案数字化加工软件必须具有扫描、图像处理、著录、校对、质检、自动挂接、查询检索、数据转换、数据上传、数据统计、打印传输等功能,能够满足档案数字化加工全流程各业务环节的需要,以及对加工数据进行质量检查和验收的需要。 (3)其他辅助加工设备 除上述主要加工设备外,在档案数字化加工现场,还需要配备以下辅助设备:办公桌椅、档案存储柜、储物柜、装订机、电熨斗、切纸机、抽湿机、碎纸机以及纸张、档案卷皮、档案盒、装订线、胶水等消耗材料。具体参照招标文件要求或合同约定配置。 3、场地部署准备 (1)各单位应配备专用的数字化加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。一般设在档案部门独立、可封闭的建筑内。 (2)数字化加工场地应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。场地内应配备可覆盖全部场地的报警、防火等应急设施设备。 (3)数字化加工场地应配备满足安全管理需要的视频监控设备,确保档案暂存处、数字化加工工位、服务器、数据导出端及门窗等无监控死角;视频监控数据自产生之日起保存不少于6个月,涉密档案数字化加工监控录像要保存到项目完工数据移交1个月后;档案部门应定期对视频监控数据进行回放检查,在删除视频监控数据之前,要留存视频回放安全检查记录。 (4)数字化加工场地应配备符合国家标准并满足工作需要的档案装具,用于分别存放待数字化处理和已数字化处理的档案。 (5)各单位和数字化服务机构应合理规划、配备和管理档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。 (6)数字化加工场地须封断所有档案数字化加工设备的无线网络功能以及非必要的各终端接口,各单位和数字化服务机构应定期进行相关检测。如有必要,应由县档案局构建数字化加工专用局域网和视频监控专用网。

DAT 31-2005 纸质档案数字化技术规范

纸质档案数字化技术规范 DA/T 32-2005 (2005年4月30日发布2005年9月1日实施) 一、概述 国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。 该标准共分为十三章。其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。 该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。 二、主要条款简介 第一章范围

本标准规定了纸质档案数字化的主要技术要求。本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 第二章规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件其最新版本适用于本标准。 GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。 GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。 第三章术语和定义 下列术语和定义适用于该标准。 (1)数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。

(2)纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。(3)数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 (4)黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 (5)连续色调静图像continuous-tone still image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描利彩色扫描两种模式。 (6)分辨率resolution 单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。

档案数字化建设方案

档案数字化建设方案 档案丄作的数字化建设是顺应潮流,适应时代发展的新举措、新要求,档案做为原生的信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神建设服务。 档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算检索、阅读电子档案,为迎接档案信息服务新环境的挑战、提高管理水平、提高效率、增强档案部门的服务水平、为档案内部管理及面向客户服务提供高效率的全面服务。 完整的档案数字化建设流程包括案卷交接、档案整理、LI录著录、档案扫描、图像处理、OCR文字识别、数字校对、数字质检、数据挂接、整理还原、案卷入库等环节。 业务流程 纸质档案数字化标准:DA/T31-2005《纸质档案数字化技术规范》 DA/T18-1999《档案著录规则》1.制订批次计划 为在数字化处理过程中对纸质档案进行有效管理以及对数字化处 理进行有效控制,需对馆藏档案的数字化处理分批次进行。2.档案出库交接 根据档案数字化加工批次讣划进行出库,对出库的档案进行完整 性检查。 对通过完整性检查的档案,进行数量确认,并详细登记《资料出库单》。 确保资料的交接过程中的数量正确性,完整性; 3.目录著作

按照文件数据库LI录结构与LI录著录要求以及《档案著录规则》(DA/T18)等标准,规范需要LI录补录的档案口录内容,包括确定档案LI录的著录项、字段长度和内容要求等,规范案卷题名、文件名、责任者、起止页号和页数等。 4.档案整理 对出库待加工的档案进行扫描前处理,使之成为能够进行扫描的形态。 拆除装订 影响扫描工作进行的档案,应拆除装订物。 资料及档案内的成册资料严禁拆除。 区分扫描件和非扫描件 区分同一案卷(卷、件)中的扫描件和非扫描件。页面修整 对破损严重、无法直接进行扫描的档案,先期进行技术修复,折皱不平影响扫描质量的原件进行相应技术处理(压平和烫平等)后再进行扫描。确保较薄纸张(如信纸、便笺纸)、破损纸张、底灰较深(如草浆纸、油印纸)、字迹较浅(如铅笔字迹)等纸张的状况较较差的档案扫描图像清晰。 档案整理登记 详细记录档案整理后每份文件的起止页号和页数等情况。装订 扫描完成后,档案按原档案保管单位要求进行重新装订,保持每页档案原有的排列顺序不变、案卷不掉页、右边和底边整齐。 5.档案扫描 黑白扫描采用(300dpi) TIFF格式,彩色扫描采用(300dpi) JPG格式。 照片以原色彩为准(600dpi) TIFF格式扫描。 保证扫描图像效果原原件吻合。 大幅面档案采用大幅面匸程扫描仪或小幅面扫描后进行图像拼接处理。 需要进行OCR文字识别的档案,扫描分辨率?300dpio对资料等成册材料不宜拆卷

纸质档案数字化技术规范 pdf_档案数字化标准

档案数字化标准 本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类] 为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T31—2005]等有关档案数字化的标准规范以下内容 1纸质档案档案数字化标准 1文书、科技档案数字化标准 文书档案和科技档案的数字化通常是以纸介质作为专门的档案载体,其数字化的过程是指通过扫描仪将纸制档案采集为数字化数据并加以处理和存储的过程。其档案数字化必须保证其真实性、有效性、完整性。在使用时必须保证数字化数据能从存储介质中正确读取, 并还原成电子文件以备查询利用。纸质档案数字化的基本环节主要包括档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。

1档案整理 在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。 目录数据准备 按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、贾任者、起止页号和页数等,应进行修改。 拆除装订 在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。 页面修整 破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等) 后再进行扫描。 档案整理登记

档案数字化技术规范

档案数字化技术规范 1 适用范围 为统一集团公司纸质、照片、音频、视频档案数字化的主要技术要求,推动档案现代化和数字档案馆的建设,特制定本规范。 本规范适用于各单位档案的数字化处理及数字化成果的管理。 2 总则 2.1 基本原则 2.1.1 同步检查档案实体质量,确保数字化成果的真实、完整。 2.1.2 采用先进的数字技术,确保数字化成果的长期有效、数据兼容和安全迁移。 2.1.3 采取有效的保护措施,确保档案实体及数字化成果的安全。 2.1.4 确保档案实体与数字化成果间的有机联系。 2.2 过程管理要求 2.2.1制定档案数字化的总体方案、技术路线与工作方法,确保档案数字化工作标准化、规范化和流程化。 2.2.2档案数字化的基本环节主要包括:档案整理、档案扫描(转换)、数据处理、数据存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。 2.2.3建立档案数字化各环节的安全保密机制和工作制度,确保档案数字化工作的安全与高效。 2.2.4档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。 2.3 数据挂接 2.3.1档案数字化转换过程中形成的图像、音频、视频数据,经质量验收合格后,加载到档案数据库服务器。通过编制的程序或借助相应的软件,实现档案数据库条目与相关联的数字图像、音频、视频批量的快速挂接。 2.3.2认真填写档案数字化挂接检查情况登记表单,记录数据关联后的页(张、盘)数,核对每一份文件关联后的页(张、盘)数与档案整理、扫描(转换)时填写的页(张、盘)数是否一致,不一致时应注明具体原因和处理办法。 2.4 数据验收

纸质档案数字化基本流程及技术的要求

纸质档案数字化基本流程及技术要求 纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。具体流程如下: (一)档案整理 在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。 1、目录数据准备 按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。(详见附件) 2、拆除装订 在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物;将档案原件的装订线拆除,排好顺序,不得出现任何漏缺页及顺序差错,更不能对档案原件有任何损坏。 3、区分扫描件和非扫描件 按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关的重份的文件要剔除,有正式件的文件可以不扫描原稿。 4、页面修整 ?对破损严重、无法直接进行扫描的档案,应先进行技术修复、裱糊;

?折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。 5、档案整理登记 制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。 (二)档案扫描 1、扫描方式(扫描前必须准备一台专业的高速扫描仪,并带平板) ?根据档案幅面的大小(A4、A3、AO等)选择相应规格的扫描仪或专业担描仪,如工程图纸可采用0号图纸扫描仪进行扫描。 ?普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描; ?纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描; ?纸质过厚、照片等档案采用高速扫描仪的平板扫描; ?对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描; 2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式) ?页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式; ?页面为黑白两色,清晰度较差或者带有图片的档案材料,以及页面多为彩色文字的档案,采用彩色或灰度模式(因情况而定); ?页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,采用彩色模式扫描。 3、分辨率选择 ?采用黑白、256级灰度模式扫描的文件,其分辨率选择为不小于200DPI; ?采用24位为彩色模式扫描的文件,其分辨率选择为不小于100DPI。 (以上模式分辨率的设定以A4纸张为标准,其他规格纸张酌情处理) ?扫描的线数、阀值、亮度、灰度、对比度等值可根据所扫描文件材料的清晰度进行适当的调整; ?需要时可根据原件的清晰度适当调整扫描分辨率。如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原 尺寸显示后是否清晰为准; ?粘贴折页与表格,对于粘贴折页,可用大幅面扫描仪扫描,或先部分扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫

(技术规范标准)纸质档案数字化技术规范

纸质档案数字化技术规范 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡足不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1-1998信息技术连续色调静态图像的数字压缩编码第一部分:要求和指南 GB/T l7235.2-1998信息技术还续色调静态图像的数字压缩编码第二部分:一致性测试 GB/T l8894-2004 电子文件归档与管理规范 3 术语和定义 下列术语利定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.3 数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 3.5 连续色调静态图像continuous-tone still image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描利彩色扫描两种模式。 3.6分辨率resolution 单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。 3.7 失真度distortion measure 对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。

相关文档
相关文档 最新文档