分类
2022塞尔维亚队世界杯在线入口

《录音录像档案数字化规范》解读

2017年8月,档案行业标准《录音录像档案数字化规范》(DA/T 62-2017)正式发布,于2018年1月1日起实施。笔者作为本标准的主要起草人之一,全程参与了本标准的起草和编制。

全国各级档案部门都保存着大量的录音录像档案,随着时间的流逝,受自然衰变和保管条件等诸多因素的影响,录音录像档案正在慢慢地损坏。同时,由于技术发展等原因,许多种类的读取设备正在或者已经消失,如果不及时采取措施抢救这些珍贵的档案信息资源,将给国家和社会造成无法弥补的损失。因此,利用传统读取技术和计算机技术相结合的方式,对录音录像档案进行数字化处理,形成数字档案资源,已经刻不容缓。但是,在数字化实践中由于录音录像档案种类多、技术依赖性强、技术标准不统一等问题,增加了数字化工作的复杂性和技术难度,数字化成果质量无法保证,极大地制约了录音录像档案数字化工作的开展。在这样的背景下,2012年,由国家档案局技术部、国家档案局档案科学技术研究所等部门和单位共同起草编制《录音录像档案数字化规范》。

《录音录像档案数字化规范》规定了模拟录音档案和录像档案数字化的技术和管理要求,明确了录音录像档案数字化工作组织与管理、数字化工作流程、数字化技术标准等内容,保障了录音录像档案数字化工作的规范性和科学性,在一定程度上推进了我国录音录像档案数字化工作的开展。

数字化加工流程的科学与规范,是确保数字化成果质量和效率的重要条件。标准起草组通过对各地录音录像档案数字化加工实践经验的总结和归纳,确定了一套科学合理、普适性强的工作流程。

档案出库明确了档案出库过程中的管理要求,交接双方应认真做好出库档案的检查、清点和登记工作,确保档案安全。

数字化前处理是为后续的信息采集做准备,需要对录音录像档案载体的外观进行检查,对有问题的载体要进行适度的清洗或修复操作;对录音录像的声音、画面的质量做检查,对存在问题的做好记录。

结合实际情况,数据库建立分为两种情况,部分单位在录音录像档案数字化之前就已经做好目录数据库建立的工作,对于这部分单位只需在数字化加工过程中对目录数据库的质量进行检查,确保目录数据库的规范性和准确性;另一部分单位是还未建立目录数据库,对于这部分单位首先需要制定目录数据库数据著录规则,数字化加工过程中按照目录数据著录规则完成信息著录,并可采用自动校对和人工校对相结合的方式对目录数据质量进行检查。在现阶段,目录数据库数据著录规则的制定可以参考《录音录像类电子档案元数据方案》(DA/T 63-2017)。

信息采集是数字化加工流程中最重要的一个环节。首先明确了录音录像信息采集的基本要求,再对信息采集设备、技术参数、文件切分与著录、文件命名、质量检查、档案恢复提出了具体的要求。其中数字化技术参数是本标准中最重要的内容,具体说明详见后续章节。

对于音视频处理环节,可以这样理解,采集完成的音视频档案,可以按照不同的用途保存两套,一套用于利用,一套用于长期保存。对于提供利用的这套,可以适当的进行压缩、降噪、振幅标准化、去蒙尘、去划痕、校色等操作;对于长期保存的这套建议采用原始音视频文件保存,随着技术进步,降噪、校色等处理技术会更加完善,若原始文件仍然留存,便可在未来获得质量相对更佳的处理后文件。

数据挂接是通过档号或者原始介质索引号建立目录数据与音视频文件的关联,建立音视频文件与档案原件的关联。挂接完成后,需要对挂接结果进行逐条检查,及时发现错误,确保挂接质量。

数字化成果验收与移交明确了验收方式、验收内容、验收指标、验收结论和移交手续等内容。验收内容不仅包括档案目录数据、音视频文件、挂接成果,还应对工作文件、存储载体进行验收。在验收方式上,尽量选择计算机自动校验的方式,既能提高验收的质量和效率,也使数字化成果100%全面检测成为可能。另外针对档案数字化成果验收指标进行科学划分,对于能够通过计算机程序自动化方式验收的指标,提出100%验收比率和100%合格率的要求。对于无法采用自动化验收的指标,也根据具体情况提出了不同的合格率要求。

数字化技术参数是决定录音录像档案数字化加工质量的关键因素。本标准提供的数字化技术参数是标准编制组在试验对比的基础上得出的成果,可执行性较强。

声音从模拟信号转化成数字信号的过程如下图所示,其中比较重要的技术参数有采样率、量化位数、编码格式。

采样率是指录音设备在单位时间内对模拟信号采样的多少,目前主流的采样频率一般共分为11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五个等级。人耳最基本的听觉要求,1s采样至少40000次,即40KHz,常见的CD,采样率为44.1kHz。因此,要求录音档案的采样率不低于44.1kHz。对于珍贵的档案或者是含有音乐的档案,可以采用96kHz或更高的采样率,能够准确捕捉噪声以及人耳难以感知的声音,如听不见但影响音质效果的和声,可在未来被新算法捕捉的辅助信息等。

量化位数是指每一次采样周期内声音模拟信号的积分值。数值越大,解析度越高,声音就越真实。为了能完整的保存原录像文件中所有的声音细节,建议采用较高的24bit进行采集。

录音格式建议采用WAVE格式,是多媒体中使用非常广泛的声音波形文件之一,文件扩展名为“wav”,支持无损压缩,保存音质非常高,适合数字音频文件的长期保存。

录像档案数字化涉及的关键技术参数包括视频编码方式、帧率、分辨率、色度采样率、视频量化位数、视频比特率、音频编码格式、音频采样率、音频量化位数、声道、文件格式。

视频编码方式就是指通过压缩技术,将原始视频格式的文件转换成另一种视频格式文件的方式。视频编码方式的选择综合考虑了压缩效率、画面质量、应用范围、长期保存等方面的因素。标准里明确,针对普通的录像档案,可以采用H.264或MPEG-2 IBP的视频编码方式;对于珍贵或有特别用途的录像档案,建议采用无压缩的方式。

从通用性和长期保存角度考虑,视频文件格式建议采用AVI或MXF格式。AVI英文全称为Audio Video Interleaved,即音频视频交错格式,是一种常见的视频文件格式。它把音频文件和视频文件包含在一个文件容器中,将视频和音频交织在一起进行同步播放,是使用非常广泛的一种视频格式。MXF是英文Material eXchange Format(素材交换格式)的缩语,是SMPTE(美国电影与电视工程师学会)组织定义的一种专业音视频媒体文件格式,主要应用于影视行业媒体制作、编辑、发行和存储等环节。对于珍贵或有特别用途的录像档案,可以采用MXF格式保存。

视频分辨率、视频比特率,标准中按照视频的清晰程度给出了不同的标准。在录像档案数字化过程中,如果按照用途要采集多套,可以分别选择不同的参数。

其他的如帧率、画面宽高比等参数,为真实反应档案原貌,建议与档案原件相同。

数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注