陈孝萱新性研究
^质量控^
旧报纸是研究近现代历史的重要文献,但由于自身年代和用纸等主客观原因,很多旧报纸没能很好保存,有的损坏,有的发黄变脆,甚至一翻就碎。有些旧报纸因属于孤本,弥足珍贵,但却无法提供给大众和研究人员,满足其使用需求。随着计算机技术和互联网的不断发展,新时代和新技术为藏用并举、远程使用旧报纸提供了可能,数字化成为必然趋势。
数字化加工旧报纸的深度一般分为3个层次:①数字化基础工作。进行载体转换,处理成数字图像;②数字化篇章信息著录。在数字图像的基础上进行标题文字识别;③在数字图像基础上进行全文识别和版面还原。旧报纸转换为数字图像,如果有微缩胶片,则优先采用扫描胶片的方式。对于幅面较大的旧报纸,则需采用扫描仪进行转换。这种方式不但需要昂贵的大幅面扫描仪,而且扫描过程需要拆包压平,对旧报纸造成损害。因此,采用单反相机进行翻拍更加简单易行。
笔者在审核采用单反相机进行翻拍的60多种近2000册珍贵的旧报纸数字图片时发现,图片质量的控制对版面信息标识、标题和全文数字化有重大影响,旧报纸翻拍图片的质量是后续标引和识别的基础。本文
从旧报纸翻拍实践出发,针对常见的图像质量问题,制定图像分辨率、白平衡、图片亮度、清晰度、几何畸变和彩还原等标准遥通过标准化翻拍环境、旧报纸整理、单反相机设置、拍照和图像数据审核流程,为翻拍图片质量验收提供依据,并以此作为操作规范,形成旧报纸翻拍的统一图片质量标准。
本文分为3部分:第一部分描述翻拍旧报纸的环境及翻拍流程;第二部分说明翻拍过程的图像质量控制指标;第三部分进行总结。
翻拍环境及流程
为了提高翻拍质量和一致性,稳定可控的翻拍环境是基础。采用固定翻拍架(如图1所示),可以控制旧报纸翻拍环境的亮度、温,减少环境变化干扰。因此,参考高清新闻演播室的灯光方案,翻拍时采用温为5600K的光源,控制旧报纸上的亮度不低于6001ux。具体翻拍流程如下。
W创新性研究
图1翻拍架
1.旧报纸整理
①馆藏梳理:把要翻拍的旧报纸按报种、出版时间整理好,便于补漏,保证数据的完整性;②平整:拍摄前先查看旧报纸质量,清洁旧报纸,把粘在旧报纸上面的书虫、碎片小心处理掉。有折角折皱的先做平整处理。有破损的垫上同系牛皮纸袁目的是不叠字,达到最佳的图片质量。
2.相机设置
为了达到更好的图像质量,采用全画幅单反相机和50mm固定焦距镜头,减少镜头变形,提高锐度;由于环境光源固定为单温5600K,将白平衡设置为手动,温5600K与环境灯光一致;光圈采用景深与衍射平衡较好的F8,避免景深太小或衍射引起的模糊;感光度设为ISO100,减少相机传感器的底噪;快门采用自动快门,测光采用均匀测光,手动对焦。相机输出图片格式为JPG和RAW,JPG采用最精细模式减少压缩损失,RAW 图像输出的特点是没有经过数码相机的预处理,图像信息是传感器原始信号,为后期处理提供了白平衡、亮度、降噪、清晰度、调曲线等调整工具。不同品牌的单反相机的RAW文件采用不同后缀名,佳能相机RAW文件后缀是CR2或CR3,尼康的RAW后缀名为NEF o
3.开始拍照
保证数码相机每一拍和原报或原报合订本的顺序一致袁有利于审核校对和从图片溯源到原报或原合订本。从效率、统一性的角度考虑,报纸采用单双面同一台相机分开拍摄,目录下建立01、02子目录,审核的时候再合并成册。文件名由系统自动生成,不手工改动数据,确保图像顺序与报纸顺序完全一致。翻拍过程中碰到漏拍、重拍的问题,后期审核的时候再进行删除、插入。最后合并成册。
4.版面审核
把拍摄好的图片按格式分开(JPGNEF或CR2)后,分别对两个格式图片进行统一命名,查看每一拍的JPG图像,审核是否有漏拍、重拍、颠倒、模糊、倾斜、阴影、遮盖及拍摄不全等情况。标注后,让拍摄人员进行补拍、重拍,进行图片比对后,再进行图片删除、插入、替换,最后再重命名,合并图片成册,完成电子图片的预处理。
图片质量控制指标
图片质量控制即图片质量标准确定及检查,旧报纸翻拍质检工作要求对旧报纸翻拍输出的图像数据和版面信息进行检查、标引,做到一致的效果。标弓I包含报纸的种类、版面基本信息等。
对翻拍的图片,涉及拍摄图像分辨率、清晰度、畸变和彩等技术参数,采用量化客观标准和主观判
断,以保证报纸完整准确地呈现给读者。客观标准含图片清晰度、亮度、白平衡、完整性及畸
W创新性研究
变等,主观判断含彩准确度、彩饱和度、版面破损、折皱及遮盖等。通过调整拍摄环境,优化相
机设置,让翻拍的旧报纸尽可能接近原报彩,让读者电脑查看时,有更好的视觉体验。
翻拍过程中碰至啲问题主要有以下几点:①异物遮盖,破旧报纸有碎纸片、书虫等异物文字遮盖;
②装订遮盖边缘拍摄不全;③折皱遮盖,报纸折皱文字遮盖;④手影拍摄,由于翻页过快拍摄到手指或身体遮住光源,导致图片阴影等;⑤报纸多拍、漏拍问题。可采取的措施是,每一本报纸在翻拍前先把页面上遮盖的异物小心去除,提前用折皱压板进行平整处理,在破损的报纸下面垫上同系纸,避免下面一张报纸文字跟当前报纸文字混在一起,影响阅读。拍摄的时候把握节奏,避免拍到手指或因拍摄人员挡住灯光造成阴影。边缘装订遮盖的把装订线拆开再拍摄。
每一张照片对应一个编号,进行简单版面信息标引,便于以后网上查阅。最后,清点文献的册数,按种类、年月顺序装箱,贴上标签,上架,完成文献提取的全部程序。
燕云台以下提出图片质量控制指标,在实践中能够很好地满足不同批次的拍摄要求遥
1.图片分辨率
边角裁10%后分辨率尽量满足300dpi输出要求,一版图片分辨率为:5792X8688。边角裁剪10%的原因有:中心成像质量高,镜头边角有暗角/亮度衰减,相机高度需根据报纸幅面做调整,在保证拍摄完整画面的情况下尽量放低以保证图像的有效像素;相机一定要平行于报纸,避免图像变形。
2.手动白平衡
在阳光、阴霾的天气及室内各种灯光下,人们所看到的白物体颜恒为白,因为人的大脑可以侦测并且更正这样的彩改变,进行自我适应。但是相机不具有自适应功能,需要利用白平衡进行校正。自动白平衡会由于旧报纸偏黄而出现误判。根据翻拍架光源温,把相机白平衡设置为手动模式,温设为5600K,与光源温一致,避免白平衡偏差。如果不知道灯光的准确温,也可以采用自动白平衡,让相机拍白纸自动计算温,再运用到旧报纸拍摄。
3.图片亮度
旧报纸一般为黑字和偏黄背景,采用自动曝光,图片灰度直方图背景亮度分布最大值接近110,主观显示与原始报纸较一致,如图2所示。
r~]平購显示叼文件信息叼EXIF偌息叼亶方图小众却惊艳的文案
⑥®!i^l.q貝鐵4老a x
生獴蹲,對彈胶女並暗是•診紙■還人;爭:牡甲声E加“d士—・■■■■■__
一_—~»亠-■亠A j I-M-hD r r•
图2图片亮度直方图
064__12L
4.图片清晰度
按原始尺寸放大图片,旧报纸中间和边缘都清晰不模糊。5.图片几何畸变
如图3所示,桶形/枕形畸变小于2%遥
弋创新性研究
正常物体枕型畸变桶型畸变
1®
图3几何畸变示意图forinstance
6.图片彩还原
发黄的旧报纸中有些内容采用套印突出宣传重点。为了精确还原彩,采用拍摄24标准卡,通过识别块产生配置文件进行校正。
全球票房排行榜
通过以上对单反相机各参数的正确设定,可以拍出质量合格、批次统一的图像,进行标引遥通过上述步骤,可以做到旧报纸翻拍质量有标准可依,方便拍后检查,保证质量一致可控,方便推广到不同批次的旧报纸,在不同地方实现翻拍。审核完成的图片上传到指定服务器,按照编码规则统一重命名,打上水印,根据不同使用需要转换不同尺寸,做好文件的存档备份,建设简单的数据库。把翻拍好的旧报纸分类装箱贴上标签密集存放。
结论
笔者通过审核翻拍的60多种近2000册旧报纸,制定出检查单、拍摄规范及审核标准,用于不同批次数字化推广,避免返工,获得了良好效果。
多数旧报纸长期保存在书库中,藏而不用,鲜为读者所知。数字化完成后,可以通过宣传,让读者及时了解资源的特及检索方法,主动对读者进行培训,努力提高读者通过网络利用资源的操作技能。此外,在尊重知识产权保护版权的前提下,增强开放性,适当开放使用限制,尽可能让用户可以通过网络随时随地利用资源。对于提高资源的利用率,充分实现资源的社会价值,具有十分重要的意义。
(作者单位:厦门大学图书馆)参考文献
[1]肖红,槐燕.民国报纸数字化实践中的质检问题探析[J].
快餐品牌图书馆学研究,2017(07):61-78+87
[2]李彦杰,沈志伟.数字工作流程中的图像处理[J].印刷技
术,2019(04):20-26
发布评论