随着新媒体的发展,报纸行业受到了多方面冲击,甚至导致诸如《法兰克福论坛报》和《纽伦堡晚■报》这样具有影响力的报社相继倒闭。但今天的新闻就是明天的历史,报纸档案反映了社会方方面面的真实情况,它具有社会性、历史性、确定性和原始记录性等特性,能够弥补档案史料缺乏完整时间线索的不足,丰富史料内容,因此绝不能将其束之高阁,湮没于尘埃之中,将报纸进行数字化迫在眉睫。让我们首先来了解下大英图书馆是怎么样保存和利用报纸档案的吧!
大英图书馆收藏包括什么?
从十九世纪初々开始,英国报纸★出版业的规模巨大,许多城市和城镇分别针对不同社会地位、地理位置和政治关系的受众,同时出版了数家报纸。大英图书馆收录了1800年以来英国发行的大部分报纸,这些收藏品的品质在世█界上首屈一指。
那么大英图书馆是如何对◣原始报纸展〓开数字化并提供在线获取的呢?
在过去的几年里,他们团队每天扫描原始装订的报纸页面以及缩微胶片,制成数以千计的数字图像。为了形成可ㄨ供利用的数字档案,扫描的页面图片会转化JPEG2000格式,这些图片文件也会通过光符识别(OCR)形成电子文本。这个过程包括将每张图片分解成不同分区以帮助检索,最后,在一个很大的←数据库中,会以输出的光符识别(OCR)文本为基础编制索引。
由于获取了这些原始且←已装订成册,珍贵又脆弱的报纸,大英图书馆数字化扫描并提供在线检索和利用成为可能。
将有价值⊙的文献资料数字化,使其不再受版权保护,是实现这些目标的关键措施。目前大英图书馆正在采用赛数扫描技术将其有价¤值的书籍、手稿和报刊进行数字化。在图书馆的数字化中心,22台赛数扫描仪被用于谨慎且高效▲地对馆藏文献进行数字化扫描。该中心有22台赛〒数非接触式扫描仪,它们“支持最大600 dpi光学分辨率的图像质量和最大A0的幅面”,大英图书馆负责人如此说。