一直以来,装订文献要做到@ 不失真和均匀照明地扫描是几乎不可▂能的,在德国的 ‘斯图加特’ 市的一个著名的科技小镇‘Tübingen’,一家扫描仪专家“赛数”和在 ‘马格德堡的’ 的一家“电子、信号处理和通讯技术所”的合作下,这个问题现在已成过去。一个名为‘Perfect Book’的创新软硬技术已能夠完美地展平书本中缝和修正变形问题,该技术现在已经应用到新的“赛数”OS12000系列扫描仪上。
装订文献的数字化存档在图书馆和博物馆变得日益重要。在过去,不拆书特别是扫描厚的书本,由于书脊做成页面的弯曲,要影像完全不出现弯曲或□变形几乎是不可能々的。由于表面弯曲引起的变形,做成︻信息在光学字符识别时产生较高错误率。
“赛数”和◣位于马格德堡的“Otto von Guericke大学”內的“电子、信号处理和通讯技术所”就这个基本问题,双方在其硬件和软件的共同开发提出了解决方法。
长久以来在扫描仪技术领域中,对书本和文档变形修正的方法不外是推断頁面上光的分布或∮实际表面↑轮廓线或把页面边缘变◣直方式进行修正。用精确的数学运算和软件来完全解决,使用“平直”和 “平滑”方式 ,将扭曲的线和文字校正。
“赛数公司”的“Orthoscan”也就是使用这种技术,这方法对于消≡除书脊弧面是非常有效的工具,但是在实践中经常有其局限性。如果书本轮廓出现插入便条或页面不完整或边沿破损,做成展平困难,甚至不能展平。
早期插入便▲条或页面损坏影响展平的〇质量和准确性
注 : 只有当书本的上下轮廓线条都能被充份确认,软件和数学运算才可以对其进行精确的 修正和展平※处理。
1 加 1 变成 3 = 3D
“Perfect Book” 是基于硬件和软件相结合的方法,使用“赛数”12000系列扫描仪和“赛数”扫描软件。“Perfect Book”的设计是基于立体视觉系』统,在扫描过程中捕捉页面3D轮廓。除了常用的高分辨率线阵扫描头(图示黄色部份)外,捕捉3D数据需↙要额外具有VGA分辨率(640 x 480像素)的标准USB数码相机,其作用为表面或面阵模型式数码相▂机(图示绿色部分)。
两个成像系统同时捕捉影像,不需要耗时的预扫,达到3D(3维)结构
来自线阵扫描的影像 来自面阵模形拍摄的影像
用线阵扫描产生一个可再生形式的影像。一条光带以可再生♀速度与线阵扫描同步移动,在扫描时照亮原稿。移动光带照亮的影像被一个固定面阵模型数码相机以既定的帧频将㊣ 影像顺序ξ 记录。利用特殊的数学计算,从面阵拍摄的影像频率可以重建扫描页面的轮廓,并在第二阶段转变为一个平面。
从不同角度同时用两个校准的成像系统,可达到高质↓量的修正,“Perfect Book”成功克服♀对纯数学方法在模糊或书边破损时帶来的误差和影响。线阵扫描和面阵拍摄双组合,在扫描平台上产生虚拟的书本△表面3D模型,从既定的坐标系统计算3D表面的等高线作为整个系统的校准。
由於◥使用真的3D数据,“Perfect Book” 不需再只依靠页边来确定位置和格式。页的识别是基于书本右页∮面、左页面和两页之间的高度。当高度数据出①现不等同时,自动加入︼结构性分析确定页边。因此书◣本能自然地打开,操作不但更容易,省时和更能保护书本。 “Perfect Book” 既能非常准确地分开书的两页,在需要打印时就能夠确保最佳打印质量和效果。
“Perfect Book” 自动修正出现在朝向书中缝字符所产生的变形和自动识别页面的∮大小。
Orthoscan 效果 Perfect Book 效果
结果是靠近书中缝变形的字符在扫描过程中被直接正确地排列∩成直线,页与页自动正确地分离。软件更使靠近书中№缝变形的字符变得平直和平整,字与∴字之间更平均,消除中缝阴影◢等。即使字符是隐藏在书中缝也能捕捉清楚无遗。
除了得到高质量打印的好处外, ‘Perfect Book’ 功能清除了书本中缝和边缘的阴影,达至打印时显著节约墨粉。 对于用户更可贵的是在将扫描的文字从影像转换☆为文本格式时,OCR识别的错误率显著▓减少,提高了工╱作效率。
在过去“赛数”已经在照明(曝光)概念上有过一次成功革卐命,现在获得专利的‘LED’(发光二极管)照明技术提供更佳的光聚焦扫描,其结果是更高的◆处理速度和对操作员及』被扫描物提供低于1 lux 小时的曝光量。
由于光聚焦和高能效,可得到更清∑ 晰、无干扰、真彩色的影像。防止阴影的发生和反射光的干涉因而尽量保证光照区朝向书中缝,正好用于有问题的文档, 更何况“Perfect Book” 的面阵模型式相机是不需要额外光源的。
赛数案卷扫描仪为检察院提供完美“perfectbook”扫描功能。