AIIM 首席分析师 Bob Larrivee认为,“文档准备是扫描作业的最大难题。”执行扫描操作时,文档预分类至少占据50%的人力和工时。 即使待处理文档都是相同类型,操作人员也会面临诸多挑战,如文件尺寸不一、纸张颜色不同、纵横方向混合。这些问题往往需要复杂繁琐的手动操作进行处理,使用复印机设置高对比度复印文档,再重新扫描。
Kodak Alaris高级图像处理团队现在找到了彻底省去文档准备过程的解决方案——完美页面技术,依靠先进的图像增强功能,处理疑难文档和混合批次。
• 纠偏和自动裁剪:
表单、书信一般大小各异,而且通常不是标准尺寸。如下图一,文档方位不正带有明显黑色背景,图二错误裁减则会影响后续处理, 通过Kodak Alaris完美页面技术裁剪图像时将会识别文档核心区域,再经过图像校直让文档四边与输出图像边缘平行,呈现图三所示的完美页面。
• 自动调整方向:
有时,横向扫描可以有效提高吞吐速度,同时避免进纸问题,如粘性边缘。这就需要扫描仪具备处理成批纵横混合文档的定向能力。
首先,须将所有横向文档固定旋转 90 度;若出现文档滑动,就要做到实时方向调整,基于图像内容检测纠正文档方向;横向双面扫描则可组合应用默认旋转和自动调整方向。
• 自动校正亮度:
无需复印机提升文档对比度,自动调整图像亮度至最佳水平,且不降低扫描速度。把每幅图像中最亮色彩尽可能提亮,最暗色彩尽可能加深,文档图像质量得到显著提升。
• 锐化:
增强边缘对比度,使文档内图像或文字更鲜明,进而加快 OCR 读取速度。
• 智能背景颜色处理:
图像平滑功能最大限度减少背景色差,提供“更干净”的图像,更接近数字文档。这通常会同步压缩图像大小。如文档需要突出前景(如文本、线条等),可使用智能前景突出功能。
• 去除褶皱条纹:
条纹过滤技术解决了最常见的图像质量问题之一——处理原始图像的垂直黑线。条纹问题一般缘于扫描仪外壳下积聚的隐藏灰尘。定期清洁也能避免这种问题,而图像增强技术可在出现问题后去除或减少条纹。
• 减少噪点:
堆积灰尘或纸张较差(如再生纸)造成的小点(即“噪点”),是彩色文档转换为黑白图像的另一个常见挑战。噪点消除算法有效去除单个点(孤立像素)、像素(多数法则)甚或更大像素组(去除背景噪点)。
• 所有颜色滤色:
自动化表单处理必须使用滤色功能,即通过优化黑白图像提高 OCR 读取率。完美页面技术智能识别并去除多种主要颜色或自定义颜色,减少手动操作,确保最佳读取速率。
• 双流扫描:
黑白扫描同时生成彩色扫描也是一项重要功能。彩色图像是人机交互界面的首选,而自动化数据索引提取则需要经过优化的双色调(黑白)图像。双流扫描可同时创建黑白、彩色两种文件。
• 照片分割:
一个文档包含文本和图片(如护照申请或保险索赔)必须区分照片和文本区域,对每个区域运用不同处理技术,对彩色图像采用照片裁剪功能。如需双色调图像,完美页面技术可使照片变为灰度图像,而条形码等其他元素不会受到任何影响。
• 改进 OCR 读取速率和二进制化“智能阈值处理(iThreshholding)”:
二进制化(即彩色图像转化为黑白图像)是所有数据提取功能的核心,也是任何图像处理的基础。 如果一批文档质量参差不齐,二进制化和图像增强需求也会天差地别。完美页面技术自动分析文档图像的前景和背景,评估亮度和对比度,动态设置最佳阈值,从而优化整体图像质量和文件大小,大幅改进阴影/半色调文档的字符识别等问题。
完美页面技术提供优化图像质量的多种自动功能,省去了复杂繁琐的手动文档准备或扫描操作。
• 文档准备化繁为简,完全不必预先分类。
• 处理混合文档批次,各种方向、尺寸、类型、形状均可自动识别。
• 显著提升 OCR/ICR 效果,异常处理降至最低。
|