论文部分内容阅读
对于每天要和大量纸质文件、单据打交道的人来说,扫描仪是将这些文档数字化的重要工具,选台得心应手的扫描仪就至关重要了。刚刚宣布推出,就走进PC World中国实验室的佳能DR-4010C高速A4双面彩色文件扫描仪就是一款专门为这类需求定制的产品。
每分钟扫描42页
第一次看到体积只有普通桌面A4激光打印机大小的DR-4010C,我们并没有把它和“高速”联系在一起。当一沓文稿放在进纸口,按下软件中的批量扫描键,它立刻高速运转起来,让我们刮目相看。
在“批量扫描到IPG文件”的模式下,我们测试了DR-4010C的扫描速度,基本达到了42页/min的标称值。值得一提的是,无论单面、双面、黑白还是彩色,它都可以实现这样的高速扫描,具备很高的实用价值。在扫描通道上下两侧,DR-4010C设置了2组3线CMOS接触图像传感器,可以高速获取稿件两面的图像数据。在文档扫描应用中,CMOS传感器灵敏度高、一致性好、体积小等优势得以充分发挥。高效率还表现在易用性上,无论通过扫描仪附赠的CapturePerfect软件,还是机身上的单触式作业按钮,用户都可以轻松控制。
高速并不意味着低质量,我们用600dpi分辨率扫描了一些喷墨打印的照片样张,DR-4010C不仅还原出了精准的色彩,而且细节刻画相当鲜明,细小的墨滴也得到呈现。
软硬通吃
对于高速文件扫描仪,如果只是用标准A4复印纸文稿和彩页进行测试就太单调了。我们选择了一些物流单据、发票,甚至证卡来考验DR-4010C。
从表面上看,DR-4010C的进纸机构仿佛相当简单。稿件放在前进纸通道口,一个可以上下浮动的橡胶滚轮将稿件“拉进”扫描通道,然后直接从扫描仪后部送出,对于比较薄的文稿,用户也可以选择“U”型通道,让扫描后的稿件最后在机身顶部汇集。但为了适应大小、薄厚、硬度、韧性等差距极大的扫描稿件,走纸通道中的驱动轮设计非常讲究,它们采用减速设计,对称分布,保证稿件在行走过程中受力均匀,不会产生偏斜或被撕扯。同时,用户只要掀起扫描仪的上半部分,整个走纸通道就完全暴露出来,即使意外发生卡纸,也非常容易清理。
在我们的测试中,DR-4010C可以说是软硬通吃,各种材质的原稿都可以实现比较流畅地连续扫描,甚至不同材质、尺寸的稿件混合放置,它也能很稳妥地进行处理。在扫描选项中,用户可以打开“超声波检测稿件重叠”的选项,通过位于进纸口的上下2个超声波传感器自动检测是否存在稿件重叠,并让扫描仪重新定位文稿。我们在测试中没有发现稿件重叠现象。
识文断字
配套OCR文字识别软件已经成了扫描仪行业的惯例,虽然其用户很可能针对性地选择自己的OCR系统,但是DR-4010C捆绑的CapturePerfect软件还是集成了OCR功能,让中小型用户可以迅速把扫描仪投入实用。CapturePerfect支持多种语言的OCR,可以实现中、日、英、法等9种文字的识别,而且识别速度非常高,几乎在保存文件的同时,就完成了识别工作。其内置的简体中文OCR引擎对于5号宋体激光输出稿件的识别率在98%以上,中英文混排文字的识别效果也不错,可以满足日常应用。有效的文本增强技术大大提高了DR-4010C的实用性和效率。
更让我们感到方便的是扫描仪驱动中具备的大量图像优化处理功能。要进行有效的OCR,对扫描图像质量有着明确的需求,只有轮廓清晰平滑、背景干净的文稿才能保证高识别率。对于打印、印刷的文稿还好说,但大量的票据不是存在底色,就是因为太薄而露出背面花纹,而且上面的文字可能比较淡,如果要一张张进行手工调整,就会大大降低工作效率,不调整,识别率会非常低。在DR-4010C上,我们只需选择合适的文本增强方式,扫描仪就会自动根据扫描到的图像,判断文字的位置和色彩,进行针对性的优化。对比默认状态和文本增强后的扫描结果,我们发现其优化非常有效,图像背景被处理得很干净,而文字得到了合理突出,甚至一些在普通扫描中淹没在背景色中的淡蓝字体,在优化后也鲜明起来。这大大减少了扫描过程中人工干预的必要,让工作效率得以提升。——刘晖
每分钟扫描42页
第一次看到体积只有普通桌面A4激光打印机大小的DR-4010C,我们并没有把它和“高速”联系在一起。当一沓文稿放在进纸口,按下软件中的批量扫描键,它立刻高速运转起来,让我们刮目相看。
在“批量扫描到IPG文件”的模式下,我们测试了DR-4010C的扫描速度,基本达到了42页/min的标称值。值得一提的是,无论单面、双面、黑白还是彩色,它都可以实现这样的高速扫描,具备很高的实用价值。在扫描通道上下两侧,DR-4010C设置了2组3线CMOS接触图像传感器,可以高速获取稿件两面的图像数据。在文档扫描应用中,CMOS传感器灵敏度高、一致性好、体积小等优势得以充分发挥。高效率还表现在易用性上,无论通过扫描仪附赠的CapturePerfect软件,还是机身上的单触式作业按钮,用户都可以轻松控制。
高速并不意味着低质量,我们用600dpi分辨率扫描了一些喷墨打印的照片样张,DR-4010C不仅还原出了精准的色彩,而且细节刻画相当鲜明,细小的墨滴也得到呈现。
软硬通吃
对于高速文件扫描仪,如果只是用标准A4复印纸文稿和彩页进行测试就太单调了。我们选择了一些物流单据、发票,甚至证卡来考验DR-4010C。
从表面上看,DR-4010C的进纸机构仿佛相当简单。稿件放在前进纸通道口,一个可以上下浮动的橡胶滚轮将稿件“拉进”扫描通道,然后直接从扫描仪后部送出,对于比较薄的文稿,用户也可以选择“U”型通道,让扫描后的稿件最后在机身顶部汇集。但为了适应大小、薄厚、硬度、韧性等差距极大的扫描稿件,走纸通道中的驱动轮设计非常讲究,它们采用减速设计,对称分布,保证稿件在行走过程中受力均匀,不会产生偏斜或被撕扯。同时,用户只要掀起扫描仪的上半部分,整个走纸通道就完全暴露出来,即使意外发生卡纸,也非常容易清理。
在我们的测试中,DR-4010C可以说是软硬通吃,各种材质的原稿都可以实现比较流畅地连续扫描,甚至不同材质、尺寸的稿件混合放置,它也能很稳妥地进行处理。在扫描选项中,用户可以打开“超声波检测稿件重叠”的选项,通过位于进纸口的上下2个超声波传感器自动检测是否存在稿件重叠,并让扫描仪重新定位文稿。我们在测试中没有发现稿件重叠现象。
识文断字
配套OCR文字识别软件已经成了扫描仪行业的惯例,虽然其用户很可能针对性地选择自己的OCR系统,但是DR-4010C捆绑的CapturePerfect软件还是集成了OCR功能,让中小型用户可以迅速把扫描仪投入实用。CapturePerfect支持多种语言的OCR,可以实现中、日、英、法等9种文字的识别,而且识别速度非常高,几乎在保存文件的同时,就完成了识别工作。其内置的简体中文OCR引擎对于5号宋体激光输出稿件的识别率在98%以上,中英文混排文字的识别效果也不错,可以满足日常应用。有效的文本增强技术大大提高了DR-4010C的实用性和效率。
更让我们感到方便的是扫描仪驱动中具备的大量图像优化处理功能。要进行有效的OCR,对扫描图像质量有着明确的需求,只有轮廓清晰平滑、背景干净的文稿才能保证高识别率。对于打印、印刷的文稿还好说,但大量的票据不是存在底色,就是因为太薄而露出背面花纹,而且上面的文字可能比较淡,如果要一张张进行手工调整,就会大大降低工作效率,不调整,识别率会非常低。在DR-4010C上,我们只需选择合适的文本增强方式,扫描仪就会自动根据扫描到的图像,判断文字的位置和色彩,进行针对性的优化。对比默认状态和文本增强后的扫描结果,我们发现其优化非常有效,图像背景被处理得很干净,而文字得到了合理突出,甚至一些在普通扫描中淹没在背景色中的淡蓝字体,在优化后也鲜明起来。这大大减少了扫描过程中人工干预的必要,让工作效率得以提升。——刘晖