论文部分内容阅读
OCR是光学字符识别(Optical Character Recognition)的简称。一般意义上说,OCR软件从扫描仪扫描得到的文稿的图像文件中自动识别出文字,并生成可编辑排版的文本文件。在中文OCR领域中,清华文通TH-OCR一直以共识别准确率高,速度快,实用性强等特点获得用户与专家们的好评,市场占有率也超过60%。最近,《个人电脑》中国实验室测试了最新的TH-OCR MF7.5版。 TH-OCR既支持标准的Twain扫描界面,又可