论文部分内容阅读
今天—上班,主任就扔过来一个合同文件,让我赶紧把文件输入电脑,保存为个Word文档给他,他要进行修改,越快越好。我晕,以我的打字速度,这么厚一份文件要逐字敲进电脑,真是要命啊!最近在同事面前出糗太多,不好意思再去打扰他们,只好赶紧给哥们儿小Z打电话求救。小Z哈哈一笑:“干嘛不用Office里的OCR工具,来个一‘扫’平天下!”
Step 1 安装
拓小z说,在Miraosoft Office 2007中,有一个工具组件“MicrosoftOffice Docunlent Imaging”,可以直接执行光学字符识别(OCR),能从图片中“抠”出文字,并转换成文档。哇!那太好了!说干就干。可是我打开电脑寻觅了一圈也没找到这个组件,只好又去骚扰小Z。小Z说一般默认情况下并没有安装这个组件,需要手动安装。选择“开始”→“设置”→“控制面板”→“添加/删除程序”→“Microsoft Officc Profcssional Plus2007”,然后单击“更改”按钮,在弹出的窗口中选择“添加或删除功能”,单击“继续”,在接下来的窗口中展开“Office工具”→“MicrosoftOffice Docunlent Imaging”→“Microsoft Office Document IinagingWriter”,然后选中“从本机上运行”命令,按向导提示完成安装后重新启动计算机就可以了。
Step 2 转换
小z正要告诉我接下来的操作步骤,我得意洋洋地打断了他:“行了,我知道了,后面的操作应该很简单,我摸索一下肯定就会了,你可以消失了。”挂了电话后先把文件拿去扫描成图片文件,再打开Word 2007,将图片粘贴进去。然后呢?然后怎么办?自高自大真是害死人啊!可怜的小Z再一次被我“骚扰”,这次我很虚心地在他的指导下单击“文件”→“打印”,然后在弹出打印对话框中单击“名称”按钮,从下拉列表中选择“Microsoft Office Doctlnlcnt hnaging Writer”打印机。接下来,单击“属性”按钮,在弹出的对话框中选择“高级”选项卡,将输出格式设置为“MDI-压缩文档格式”,单击“确定”按钮并没定好文件输出路径及文件名,最后点击“保存”,即可生成一个MDI格式的文档。
Step 3 提取
双击打开刚才保存的MDI格式文件,用鼠标选择文字内容,被选中的内容将出现在红色的方框内。然后选择菜单栏的“工具”→“将文本发送到Word”,在弹出来的对话框中单击“确定”按钮,Microsoft office Docui]leot Imagmg会自动调用OCR扫描组件对图片中的文字进行扫描,并将文字“抠”出来,还能把内容自动转换为一个Word文档。这样就小用敲到手指酸麻了,只需动动鼠标就一切搞定,简直太神奇啦!接下来嘛,只需要在Word文档中校对并编辑文字和格式就可以存盘了。
一个小时后,我终于将这份在通常情况下要用半天时间才能全部输入电脑的文件搞定了。又用了一个小时仔细浏览了一遍,没想到准确率还蛮高的,差不多80%、为我节省了80%的精力啊!这个工具还真是聪明。不过咱的扫描仪也不怎么样,要是扫出来的图片更清楚,抠字准确率会更高。我在Word文档中把识别不正确的字很快就修改好了,然后通过MSN传给了主任,主任立刻发过来一个惊讶的表情,嘿嘿,主任一定以为遇到了打字神手。我偷偷地擦了把汗,心里大叫了一声:“哦耶!又闯过一关!”
Step 1 安装
拓小z说,在Miraosoft Office 2007中,有一个工具组件“MicrosoftOffice Docunlent Imaging”,可以直接执行光学字符识别(OCR),能从图片中“抠”出文字,并转换成文档。哇!那太好了!说干就干。可是我打开电脑寻觅了一圈也没找到这个组件,只好又去骚扰小Z。小Z说一般默认情况下并没有安装这个组件,需要手动安装。选择“开始”→“设置”→“控制面板”→“添加/删除程序”→“Microsoft Officc Profcssional Plus2007”,然后单击“更改”按钮,在弹出的窗口中选择“添加或删除功能”,单击“继续”,在接下来的窗口中展开“Office工具”→“MicrosoftOffice Docunlent Imaging”→“Microsoft Office Document IinagingWriter”,然后选中“从本机上运行”命令,按向导提示完成安装后重新启动计算机就可以了。
Step 2 转换
小z正要告诉我接下来的操作步骤,我得意洋洋地打断了他:“行了,我知道了,后面的操作应该很简单,我摸索一下肯定就会了,你可以消失了。”挂了电话后先把文件拿去扫描成图片文件,再打开Word 2007,将图片粘贴进去。然后呢?然后怎么办?自高自大真是害死人啊!可怜的小Z再一次被我“骚扰”,这次我很虚心地在他的指导下单击“文件”→“打印”,然后在弹出打印对话框中单击“名称”按钮,从下拉列表中选择“Microsoft Office Doctlnlcnt hnaging Writer”打印机。接下来,单击“属性”按钮,在弹出的对话框中选择“高级”选项卡,将输出格式设置为“MDI-压缩文档格式”,单击“确定”按钮并没定好文件输出路径及文件名,最后点击“保存”,即可生成一个MDI格式的文档。
Step 3 提取
双击打开刚才保存的MDI格式文件,用鼠标选择文字内容,被选中的内容将出现在红色的方框内。然后选择菜单栏的“工具”→“将文本发送到Word”,在弹出来的对话框中单击“确定”按钮,Microsoft office Docui]leot Imagmg会自动调用OCR扫描组件对图片中的文字进行扫描,并将文字“抠”出来,还能把内容自动转换为一个Word文档。这样就小用敲到手指酸麻了,只需动动鼠标就一切搞定,简直太神奇啦!接下来嘛,只需要在Word文档中校对并编辑文字和格式就可以存盘了。
一个小时后,我终于将这份在通常情况下要用半天时间才能全部输入电脑的文件搞定了。又用了一个小时仔细浏览了一遍,没想到准确率还蛮高的,差不多80%、为我节省了80%的精力啊!这个工具还真是聪明。不过咱的扫描仪也不怎么样,要是扫出来的图片更清楚,抠字准确率会更高。我在Word文档中把识别不正确的字很快就修改好了,然后通过MSN传给了主任,主任立刻发过来一个惊讶的表情,嘿嘿,主任一定以为遇到了打字神手。我偷偷地擦了把汗,心里大叫了一声:“哦耶!又闯过一关!”