电子图书的利用探讨

来源 :东方教育 | 被引量 : 0次 | 上传用户:liujj08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】从电子图书的利用出发,引出表格式PDF图像转换为可编辑EXCEL文档的问题,网络求解不可得,转而从OCR软件识别求解,顺利解决了该问题。
  【关键词】电子图书利用;PDF图像;EXCEL文档;OCR识别
  1 引言
  电子图书又称e-book,是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备使用,并可复制发行的大众传播体。类型有:电子图书、电子期刊、电子报纸和软件读物等。
  电子图书是未来的一种发展趋势。读者在利用电子图书时会出现很多的问题。这些问题可分为两类,一类是容易解答的,像浏览器要升级、阅读器的下载安装等属于这类;另一类是难于解答的,如表格式PDF图像转换成可编辑的EXCEL文档。
  2 求解过程
  从事读者服务工作的馆员大多是搜索高手,网络达人,解决此类问题似乎不难。利用搜索引擎,如百度、谷歌。
  2.1 将PDF转换成EXCEL的工具
  笔者以“pdf”和“转换EXCEL”为关键词,在百度中搜索,选择前10页的搜索结果进行验证,无论是在线转换工具,转换软件,经验方法等都不可行。转换出现以下情况:
  2.1.1 完全不能转换;
  2.1.2 转换后乱码;
  2.1.3 软件、方法都不存在,骗点击率的网站;
  2.1.4 一定要具有EXCEL典型特征的PDF文件才可以转换;
  2.1.5 PDF有加密不能转换;
  2.1.6 收费软件。
  非常明显,第1-3情况不符合要求,第4-6种情况设有条件,但作者满足其条件后,转换仍然没有成功。
  2.2 将表格式PDF转换成第三方格式,再将第三方格式转换成EXCEL。
  笔者采用了两种方法,第一种是电子图书自带的工具,如文字摘录、文本选择、剪切等工具将表格式PDF内容粘贴到WORD或者TXT文档中,出现如图1结果
  图1中有表格线,也有文字,文字可以编辑,但表格线只能删除或插入字符,不可完全编辑,方法不可行。
  第二种方法是将表格式PDF转换成WORD等第三方文件,再将第三方文件转换成EXCEL。将表格式PDF转换成第三方文件过程中出现以下情况:
  2.2.1 加密表格不能转换
  2.2.2 竖排表格转换后乱码
  2.2.3 转换后仍旧是图像文件,不可编辑。
  因达不到可编辑要求,转换失败。
  2.3 用OCR软件识别后,输出EXCEL。
  笔者采用最有代表性的汉王PDF OCR软件进行识别,识别后可输出TXT、RTF、HTML、XLS四种格式的文件,转换成功。
  3 方法步骤
  3.1 将电子图书中的表格扫描成PDF文档。如果电子图书是PDF格式的,则直接保存即可。
  3.2 下载安装免费的汉王PDF OCR软件,笔者用的是8.1.0.3版本,打开软件菜单栏“帮助/自动更新”并运行。点击“文件/系统配置”,在“设置系统参数”对话框中选择“识别”标签,并将“自动倾斜校正”前的小框勾上,然后“确定”
  3.3 在OCR软件中选择“文件/打开图像”,将需转换的PDF文件打开,出现界面,如图2:
  3.4 在软件界面右下出现PDF文件原稿,在原稿区域拖动鼠标成一个矩形框,将原稿所有内容包含在矩形框内。在快捷工具栏选择“表格/开始识别”。识别结果如图3
  3.5 在原稿上方,出现识别结果。将鼠标移到识别结果区域,软件会将原稿与识别结果自动对照,人工介入能方便快捷地将识别结果进行修改更正。
  3.6 选择菜单栏“输出/到指定格式文件”依次选择“保存路径”,填入输出的文件名称,选择XLS文件类型,点击“保存”,将在指定路径下输出XLS格式的指定文件即转换成功。
  4 注意事项
  4.1 如果表格式PDF图像中没有网格线,在3.4步骤应根据表格是横向还是纵向相应选择“横栏”或“竖栏”后进行识别,否则识别不能进行。如图4
  4.2 表格式PDF图像若没有网格线,在3.6步骤选择文件保存类型时,不能选择XLS类型,而应选择TXT或RTF文件类型,如图五
  4.3 如果输出文件类型为RTF(即WORD)应将WORD文档中每个字段区分开来,转换成TXT(记事本)文件后,再将TXT文件转成EXCEL.
  5 优缺点
  5.1 本方法使用的软件都是可公开获取的免费软件,或是系统自带软件,不存在收费陷阱。
  5.2 PDF原件无论是否加密,都可以识别。
  5.3 无论是否具有EXCEL典型特征的PDF原件均可以转换。支持文本方式与表格方式的混排,识别不受影响,如果是原件是混排文档,在输出文件类型时,应选择TXT或RTF文件类型,不能直接选择XLS文件类型,TXT或RTF文件可以很方便地转换为EXCEL文件。
  5.4 横排或竖排PDF表格均可识别。
  5.5 识别后生成标准的RTF、EXCEL、HTM或TXT文件,编辑和利用非常方便。
  5.6 缺点是识别会有少量错误产生,需要人工介入修改。
  6 结论
  通过汉王PDF OCR识别和RTF、TXT、EXCEL的格式转换,将表格式PDF图像转换成可编辑的EXCEL文档,这一方法是可行和可靠的,它不再对PDF原稿有种种要求,虽在识别时有少许错误需要人工修改,但总体瑕不掩瑜,对电子图书的推广应用,对借鉴和使用大量PDF表格的读者,是非常实用和高效的。
  参考文献:
  [1]百度百科.电子图书[EB/OL].http://baike.baidu.com/link?url=FvTLUBW7LXi3mxifh7hULpVuX3JzzGYfztata9YQou0griT0HCteSBzoYXweFLSA
  [2]怎样将PDF格式转成EXCEL格式[EB/OL].http://jingyan.baidu.com/article/0eb457e55d69fe03f1a9052f.html
  [3]汉王PDF OCR 80[EB/OL].http://online.hanvon.com/ocr80/ad/html/Online%20help/HwPdfOcr80.htm
其他文献
【摘要】本文根据公司治理结构的相关理论,分析中国上市公司治理结构的现状及其存在的问题,并结合相关的知识,对我国上市公司治理结构提出了几点对策,从而优化中国上市公司治理结构,为我国上市公司质量打下良好的基础。  【关键词】上市公司治理结构;股权结构;优化  一、我国上市公司治理结构现状  我国上市公司现在处于企业改革发展的前沿,而公司治理结构的失衡和治理机制的失效导致了很多问题的发生,这是我国上市公
期刊
【摘要】日本动画行业的腾飞让世界记住了文化的力量。中国虽然贵为世界第二大经济体,但众多的经济领域中唯独缺乏了文化产业,中国动画作为文化产业之一仍然任重而道远,国家经济转型迫在眉睫,把我们的目光投向在中国市场极受关注的日本动画,从他身上也许为我们能了解到我们需要的东西。  【关键词】日本动画史;营销策略;表现手法  引言  动画行业,旨在以围绕动画创作打造的一系列商业和非商业生产链,被誉为本世纪的“
期刊
【摘要】现代化科学技术在很大程度上对我国改革行政管理体制具有推动作用,现代科学技术的应用与发展,使我国行政办公方式出现向电子化方向迈进。例如现阶段最多在我国行政领域应用的就是互联网规划技术,该技术通过网络图形式对管理对象各项任务逻辑顺序与阶段等实施合理安排与统筹规划,使我国行政管理效率得到很大程度的提升。但是在这一背景下,也需要建议不加强我国行政管理体制的法律保障,以确保其改革的合理性。  【关键
期刊
【摘要】彭小球所著《益阳方言有标复句研究》,具有以下三个方面的突出特点:一是另辟蹊径,寻找复句研究的新领域;二是注重调查,获得丰富生动的新用例;三是借助表格,统计分析发现新规律。  【关键词】益阳方言;有标;复句;书评  刘祥友,湖南城市学院文学院,研究生,文学博士,研究方向:汉语方言,语法;邮寄地址:湖南城市学院老校区十八栋501室,413000,  彭小球博士的《益阳方言有标复句研究》(201
期刊
【摘要】服装设计的创意来源很丰富,如自然生态、日常生活、社会动向、科学技术、微观世界等等,都是设计创作的灵感素材。但是究其根源,文化才是设计的核心。处理传统文化与当代服装设计的关系,要注意东方文化的精神研究,也就是“魂”的研究。在文化精神的层面上把握西方文化和东方传统文化,牢牢抓住东方传统文化的精神理念,防止符号化、表面化地组合传统元素,图解式、猎奇式的展览东方元素。  【关键词】服装设计中的文化
期刊
【摘要】思想政治工作是我们党的政治优势。在新的形势下,做好企业思想政治工作,要坚持以科学发展观为指导,与时俱进,解放思想,转变观念,借鉴和吸收现代的管理思想和信息技术,坚持求实创新的精神,积极探索新时期做好企业思想政治工作的新途径、新内容、新形式、新方法和新举措,加强和改进思想政治工作的思路、方法,总结规律经验,不断提高思想政治工作的针对性和实效性。  【关键词】思想政治工作;创新工作思路;创新工
期刊
【摘要】本文以动画视频配乐《母爱》的具体制作过程为例,从选择前期旋律的拟定、混音和后期编辑等几方面,详细阐述了视频配乐的整个流程和细节。  【关键词】素材;混音;旋律;编辑  动画视频配乐的制作过程分为以下几个步骤:旋律的拟定-混音-后期编辑。  1、旋律的拟定  在选定了动画视频素材后,首先选定所需软件及技术上的要求。软音源需要钢琴音源EZKEYS,管弦类音源Orchestral,其他FM8等音
期刊
【摘要】随着信息时代的发展,网络技术新系统这个新领域也不容忽视,传统企业也正利用其行业的特点,融合网络技术的优势来进行改革。作为现代新企业,建立一个高效,稳定,安全,智能的办公网络,已经成为组建中小型企业局域网的重中之重。因此,本文将从网络的总体需求进行分析,对如何创建一个高速、便捷、安全的网络进行了阐述,通过现代虚拟网络技术、高性能全交换线路、防火墙等安全体系构等来搭建企业内部网网络,保证各部门
期刊
【摘要】评价理论系统是功能语言学系统的一部分,是人际功能的补充,由态度、介入、级差三个部分组成。而其中的态度系统是最丰富完善的一个系统,包括情感、判断、鉴赏三个子系统。本文尝试从评价理论系统中的态度系统出发,对汽车广告翻译进行描述、比较、分析和解释,考察“不忠实”广告翻译的成因,希望能从中了解文本译者及期望读者的价值取向的差别。  【关键词】评价理论;态度;汽车广告翻译;“不忠实”现象  评价理论
期刊
【摘要】农民培训目标的确定经历了四个阶段的衍变过程——从文化扫盲教育到思想政治教育再到技能培训和职业教育,最后到新农民培训。农民培训不断地适应国家经济和农村发展的要求,培训目标随之也有较大的变动,明确现阶段农民培训目标是当前展开农民培训的前提条件,对新农村建设有重要意义。  【关键词】新农村;新型农民培训;环境;内涵;目标  一、农民培训目标的衍变  农民培训目标并非静止、孤立、绝对的,而是始终适
期刊