PDF文件格式研究

来源 :中国高新技术企业 | 被引量 : 0次 | 上传用户:wzhjxl3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:文章介绍了PDF阅读器的基本功能。PDF阅读器能够正确阅读PDF格式文件,也能对PDF文件进行管理。该系统能够提供阅读、翻页、选择文本、选择图片、放大缩小、复制、粘贴、书签、注释等功能。
  关键词:PDF阅读器;文件格式;电子图书格式
  中图分类号:TP311文献标识码:A文章编号:1009-2374(2009)06-0027-02
  
  随着电子出版物的日益丰富和因特网的快速普及,人们可以很方便地获得大量的、各学科的电子资料。在这些资料中,特别是各政府机关、学术机构、标准组织和各大公司在网上发行的各种资料与产品手册,有愈来愈多的在使用ADOBE公司开发并大力推广的PDF格式。
  
  一、文件格式
  
  目前主流的电子图书格式还没有统一的电子图书文件格式,不同的公司因版权或商业因素等诸多原因,往往各行其事,采用不同的文件格式,其中最常用的有以下几种:
  PDF格式:PDF格式是ADOBE公司推出的电子图书专用格式,它无论在何种机器、何种操作系统上都能以制作者所希望的形式显示或打印出来,表现出跨平台的一致性,效果非常理想。它是目前比较先进的一种电子图书格式,应用非常广泛。
  WDL格式:WDL格式采用图文混排方式,一个文件就是一本电子图书,阅读、携带都很方便,更重要的是WDL格式对中文的支持非常好,其应用范围也非常广泛。
  HTML(超文本格式):HTML的特点就是显示效果好、表现力强、文件比较紧凑,不会占用太多磁盘空间。另外,HTML的兼容性非常好,我们只要是安装了Windows9X/2000即可阅读HTML文档。
  图像格式:用户必须借助于图形浏览软件或专门的图形方式阅读软件才能进行阅读。它有一个明显的缺点,就是文件体积比较大,这导致下载、阅读速度都很慢,显示效果也不太理想。
  可执行文件格式:部分电子图书采用了可执行文件格式,我们必须执行它们附带的应用程序才能进行阅读。此种格式的文件占用的磁盘空间非常巨大,往往不适合在Internet上传输,而只能采用光盘形式。
  文本文件格式 :除了上面介绍的几种文件格式外,还有部分电子图书采用了最原始的文本文件格式,它的显示效果虽然最差,但文件的“块头”无疑最小,在网络速度不是太快的今天,可以为读者节省更多的时间。
  
  二、PDF文件格式
  
  PDF从页面描述语言PS(Post Script)发展而来,具有与PS几乎相同的页面描述能力和相似的描述方法。但与PS不同的是,PDF除了能描述复杂版面外,还具有交互功能(如超链接、交互表单等)、页面随机存取及字体仿真描述等特性。因此,PDF不仅适合印刷出版,而且也适合电子出版。
  (一)PDF的结构
  1.PDF文件结构。PDF文档是通过一系列对象序列来构造的,PDF对象包括直接对象(Direct Object)和间接对象(Indirect Object)。一个典型的PDF文件包含4个部分,分别是文件头、文件体、交叉引用表、文件尾。
  2. PDF文档结构。PDF的文档结构是一种树型结构(如图1所示)。树的根节点就是PDF文件的根对象。根节点下有四个子树:页面树(PagesTree)、书签树(OutlineTree)、线索树(Article Thread)、名字树(Named Destination)。书签建立了书签名与一个具体页面上的位置的关联,它使得用户可以按书签名字来访问文档的内容。
  


  图1 PDF文档结构
  
  (二)PDF的特点
  1. PDF的技术特点。PDF文件由文件底层数据层、文本图像数据层、附属信息数据层等构成。底层数据层包括字体信息、交叉参考表(简称xref)等所有的控制信息。文本图像数据层包括文件中的所有文本代码、矢量图形和位图数据。附属信息数据层包括文件书签和文件或页面链接等所有的功能扩展数据。
  2. PDF的应用特点。多平台特性、超媒体特性、多媒体表达手段文件小,阅读方便,打印效果好。
  3. PDF文件的生成。目前PDF的生成有两种途径:(1)通过打印的方式生成PDF,就是通过一个虚拟的PDF打印机将应用程序的文字和图形指令转换为PDF指令并保存在PDF文件中。(2)由PS转换到PDF是另一种生成PDF的方法,它是由应用程序先将待打印的内容发排到PS文件,再由Adobe Acrobat Distiller将PS文件转换成PDF文件。
  
  三、系统基本功能需求
  
  PDF阅读器系统应当能够准确的阅读PDF格式文件。同时系统能对PDF格式文件进行管理,系统能够提供阅读、翻页、选择文本、选择图片、放大缩小、复制、粘贴、书签、注释等一些基本的功能。
  (一)用户界面需求
  PDF阅读器系统的界面应当具有WINDOWS风格,界面简单大方,操作简便快捷,稳定性好,并能为用户的操作提供方便。
  (二)系统性能需求
  由于PDF阅读器系统,是供用户来阅读PDF文件的。因此,系统应该具有很好的灵活性,使用户能够很方便的对打开的PDF文件进行操作。
  (三)系统的可扩展性
  系统应该留出足够的空间方便以后添加控制项,对文件进行控制、处理、存储等操作。也就是说,在不影响用户使用该系统的情况下,能够方便的添加一些新的功能。将来的系统应该更为成熟,功能更加完善。该系统应该具有友好的用户界面,能够提供较多的管理显示功能。
  (四)系统的安全性
  PDF文档可以从未授权入口通过加密来保护它们的内容,也就是说PDF文件可以长期保存文件而防止文件数据的丢失。
  (五)PDF生成器
  PDF阅读器能够正确的阅读PDF格式的文本、图片等,并且能够对PDF文件进行管理。此PDF生成器分别实现文本文件即TXT文件转换为PDF文件和图片文件如JPG,GIF,TIFF等转换为PDF文件。在转换之前,可以根据需要对文本文件和图片文件进行设置。设置功能包括内容设置和页面设置。其中内容设置有顶部、底部、左侧、右侧的设置,页面设置有页面大小、打开方式、打开模式、全屏效果和是否打开Adobe Acrobat等的设置。
  
  四、结语
  
  PDF文件是目前比较先进的一种电子图书格式,应用非常广泛。由于用Adobe免费的PDF阅读器(AcrobatReader)阅读中文PDF时只能显示TureType中文字体,且无法实现平台独立和字体独立;又不支持中文字体的下载这两个问题。其解决的最好办法就是开发中文PDF阅读器。实现PDF检索系统,从PDF中提取信息,在其他应用程序中支持PDF的输入和阅读。
  
  参考文献
  [1]官章全,韩云君,李罡. Visual C++6.0高级编程范例[M]. 北京:电子工业出版社,2001.
  [2]侯俊杰.深入浅出MFC [M].武汉:华中科技大学出版社,2000.
  [3]扬伟.常用电子图书格式和阅读工具的分析研究[J].电子科技大学图书馆,2001.
  [4]邓华,毛岩,吉正. Visual C++案例教程[M].北京:中科多媒体电子出版社,2001.
  [5]张海潘.软件工程导论(第三版)[M].北京:清华大学出版社,2001.
其他文献
摘要:调试是保证设备能够正常运行。认证是要证明产品、服务、管理体系符合相关技术规范的强制性要求或标准的评审活动。调试最初只是一个附加步骤-在认证过程中它是成功工程的障碍,做某些重复工作。然而,工程和认证的成功需要有效的调试支持。文章讲述的是有效的调试技术与其认证的协调作用。  关键词:调试技术;认证验证;“W”模式  中图分类号:F540 文献标识码:A 文章编号:1009-2374(2014)0
期刊
摘要:预埋螺栓及套管歪斜、四周间隙不均、地脚螺栓及锚固板下沉等质量通病,导致汽轮发电机地脚螺栓安装不符合要求、台板与轴承座接触不均匀,严重影响汽轮发电机的安装质量。文章介绍了华能伊敏电厂三期扩建2×600MW超临界机组汽轮发电机上部结构预埋螺栓、套管、锚固板的加固措施。  关键词:汽轮发电机;上部结构;预埋螺栓;锚固板  中图分类号:TM311 文献标识码:A 文章编号:1009-2374(201
期刊
摘要:文章基于伏安法测电阻的基本原理,对现有硅光电池的伏安特性测量方法进行改进,利用交流电压信号和双通道示波器的X-Y信道输入实现硅光电池的伏安特性曲线快速测量与显示。  关键词:硅电池;伏安特性;示波器  中图分类号:TM914 文献标识码:A 文章编号:1009-2374(2013)32-0021-02  硅光电池产生的光伏效应由于具有光谱响应范围宽、速度快、寿命长、使用方便、性能稳定等优点而
期刊
摘要:文章以幸福指数衡量太仓市经济发展实现居民幸福程度,以幸福指数提高为线索,调整和促进服务业优化,进一步提高居民幸福感。文章从幸福指数和服务业产业结构之间的关系出发,剖析了太仓市服务业的发展现状,制定和完善服务业优化的措施,并提出了基于幸福指数提升的服务业结构优化的建议,以促进地区经济可持续发展和和谐社会建设。  关键词:幸福指数;服务业;产业结构;优化  中图分类号:F272 文献标识码:A
期刊
摘要:文章阐述了可能影响乘客舒适度的原因,并且针对这些原因逐一进行优化,提出了几种改善乘客舒适度的方法,侧重介绍了减少车辆振动的主要方式以及对日后的更优化提出了建议。  关键词:100%低地板;现代有轨电车;乘客舒适度  中图分类号:U271 文献标识码:A 文章编号:1009-2374(2013)32-0103-02  近年来,国外城市广泛建设地面有轨线路,人们逐渐重新认识有轨电车,其车辆舒适度
期刊
摘要:文章通过强化安全监督检查,从现场工作的事前、事中、事后,从各级领导、管理人员、工作成员,从安措网络审查把关、现场到位、音像记录、远程图像等多方面进行全方位安全监督,以促进安全生产管理、夯实安全生产基础。  关键词:电力企业;安全监督;安全管理  中图分类号:TU994 文献标识码:A 文章编号:1009-2374(2013)32-0147-02  1 概述  现场安全监督是供电企业各级安监人
期刊
摘要:文章设计了一种基于GPRS(General Packet Radio Service)和GPS定位跟踪的挖掘机车载终端,通过GPRS模块建立与远程监控中心的链路连接,实现挖掘机主机与监控中心的数据交互。该终端的设计与开发对工程机械远程监控具有实际意义并得到广泛应用。   关键词:挖掘机;GPRS网络;GPS;CAN总线;数据传输  中图分类号:TP23文献标识码:A文章编号:1009-237
期刊
摘要:Linux具有先天性的网络优势,组网技术强、功能多,且获取Linux的成本极其低廉。SNMP满足ISO7498-4对应的X.700系列建议书表述的网络管理功能域的五个要求,其技术思想就是要“尽可能简单”,即意味着差错少,稳定性高。应用Linux平台上的SNMP构建烟厂未来网络的管理子系统是一种有益的探索,是冲破Windows独霸烟草网络构建技术市场的一种选择,有潜在的较好的商业价值和推广价值
期刊
摘要:通过在MATLAB中用模糊C均值聚类方法对三维地震参数进行处理,得到数据较合理的分类,以评估油藏表征的参数,如沉积相、流体饱和度以及构造和埋藏史等,从而为储集层的研究提供了很好的依据。  关键词:三维地震参数;埋藏史;模糊C-均值聚类  中图分类号:P631文献标识码:A文章编号:1009-2374(2009)06-0019-02    随着油田的勘探和开发,勘探开发难度日趋加大,投资和费用
期刊
摘要:大宗原燃料结算管理系统的实现核心包括两个方面,一是自动结算功能的实现,二是系统与SAP(ERP)系统的高度集成。文章介绍了邯钢大宗原燃料采购结算是如何在ERP系统中实现的。  关键词:SAP(ERP);大宗原燃料结算;结算管理系统;自动结算  中图分类号:F83文献标识码:A文章编号:1009-2374(2009)06-0024-02    一、系统概述    本系统是根据邯钢原料部结算的实
期刊