内容资源加工的问题及解决办法

来源 :出版参考 | 被引量 : 0次 | 上传用户:kxianwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  很多传统出版机构开展数字出版时一般会面对两个问题:平台的搭建和内容资源的加工。平台的搭建一般交给专业的软件公司完成就可以了,内容资源的加工则需要传统出版机构大量的参与、深度的介入。在这个过程中问题就出来了:谁来加工?哪些资源要加工?要按什么标准加工?要加工成什么格式?在加工过程中成本该怎么控制?等等。
  
  问题产生的缘由
  传统出版机构按照传统的思路一般都会认为一本图书或者一篇文章进行数字出版时首先就是把数字化后的图书资源做成电子书的形式存储到内容资源管理系统(CMS)中,然后通过平台发布出来就可以满足用户的需要。
  但实际上,在进行数字出版项目时都会面对很多的困惑:比如到底数字出版项目要怎样做?资源要怎样加工?因为在国内还没有现成的模式可以借鉴。可以借鉴的所谓成功的模式是国外的爱思唯尔(Elsevier)、施普林格(Springer)、威利(Wily)等以专业期刊内容为主的拥有成熟赢利模式的学术知识服务平台。他们的很多思路、理念、产品策略、功能应用上可以借鉴,但在操作层面上其实很难被国内的出版机构借鉴(他们以学术期刊资源为主,国内出版社以图书资源为主)。很多国内的出版机构在构建自己的平台时,也借鉴应用图书馆资源数字化处理的方式,这种方式对于资源以书为单位存储时可以借鉴,但要实现更全面的知识服务则需要创新。
  
  问题及解决办法
  既然是创新就没有现成的模式,但是用户及用户应用,是内容资源加工的主导思想。有了这样的前提,传统出版机构开展数字出版项目的内容资源加工时才会有的放矢。
  谁来加工?
  很多传统的出版机构进行内容资源的数字化时,首先需要解决的问题是由谁来加工,一般的选择是自己组建内容资源加工团队,或者外包给专业的内容资源加工公司来完成。对于以上两种方式的比较及优劣分析如表1:
  


  解决完由谁加工,下一个问题就是选择什么样的内容资源进行数字化。很多传统出版机构面对大量的内容资源时会产生困惑:哪些资源有价值、价值如何评估,有价值的资源进行加工时的成本是否能承受等。其实这些困惑的核心就是没有思考面向哪些用户、为用户提供哪些服务,这是互联网时代产品(数字出版产品)的核心。
  传统出版机构不论是出版社还是期刊社,或者其他形式的传媒机构,都有很强的专业属性,为某个行业、专业、学科的人员提供知识产品的服务。所以在自己原有资源特色的基础上定位某个、某几个行业的用户,就可以在加工内容资源上有的放矢了。比如做针对某个行业的传统出版机构,就可以选择已在行业内认可的纸质论文集、专著、手册、标准、大中专教材、职业资格考试等相关图书、期刊内容进行数字化,形成专业电子书数据库,面向行业机构及专业人士提供服务,还可以形成专业在线词典、专业在线教育平台等细分的内容产品全方位、立体式的服务。资源的数量在总量上不用大,但是在细分的行业、专业领域一定要全、要精,这样才能吸引这个行业、专业的用户,有了用户之后更多的就是提供资源衍生的社区服务,让资源以互联网为媒介在专业社区平台上不断衍生,通过策划的功能形成产品动态的服务,同时逐渐形成对外部资源的聚合效应。 按什么标准加工?
  内容资源按什么标准加工主要依据未来资源与其他平台的交互,及相关应用。数据资源分为元数据(Metadata)、内容数据本身及其相关应用的一系列拓展应用信息数据。
  元数据国际通行的都是在都柏林核心元数据(Dublin Core Metadata)的框架下进行拓展,已经非常成熟,可以直接参照应用扩展。
  在数字出版物应用领域,国际上已经形成了针对图书发展的网络资料交换标准——在线信息交换标准(Onix),这是美国出版者协会(AAP)、英国图书工业通讯组织(BIC)、欧洲电子数据交换组织(EDItEUR)针对如何增进电子商务,提供互联网书商丰富而标准化的产品资讯,并因图书批发商及零售商各种格式书目资讯交换的需求发展起来的标准,是针对数字出版物制定的在线元数据信息描述和元数据交换标准。该标准在针对以单本电子书为单位的互联网应用方面可以作为参考的标准,《中国出版物在线信息交换(CNONIX)图书产品信息格式》(制定中)也是参考在线信息交换标准(Onix)。
  而国内专业内容数据本身及相关应用领域除了高等教育社在教育资源方面形成的一些标准外,并没有任何标准可以借鉴。所以传统出版机构需要在开展数字出版项目及运营、用户应用的过程中通过竞争建立起事实的应用标准,这些标准在项目开展的时候可以借鉴国内外的行业标准。无论怎样,一个行业在信息服务领域的标准对传统出版机构而言是巨大的机遇与挑战,一定要在踏踏实实的项目建设及服务应用、用户口碑上逐步构建起来。
  加工成什么格式?
  传统出版机构的内容资源在互联网、数字化应用方面格式非常庞杂。没有统一的格式要求,但基本可以分成两块:一个是展示、一个是内容存储(加工的格式)。
  


  (注:Epub、Cebx是以文字及其他内容根据阅读设备的特性,并以最适于阅读的方式显示,尤其针对移动阅读终端。Xml可以通过定制开发的工具转换为Epub、Cebx格式。)
  内容资源存储根据应用的目标来确定存储格式,如表3:
  


  传统出版机构内容资源的数字化成本投入可大可小,遵循的原则以应用为目标,不要贪多求全、一次到位。这样,资源加工的成本就能得到控制。
  成本控制策略决定基本步骤:
  确定用户范围→选择相关优质资源→明确产品服务形式→确定内容资源加工方案→确定相关加工成本。
  加工成本分析:
  


  实例分析:
  例1
  需求:某传统出版机构想实现内容资源在线、移动终端的电子书浏览、交易、在线营销(试读)、全文检索。
  策略:需要加工为PDF文件。至于选择是否由排版源文件转换成PDF还是由扫描纸书后的图片转换成图片格式的PDF,可参照表4,由各传统出版机构根据自己具体情况选择。
  例2
  需求:某传统出版机构希望在线提供特定专业资源数据库内容。
  策略:需要全文深度标引,这种方式无论在标准的制定、资源深度加工(引文标准、语义标注、公式、图表、图片等的加工),还是专业人士的引入等方面都需要人力、物力、财力的投入。在没有明确应用需求之前,可以采用例1的方式提供以书或文章为单位的在线内容服务为基础,同时选择部分经典的结构化程度高的专业内容资源(辞典、手册、年鉴、学术论文等)进行全文深度标引。产品进入市场后根据用户在应用过程中的需求反馈,不断进行资源的深度加工。在与用户交互的过程中可以实现逐步投入,同时产生效益的目标。
  总之,内容资源数字化工作,不是一件孤立的事情,是与资源未来的应用有关,只有在目标明确的情况下开展,才能真正使内容资源的投入,实现未来应用的价值,让传统出版机构在数字化过程中,少一些困惑、多一些清醒;少一些盲目,多一些从容。
其他文献
江苏省大丰市农药厂研制开发的稻丰散原药及50%稻丰散乳油是一种高效、中毒、广谱性的有机磷杀虫剂,具有持效期长、速效性强、对作物安全等特点,亩用量100-120ml,可有效防治水稻
母线负荷预测对于电网安全稳定调度具有重要意义,但母线负荷随机波动性较强,其负荷类型因供电区域的差异而不同。为此,提出一种基于极限梯度提升(XGBoost)与Stacking模型融合
农电安全管理是农电管理工作的重要组成部分,把电力安全放在突出的位置,强化安全管理,规避安全责任风险,对新形势下农电健康发展至关重要。保持农电安全稳定,既关系农电企业发展的
目的探讨肺复张对肺外源性急性呼吸窘迫综合征(ARDS)患者的肺顺应性及血流动力学的影响。方法将56例肺外源性ARDS患者随机分为观察组(30例)和对照组(26例),对照组采用小潮气
本文通过对青少年教育模式选择上存在问题分析,指出选择教育模式不能违背青少年成长、成才、成功规律,要充分发挥学校、家庭、社会和受教育者主体作用,选择适合青少年全面发展的
目的建立结核分枝杆菌和卡介苗体外诱导中性粒细胞胞外捕获网形成的方法,为研究中性粒细胞胞外捕获网对结核分枝杆菌的影响提供基础。方法分离健康志愿者外周血中性粒细胞,7H
科学发展观的核心是以人为本,贯穿于党内民主建设中就是以党员为主体。文章从推进党务公开、改进决策方式、完善推选机制和注重民主评价四个层面,就高校党内基层民主建设中师生
在政治多元化和经济一体化的国际背景以及我国市场经济发展条件下,各种社会思潮激荡,社会上的多种价值观并存,这些必然影响思想活跃的当代大学生。一些学生不同程度地存在着政治