论文部分内容阅读
很多传统出版机构开展数字出版时一般会面对两个问题:平台的搭建和内容资源的加工。平台的搭建一般交给专业的软件公司完成就可以了,内容资源的加工则需要传统出版机构大量的参与、深度的介入。在这个过程中问题就出来了:谁来加工?哪些资源要加工?要按什么标准加工?要加工成什么格式?在加工过程中成本该怎么控制?等等。
问题产生的缘由
传统出版机构按照传统的思路一般都会认为一本图书或者一篇文章进行数字出版时首先就是把数字化后的图书资源做成电子书的形式存储到内容资源管理系统(CMS)中,然后通过平台发布出来就可以满足用户的需要。
但实际上,在进行数字出版项目时都会面对很多的困惑:比如到底数字出版项目要怎样做?资源要怎样加工?因为在国内还没有现成的模式可以借鉴。可以借鉴的所谓成功的模式是国外的爱思唯尔(Elsevier)、施普林格(Springer)、威利(Wily)等以专业期刊内容为主的拥有成熟赢利模式的学术知识服务平台。他们的很多思路、理念、产品策略、功能应用上可以借鉴,但在操作层面上其实很难被国内的出版机构借鉴(他们以学术期刊资源为主,国内出版社以图书资源为主)。很多国内的出版机构在构建自己的平台时,也借鉴应用图书馆资源数字化处理的方式,这种方式对于资源以书为单位存储时可以借鉴,但要实现更全面的知识服务则需要创新。
问题及解决办法
既然是创新就没有现成的模式,但是用户及用户应用,是内容资源加工的主导思想。有了这样的前提,传统出版机构开展数字出版项目的内容资源加工时才会有的放矢。
谁来加工?
很多传统的出版机构进行内容资源的数字化时,首先需要解决的问题是由谁来加工,一般的选择是自己组建内容资源加工团队,或者外包给专业的内容资源加工公司来完成。对于以上两种方式的比较及优劣分析如表1:
解决完由谁加工,下一个问题就是选择什么样的内容资源进行数字化。很多传统出版机构面对大量的内容资源时会产生困惑:哪些资源有价值、价值如何评估,有价值的资源进行加工时的成本是否能承受等。其实这些困惑的核心就是没有思考面向哪些用户、为用户提供哪些服务,这是互联网时代产品(数字出版产品)的核心。
传统出版机构不论是出版社还是期刊社,或者其他形式的传媒机构,都有很强的专业属性,为某个行业、专业、学科的人员提供知识产品的服务。所以在自己原有资源特色的基础上定位某个、某几个行业的用户,就可以在加工内容资源上有的放矢了。比如做针对某个行业的传统出版机构,就可以选择已在行业内认可的纸质论文集、专著、手册、标准、大中专教材、职业资格考试等相关图书、期刊内容进行数字化,形成专业电子书数据库,面向行业机构及专业人士提供服务,还可以形成专业在线词典、专业在线教育平台等细分的内容产品全方位、立体式的服务。资源的数量在总量上不用大,但是在细分的行业、专业领域一定要全、要精,这样才能吸引这个行业、专业的用户,有了用户之后更多的就是提供资源衍生的社区服务,让资源以互联网为媒介在专业社区平台上不断衍生,通过策划的功能形成产品动态的服务,同时逐渐形成对外部资源的聚合效应。 按什么标准加工?
内容资源按什么标准加工主要依据未来资源与其他平台的交互,及相关应用。数据资源分为元数据(Metadata)、内容数据本身及其相关应用的一系列拓展应用信息数据。
元数据国际通行的都是在都柏林核心元数据(Dublin Core Metadata)的框架下进行拓展,已经非常成熟,可以直接参照应用扩展。
在数字出版物应用领域,国际上已经形成了针对图书发展的网络资料交换标准——在线信息交换标准(Onix),这是美国出版者协会(AAP)、英国图书工业通讯组织(BIC)、欧洲电子数据交换组织(EDItEUR)针对如何增进电子商务,提供互联网书商丰富而标准化的产品资讯,并因图书批发商及零售商各种格式书目资讯交换的需求发展起来的标准,是针对数字出版物制定的在线元数据信息描述和元数据交换标准。该标准在针对以单本电子书为单位的互联网应用方面可以作为参考的标准,《中国出版物在线信息交换(CNONIX)图书产品信息格式》(制定中)也是参考在线信息交换标准(Onix)。
而国内专业内容数据本身及相关应用领域除了高等教育社在教育资源方面形成的一些标准外,并没有任何标准可以借鉴。所以传统出版机构需要在开展数字出版项目及运营、用户应用的过程中通过竞争建立起事实的应用标准,这些标准在项目开展的时候可以借鉴国内外的行业标准。无论怎样,一个行业在信息服务领域的标准对传统出版机构而言是巨大的机遇与挑战,一定要在踏踏实实的项目建设及服务应用、用户口碑上逐步构建起来。
加工成什么格式?
传统出版机构的内容资源在互联网、数字化应用方面格式非常庞杂。没有统一的格式要求,但基本可以分成两块:一个是展示、一个是内容存储(加工的格式)。
(注:Epub、Cebx是以文字及其他内容根据阅读设备的特性,并以最适于阅读的方式显示,尤其针对移动阅读终端。Xml可以通过定制开发的工具转换为Epub、Cebx格式。)
内容资源存储根据应用的目标来确定存储格式,如表3:
传统出版机构内容资源的数字化成本投入可大可小,遵循的原则以应用为目标,不要贪多求全、一次到位。这样,资源加工的成本就能得到控制。
成本控制策略决定基本步骤:
确定用户范围→选择相关优质资源→明确产品服务形式→确定内容资源加工方案→确定相关加工成本。
加工成本分析:
实例分析:
例1
需求:某传统出版机构想实现内容资源在线、移动终端的电子书浏览、交易、在线营销(试读)、全文检索。
策略:需要加工为PDF文件。至于选择是否由排版源文件转换成PDF还是由扫描纸书后的图片转换成图片格式的PDF,可参照表4,由各传统出版机构根据自己具体情况选择。
例2
需求:某传统出版机构希望在线提供特定专业资源数据库内容。
策略:需要全文深度标引,这种方式无论在标准的制定、资源深度加工(引文标准、语义标注、公式、图表、图片等的加工),还是专业人士的引入等方面都需要人力、物力、财力的投入。在没有明确应用需求之前,可以采用例1的方式提供以书或文章为单位的在线内容服务为基础,同时选择部分经典的结构化程度高的专业内容资源(辞典、手册、年鉴、学术论文等)进行全文深度标引。产品进入市场后根据用户在应用过程中的需求反馈,不断进行资源的深度加工。在与用户交互的过程中可以实现逐步投入,同时产生效益的目标。
总之,内容资源数字化工作,不是一件孤立的事情,是与资源未来的应用有关,只有在目标明确的情况下开展,才能真正使内容资源的投入,实现未来应用的价值,让传统出版机构在数字化过程中,少一些困惑、多一些清醒;少一些盲目,多一些从容。
问题产生的缘由
传统出版机构按照传统的思路一般都会认为一本图书或者一篇文章进行数字出版时首先就是把数字化后的图书资源做成电子书的形式存储到内容资源管理系统(CMS)中,然后通过平台发布出来就可以满足用户的需要。
但实际上,在进行数字出版项目时都会面对很多的困惑:比如到底数字出版项目要怎样做?资源要怎样加工?因为在国内还没有现成的模式可以借鉴。可以借鉴的所谓成功的模式是国外的爱思唯尔(Elsevier)、施普林格(Springer)、威利(Wily)等以专业期刊内容为主的拥有成熟赢利模式的学术知识服务平台。他们的很多思路、理念、产品策略、功能应用上可以借鉴,但在操作层面上其实很难被国内的出版机构借鉴(他们以学术期刊资源为主,国内出版社以图书资源为主)。很多国内的出版机构在构建自己的平台时,也借鉴应用图书馆资源数字化处理的方式,这种方式对于资源以书为单位存储时可以借鉴,但要实现更全面的知识服务则需要创新。
问题及解决办法
既然是创新就没有现成的模式,但是用户及用户应用,是内容资源加工的主导思想。有了这样的前提,传统出版机构开展数字出版项目的内容资源加工时才会有的放矢。
谁来加工?
很多传统的出版机构进行内容资源的数字化时,首先需要解决的问题是由谁来加工,一般的选择是自己组建内容资源加工团队,或者外包给专业的内容资源加工公司来完成。对于以上两种方式的比较及优劣分析如表1:
解决完由谁加工,下一个问题就是选择什么样的内容资源进行数字化。很多传统出版机构面对大量的内容资源时会产生困惑:哪些资源有价值、价值如何评估,有价值的资源进行加工时的成本是否能承受等。其实这些困惑的核心就是没有思考面向哪些用户、为用户提供哪些服务,这是互联网时代产品(数字出版产品)的核心。
传统出版机构不论是出版社还是期刊社,或者其他形式的传媒机构,都有很强的专业属性,为某个行业、专业、学科的人员提供知识产品的服务。所以在自己原有资源特色的基础上定位某个、某几个行业的用户,就可以在加工内容资源上有的放矢了。比如做针对某个行业的传统出版机构,就可以选择已在行业内认可的纸质论文集、专著、手册、标准、大中专教材、职业资格考试等相关图书、期刊内容进行数字化,形成专业电子书数据库,面向行业机构及专业人士提供服务,还可以形成专业在线词典、专业在线教育平台等细分的内容产品全方位、立体式的服务。资源的数量在总量上不用大,但是在细分的行业、专业领域一定要全、要精,这样才能吸引这个行业、专业的用户,有了用户之后更多的就是提供资源衍生的社区服务,让资源以互联网为媒介在专业社区平台上不断衍生,通过策划的功能形成产品动态的服务,同时逐渐形成对外部资源的聚合效应。 按什么标准加工?
内容资源按什么标准加工主要依据未来资源与其他平台的交互,及相关应用。数据资源分为元数据(Metadata)、内容数据本身及其相关应用的一系列拓展应用信息数据。
元数据国际通行的都是在都柏林核心元数据(Dublin Core Metadata)的框架下进行拓展,已经非常成熟,可以直接参照应用扩展。
在数字出版物应用领域,国际上已经形成了针对图书发展的网络资料交换标准——在线信息交换标准(Onix),这是美国出版者协会(AAP)、英国图书工业通讯组织(BIC)、欧洲电子数据交换组织(EDItEUR)针对如何增进电子商务,提供互联网书商丰富而标准化的产品资讯,并因图书批发商及零售商各种格式书目资讯交换的需求发展起来的标准,是针对数字出版物制定的在线元数据信息描述和元数据交换标准。该标准在针对以单本电子书为单位的互联网应用方面可以作为参考的标准,《中国出版物在线信息交换(CNONIX)图书产品信息格式》(制定中)也是参考在线信息交换标准(Onix)。
而国内专业内容数据本身及相关应用领域除了高等教育社在教育资源方面形成的一些标准外,并没有任何标准可以借鉴。所以传统出版机构需要在开展数字出版项目及运营、用户应用的过程中通过竞争建立起事实的应用标准,这些标准在项目开展的时候可以借鉴国内外的行业标准。无论怎样,一个行业在信息服务领域的标准对传统出版机构而言是巨大的机遇与挑战,一定要在踏踏实实的项目建设及服务应用、用户口碑上逐步构建起来。
加工成什么格式?
传统出版机构的内容资源在互联网、数字化应用方面格式非常庞杂。没有统一的格式要求,但基本可以分成两块:一个是展示、一个是内容存储(加工的格式)。
(注:Epub、Cebx是以文字及其他内容根据阅读设备的特性,并以最适于阅读的方式显示,尤其针对移动阅读终端。Xml可以通过定制开发的工具转换为Epub、Cebx格式。)
内容资源存储根据应用的目标来确定存储格式,如表3:
传统出版机构内容资源的数字化成本投入可大可小,遵循的原则以应用为目标,不要贪多求全、一次到位。这样,资源加工的成本就能得到控制。
成本控制策略决定基本步骤:
确定用户范围→选择相关优质资源→明确产品服务形式→确定内容资源加工方案→确定相关加工成本。
加工成本分析:
实例分析:
例1
需求:某传统出版机构想实现内容资源在线、移动终端的电子书浏览、交易、在线营销(试读)、全文检索。
策略:需要加工为PDF文件。至于选择是否由排版源文件转换成PDF还是由扫描纸书后的图片转换成图片格式的PDF,可参照表4,由各传统出版机构根据自己具体情况选择。
例2
需求:某传统出版机构希望在线提供特定专业资源数据库内容。
策略:需要全文深度标引,这种方式无论在标准的制定、资源深度加工(引文标准、语义标注、公式、图表、图片等的加工),还是专业人士的引入等方面都需要人力、物力、财力的投入。在没有明确应用需求之前,可以采用例1的方式提供以书或文章为单位的在线内容服务为基础,同时选择部分经典的结构化程度高的专业内容资源(辞典、手册、年鉴、学术论文等)进行全文深度标引。产品进入市场后根据用户在应用过程中的需求反馈,不断进行资源的深度加工。在与用户交互的过程中可以实现逐步投入,同时产生效益的目标。
总之,内容资源数字化工作,不是一件孤立的事情,是与资源未来的应用有关,只有在目标明确的情况下开展,才能真正使内容资源的投入,实现未来应用的价值,让传统出版机构在数字化过程中,少一些困惑、多一些清醒;少一些盲目,多一些从容。