大数据出版

来源 :出版科学 | 被引量 : 0次 | 上传用户：wangchun2000

【摘要】

：

【作者】

：

柏雯　曹子郁　赫舍里静　刘芳明　李娜　吴孟　张良晗

【出处】

：

出版科学

【发表日期】

：

2017年1期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　编者按：2016年10月22—23日，武汉大学信息管理学院与美国佩斯大学出版系、中国高等教育出版社共同举办了第五届数字时代出版产业发展与人才培养国际学术研讨会。会议邀请了国际、国内出版业界和出版学界的专家、学者与会，他们发表了精彩的演讲。本刊特将《专论·特约稿》与《多媒体·数字出版》栏目合并，设立《第五届数字时代出版产业发展与人才培养国际学术研讨会》专栏，刊发其中优秀论文，以飨读者。其中，2017年第1期刊发马克·J. H·弗雷茨、朱静雯、贺子岳、刘锦宏等专家、学者的文章，后续还将陆续刊发有关专家学者的文章。
　　[摘要] 旨在说明一个简单的问题，即“大数据可能会对出版行业产生怎样的影响”？不可否认，内容可能是出版行业最有价值的部分，但在未来，数据将会驱动行业的方方面面。现如今，各行各业的数据容量、速度、种类都在飞速增长。毫无疑问，出版行业也将加入且必须加入大数据的行列中。出版行业的先行军，诸如销售、市场和宣传等相关工作早已涉足大数据领域；相应地，可发现性和可访问性随之受到影响；最重要的编辑功能是大数据会产生直接影响的第三个方面；从更广泛的角度来看，出版社的组织设计可能是第四个需要重点关注的问题。最后，在此基础上，本文讨论了大数据背景下出版行业商业模式的构建。
　　[关键词] 大数据出版可发现性组织结构社交物理学
　　[中图分类号] G237 [文献标识码] A [文章编号] 1009-5853 （2017） 01-0005-13
　　Big Date Publishing
　　Mark J. H. Fretz
　　（Scribe Inc.， 842 South Second Street， Philadephia， Pennsylvania， 19147）
　　Transtated by Bo Wen Cao Ziyu HeSheli Jing etc.
　　（School of Information Management，Wuhan University，Wuhan，430072）
　　[Abstract] This paper addresses one simple question， “What impact might big data have on the publishing industry？” While content may be its most valuable commodity， data drives all facets of the industry. The volume， velocity， and variety of data is increasing so rapidly， like all industries today， publishing must come to terms with big data. Sales， marketing， and publicity， the first realm of publishing to be examined， are each already entangled in big data. Two related topics， discoverability and accessibility， are influenced by big data in their own ways. The primary publishing function of editing is the third sphere of activity where big data could have a direct impact. On a broader scale， organizational design of publishing houses is the fourth topic investigated. Finally， the implications of big data for the business model（s） on which the publishing industry is founded are considered.
　　[Key words] Big data Publishing Discoverability Organizational structure Social physics
　　2012年（羅尔，2012）大数据正式亮相世界舞台；2013年两本书的出版预示着出版行业早已开始涉足并传播大数据的相关理论。一本是由谷歌的两位领导者（埃里克·施密特，贾里德·科恩，2013年）共同合著的《新数字时代》；另一本直接以《大数据》命名，由牛津大学的奥地利裔教师与《经济学人》杂志的英国记者共同执笔完成（迈尔·舍恩伯格，库克，2013）。这些书的出现也标志着技术革新与流行文化相互碰撞的临界点已经到来，克诺夫出版社和霍顿·米夫林·哈考特出版贸易公司正在竞争出版的图书恰好印证了这一点。具有讽刺意味的是，早在20世纪90年代末，“大数据”这个词就曾出现在计算机迭代中；而2013年以前，出版行业甚至未曾讨论过是否接受或忽略这一选题。在“大数据热”疯狂席卷出版界的3年之后，如今是时候认真审视大数据究竟会为出版行业带来何种影响这一问题了。
　　1 大数据定义
　　数据驱动出版。出版本身就是在创造、生产和传递数据。不管是什么格式的出版物，不管是纸质出版还是数字出版，不可否认，出版的整个过程都必须依赖数据。具体来说，生产、消费等各个环节以及出版的职能事实上都基于数据。随着电子通信技术的全球化发展，我们逐渐从数据时代跨入大数据时代的“门槛”（罗尔，2013）。这些数据不再独立存储于本地电子计算机或服务器中，而是相互联系和集成的整体，共同存储于全世界的服务器群中。也就是说，将赋予其全新的意义。你可以从某些角度体会数据的巨大，仅2009年一年，美国政府生产了848PB的数据，美国自身的医疗数据达到150EB；然而这仅仅是大数据的两个小小的来源（美国科技基金会，2012）。想要进一步了解该数据的大小，不妨试着回想一下那些测量计算机内存数据的最小单位。文件大小表示为字节（B），根据国际标准，8比特是1字节（B）；1字节大约相当于将单个ASCII字符输入键盘。从这开始，每一级度量单位呈1024字节的单位增加（由于计算机内存测量运用二进制系统）。1千字节（KB）1024字节，1兆字节（MB）= 1024千字节（KB）或1048576字节（1024×1024），10亿字节（GB）=1024兆字节（MB）或1073741824（1024×1024×1024）字节。超过兆字节后，数据量过大，则不得不使用指数来表示数量级。为体现数据的体量，我们运用TB、EB、ZB，甚至YB来依次表示每一个呈1024比例增长的数量级。如果在2009年，美国政府和美国医疗产业分别生产了848PB和150EB的数据，那么将有多少数据在那一年或是随后的几年内在不同的源头产生？　　《牛津英语词典》在“大数据”这一条目的解释中，不仅仅强调数据的量，还指出分析这些数据的复杂性。“体量巨大的计算数据，尤其目前来看，它的操作和管理对其运营提出了很大的挑战。一方面，我们可以将大数据定义为具有容量巨大、运转高速、种类多样但真实性缩减等特征的集成数据集；另一方面，大数据不仅仅是指捕获或存在多少数据（容量巨大）。也不仅仅是指数据增长或变化的快慢或用户想要访问的速度（运转高速），它不仅仅是指数据类型的多样（即结构化和非结构化）或我所需的复杂算法数据（种类多样）。体积、速度、多样以及真实性缩减（即数据的可信度）等问题，是大数据和用户必须承认和接受的。大数据是关于使用集成数据，查找和分析模型，从而指导思考（即解决问题）和实践的技术。通过大数据挖掘，出版产业链上各个环节的企业和个人将会对行业现状和未来发展产生深刻洞察力，并建立起对未来成功有关键作用的社会关系。维克多·迈尔–舍恩伯格和舍尼斯·库克（2013）将大数据的转变概括为“更多、更混乱以及足够好”，并认为这种转变最初始于从单纯追求结果到注重系统性和相关性的根本变化。
　　将碎片化数据组合起来以形成驱动大数据时代快速来临的大数据池，其本身是没有什么负面影响的。试想一个典型的场景：某个星期二的早晨9点38分，南希打电话给凯西。现在，她们坐在市中心咖啡馆享受着双份加糖特浓咖啡和奶油干酪百吉饼。南希正将她俩共同的朋友即将结婚的消息发布在社交平台上，同时购买着参加婚礼的机票。同一时间，手机、信用卡用来买东西，会员卡用来在咖啡店购买咖啡并积分，收银机会登录链接到该公司的库存系统，社会媒体网站、旅游网站、安防摄像头与咖啡店内外都会生成大量的数据。人们持续不断地创建数据，无法计量的数据无时无刻不在被捕获，包括从网页浏览搜索历史以及线上行为；社交媒体活动；移动设备的使用（如电话记录、平板数据使用、GPS信息）；在移动设备上与应用程序的交互；使用交互式卡片（如信用卡、借记卡、交通卡、钥匙卡、保密卡、图书卡）；激活变换器（如安全系统、医疗警报设备）；与医疗系统的交互（如医疗记录、保险索赔、可追踪监测病人情况的技术）；官方记录（如人口普查、税收、社会保障、服务记录、投票记录）；法律记录（如遗嘱、财产记录、出生日期、婚姻状况和死亡证书、专利权）；商业记录（如人力资源、企业财务报表、企业上市信息，兼并及收购文件）；社交媒体活动，如领英（LinkedIn）、脸书（Facebook）、推特（Twitter）、品趣志（Pinterest）、图享（ Instagram）等，这样的例子不胜枚举。这些数量庞大的数据必须通过算法分析。问题在于，目前还很难找到具有如此强大运算能力的系统处理这些数量巨大、联系复杂、格式多样的数据，进而帮助我们从中找出真正有用的数据。具有讽刺意味的是，只有当我们不再将视野局限在个人数据的时候，才能真正意识到这些数据的意义。大数据为我们分析个人数据的集成提供了一个宏观视角，它并不只是集中在一个特定的行为个体或系统，而是聚焦于整个行为模式。直到我们的需求与这些无数、无序的数据产生对接，我们才能从中获得一些真正有用的发现。
　　出版行业对大数据已经有所认识（达文波特，2014；利希滕贝格，2014），尽管面对汹涌来袭的大数据表现得过于谨慎，但随着《新数字时代》和《大数据》的出版，出版行业似乎在2013年迎来了大数据爆发之年。法兰克福书展以及之后的一年内（2013—2014年），大数据正式登上舞台中央，隨之而来的是如浪潮般的书籍、论文、演讲、白皮书和博文等1。就像现今大数据面临的情况一样，尤其当一个新的想法可能会带来颠覆性改变但还未有权威的相关行业案例实践作为参考的时候，我们都会遵循保守观望的原则。我们可能很难预计大数据对出版行业的意义，也不知道应用大数据可能会产生怎样的影响，但我们可以通过若干事例来略微探索其前景。
　　本文调查了出版行业易受大数据影响的的五个方面，这五个方面可能并不一定完整和新颖。本文从出版业内与大数据崛起相关的三个方面——销售、市场营销和宣传入手；接着，转向两个主题，即可发现性和可获得性，这两个主题将内容开发与销售、市场和宣传联结起来；然后进入出版链的各环节，不仅调查了大数据对编辑这一主要出版职能产生的潜在影响；同时站在企业和社会层面思考大数据将如何影响出版社的组织构建；最后，调查研究了大数据对出版行业商业模式的影响。
　　2 大数据：销售、市场营销和宣传
　　出版包括内容的创作（如写作），将写作内容投入生产，然后销售产品。其最后阶段包括促销、市场营销、内容销售，众多形式都可包含在内。尽管各种形式有所区别，但都能实现出版物在出版发行系统中的自由流通，不同组织也需要收集有关销售、市场营销和书籍宣传的数据（信息）。尽管出版链各个环节都产生了数量庞大的数据，但这些数据并非免费。一些数据被隔离于数据竖井内，与其他数据相分离；另一些数据则带有固定格式或存于固定系统中，仅能付费获取。当大数据能处理任意大小的数据集时，数据集越具有包容性，查询结果越精准详细。
　　多家机构运用独有技术对销售数据进行多重角度的搜集。这些数据至少遵循了特定的标记标准，能促进数据的无缝交换（如互操作性）。只有在数据共享或大范围访问时，互操作性的潜能才得以体现，但这与知识产权利益是相悖的。例如，横扫千书（BookScan）公司追踪美国、英国、澳大利亚地区的图书销售记录，在2015年法兰克福图书展上，尼尔森公司和捷孚凯公司宣布达成有关收集零售终端图书销售数据的合作协议（《尼尔森2015年度图书报告》），这些数据包含：基础的单位产品销售数据（如一种既定图书商品的销量），金融交易信息（如消费者交易额、支付方式），地理位置信息（如交易发生地点、实体书店交易或在线交易、交易发生时消费者的地理位置），销售渠道信息（如名称、位置、产品结构及其他有关可购买某图书的特定商店的数据）以及消费者数据（如人口统计信息、详细个人信息）。　　分销商和整合商追踪销售冠军记录并向其出版商客户报告。个别销售渠道，如亚马逊、巴诺书店，及个别实体书店追踪其销售记录，但并不会直接追踪其竞争对手的销售记录。鲍克公司是国际标准书号（ISBN）的官方销售商，ISBN将出版内容确定为独立元件。书业研究集团BISG创建并维护对产品进行分类的BISAC编码。这两套编码方案均虑及营销和销售数据的标准化和互操作性程度。BISAC编码将产品分类至特定的主题类别，使得出版商和零售商可对其产品进行组织呈现，以帮助消费者更加容易地找到所需出版物（见第3节有关可发现性的探讨）。尽管BISAC数据是免费开放的，但各销售渠道对BISAC编码的使用情况数据并不对公众免费开放。
　　图书生产商或出版商能知道其出版图书的特定信息，却无法获得其竞争对手的销售状况或特定类别图书的销售表现。消费者一般能从畅销榜中发现此类信息，通过在线零售网站的图书排名、图书俱乐部、在线图书小组，或一些小道消息获得图书销售信息，但无法获得具体数据。对销售和营销活动的测量也并未提供有关消费者购买特定图书（或图书相关产品）的消费行为或消费环境的度量标准。阅读在线评论，检查亚马逊的图书销售排名，追踪搜索引擎记录，宣传点击数量（如在主流市场中潜在媒体的露面次数、星级评论、社会媒体活动）仅提供图书销售的宏观图像。他们可能由此确定具体的营销活动或宣传工作，但无法将这些数据与消费者的购买选择联系起来。此种层级和质量的数据无法支持对销售、市场营销或宣传活动进行精细分析的行为。
　　3 大数据：可发现性和可获得性
　　网络行为挖掘是对大数据的一项主要运用。所有的主流搜索引擎收集了关于消费者在线行为的数据。通过这些数据，企业能进行用户信息和数据的筛选，形成用户资料，该资料不仅揭示了用户偏好，还能确定可发现性方式（如何种原因导致消费者对图书、商品或网页的搜索）。消费者查询商品或服务的方式表明了该类产品或服务的可发现性。
　　某类产品的标签或内容描述与消费者的在线行为存在一定关系，BISAC编码就是其中一种类型的标签。其他标签则作为元数据植入网站或在线获取的电子图书中（例如一份嵌入主题和其他元数据的PDF或电子书文档）。可发现性受到元数据的影响，例如关键词、产品的页码位置及销售排名等。
　　可获得性与可发现性相关，但又有所区别。广义来说，可获得性是指对某种内容可以访问，它与出版材料相关，更强调对内容的使用。作为可发现性的子集，狭义的可获得性是指内容通过合适的媒体传播，以满足消费者的物质需求。盲人或视力障碍患者无法像正常人一样获取内容，相比于标准打印或电子媒体，大型印刷纸质书籍不可能取得成功。视力障碍患者需要盲文图书、有声读物或者将内容转化成声音的电脑阅读器。
　　在大数据和可发现性的交叉路口，我们发现了搜索引擎优化（SEO）。搜索引擎优化包括对设计和编码的使用，以增强消费者在搜索引擎领域输入词条后查找信息的精准性。若消费者搜索具体词条或信息单位，他们需要（在大脑中）搜寻该词条或信息单位的相关词条或短语。然而，一个计算机程序并不能预测某位消费者在搜索具体词条或信息单位时，所键入的所有词条或短语的排列情况，消费者也不可能准确知道计算机系统给定的词条或短语。针对可发现性的搜索引擎和网页优化，通常会运用分类法对网站的数据实行分类。这种分类法为数据加上体系或标签结构，使得网站中具有丰富的语义性、逻辑性和相关性元数据，以增加搜索引擎精准检索的可能性。分类标准帮助分析搜索引擎的搜索结果，因而使用者的具体词条或信息单位将会在搜索结果中优先排列。
　　大数据能在不依赖特定用户配置文件信息的前提下，改善搜索引擎优化效果。更确切地说，大数据分析能对体量庞大的精细数据进行模型、相关性和概率的确定。基于数据的挖掘结果，搜索引擎能对适当的元数据进行破译，将其应用于给定的词或短语中，以最大化其可获得性和可发现性。运用于出版行业中，则意味着人们可以无需筛选检索结果，直接搜索定位至所需的特定图书或期刊。出版商在图书内容的创作过程中，可对图书内容进行特定的元数据或关键词标记，以提高图书的可发现性。出版商可能会在编辑过程中将可获得性标准添加在图书的结构和内容中，预计全世界有10%—15%的地区存在某种程度的印刷困难，因此，囊括这些地区可以扩大该图书的潜在客户群（黑尔德莱尔，2013）。
　　4 大数据：编辑
　　在出版产业链的所有环节中，编辑可能是要求掌握内容最多、也是最复杂的一个环节。通过语言表达出来的想法和观点，在语法上可以有很多种复杂的解释。语言本身，尤其是为了与他人交流的书写语言，往往取决于一些微小细节。作者和读者都必须意识到语言的细微差别，并且所有的因素都有可能会影响交流沟通的结果（包括语境、语义场、语言学、历史、个性等）。即使是经过专业培训的文字编辑在编辑原稿的时候，也会面临严峻挑战。对于大多数人来说，用计算机程序完全模拟人类对文稿的编辑干预工作是不可能的。然而，在大数据背景下，我们有实现的机会，或者说可以迈出尝试的步伐。
　　利用大数据改进编辑过程的一个方面，就是在工作中引入人工智能。有一个在市场上被广泛运用的例子：像台式机、笔记本电脑、平板电脑、手机、电子阅读器这一类带有鍵盘或按键的电子设备，能在用户打字时完善词汇。该功能并不代表计算机能观察出正在打字的人在想什么，只是这个软件在持续追踪用户的击键序列。人们如果输入了一系列的词语，在第二次或者第三次输入的时候，电脑会显示之前输入过的结果，人们可以选择接受或者拒绝。你输入的内容越多，电脑就需要在你下次输入之前对比更多的数据，这就会增加电脑建议你输入内容的更多可能性。虽然这种级别的认知不是人工智能技术，但是从中可以看出人工智能确实可以通过大数据来实现编辑工具的自动化。在实践过程中遇到的困难可能会包括：（1）数据使用的数量，（2）数据的内容，（3）人工智能的复制程度。从本质上来讲，人工智能的程序会被设定成学习使用者的击键序列，并且与之前发表过的含有大量文献或内容的语料库进行对比。人工智能将来可能会在预测单词和词组方面十分精通（即准确的单词选择和正确的拼写），它会精通于辨别不好或不正确的语法和语序，并建议使用替代词汇来提高用户最初输入的内容；它会开始了解上下文的使用和措辞，并且能够通过一系列的写作学习到作者的偏好。人工智能程序软件将会获得包括大量已发表内容的大数据的集合，来辅助这个工作。例如：谷歌图书扫描网上的150万本图书制作成了电子书2。该成果结合其他的内容可以限制某些参数，以加快人工智能的学习过程。例如：大数据可以被限制在特定的学科、特定的作者、特定的历史时期、特定的语言等。这将允许人工智能将作者输入的内容和在某种程度上与作者相关的文学作品进行对比。　　大数据的使用不会消除编辑过程中的人工干预。相反，它将通过减少干扰问题和统一风格使人工操作更加有目的性。如前所述，人类语言和沟通的行为是极其复杂、微妙的，并且可以有很多解释。人工操作在调节复杂性编辑内容，以及提供复杂性语言的权威判断时是必要的。大数据和人工智能会简化团队升级的过程，并通过减少编辑有意识决策的数量使其更有效率。
　　大数据可以大大减少编辑和格式化脚注、引用的文献资料、引用的列表和来源所花费的时间。由于存在许多技术、物流、金融、法律和其他出版商必须克服的障碍，因此完成这些事并不轻松。第一，书目数据需要聚集来自各种渠道的出版作品，比如图书馆目录和电子版本图书等。尽管数据库已包含这些信息，但是它们不一定相关或者能够彼此协同。第二，这些引文需要应用标准的标记方案，涉及对书目数据中的绝大部分元素进行解读。实际上，引文中的某些给定元素（如作者姓名、图书或文章的标题），不同历史时期语言表述习惯的变化，不同专业学科的要求等，都使得现实中各条书目数据间差异较大，而标准的标记方案需要将这些差异都统一理顺。这使得逻辑上要求算法来恰当地解析这些数据。每个参考来源的离散的元素（如作者名字、出版年份、文章或者章节标题、图书或者杂志标题、编辑、版次、出版地点、出版商、页码等）都需要被标记以使其符合标准的语言组成，这可以由目前存在的图书馆目录摘要或者其他的信息存储检索系统来完成。第三，已出版作品（图书、杂志文章、图书评论等）中的书目数据需要被存储到巨大的连接数据库中。在网络中被添加进数据库的每一个条目都需要有一个独一无二的标识符（即一个数字客体标识符，或者DOI）来和其他的条目进行区分。这就要考虑同一部作品不同版次或者同一部作品不同出版社多次出版的书目信息的汇总。第四，系统需要吸收来自每个主要风格导向（如芝加哥、美国心理协会、蓝皮书等）的版式风格规则。一旦大数据建立起来，那么在任何稿件里书目来源的引用都可以和数据库的词目进行比较。更重要的是，作者会被赋予进入数据库的权限，他们可以在其写作的手稿中简单地嵌入一个数字标识符来替代在手稿中寻找的行为和恰当地呈现所有的书目信息。这不仅会节省作者的时间——因为他们可以使用品种的书目速记法，还会通过减少编辑脚注、书目或参考文献目录的时间来为出版商节省更多的时间和金钱。有了这种学术的书目文件编制，出版商可以大量缩减文字编辑在手稿上花费的时间。
　　5 大数据：组织设计
　　组织设计可能不会出现在出版商的优先目录上。然而，出版商在一定程度上忽略了组织设计的重要性。组织设计委员会的乔治·P.胡巴将组织设计定义为“设计者选择组织中所拥有的主要功能特点（从传统的角度来说这些特点是指策略、核心技术、结构，但是如今也包括员工们的特征、文化和日常惯例）的过程”。凯特和加尔布雷斯的恒星模型（Kates and Galbraith’s Star Model?）描述了五个组织设计的基本元素：（1）策略；（2）结构；（3）过程；（4）奖励和奖励机制；（5）人（凯特，加尔布雷斯，2007）。
　　目前组织设计的做法主要以强调效率为目标。如果效率是优先的，那么公司会设计一个减少行动、任务和进程等这些所有会增加工作时间的组织结构和工作环境。在以最低的成本来提高生产力时需要考虑组织中的各类因素，如人员、工作环境、流程、财务状况等。大数据可以给出版社的组织设计带来革命性的改变。组织设计的原则会从生产效率转向与社会的联接。生产率可能仍然会是一个目标，但是实现这一目标的手段正如我们从社会物理学中发现的一样，正在变成联接社会的多个矩阵。
　　将大数据添加到组织设计当中，并且这个设想在基础阶段发生了改变3。社会物理学基于其对大数据的收集和挖掘，为大数据和组织设计的交集提供了有价值的见解4。
　　彭特兰（2014，6–7）对社会物理学进行了描述，“我们只需要超越社会现象的描述来构建一个社会结构的因果理论……一种行为计算理论：为什么社会会做出那样的反应，以及这些反馈如何解决或无法解决人类问题的一个数学解释”。我们不能将社会物理学作为反对追求畅销图书的理论武器，因为这两者之间并不矛盾。相反，实际上，社会物理学在发展公司的能力方面主要集中于如何运转组织，而不是如何运转市场。目前的情况是这样的：
　　这种层次化的众包恰恰是20世纪大部分企业所采用的模式。员工坐在办公间内独立工作，随后他们的产出被送到连名字都不知道的员工手中进行下一步操作。其他不知名字的员工使用核对表进行质量控制，最后由核心管理层监管整项工作。这是传统的百科全书制作成本如此之高的原因，也是如今大部分企业依旧效率低下并且行动缓慢的原因5。
　　这里说明的核心问题是这些传统组织是围绕市场思维而设计的——激励素未谋面的可互换工人生产饼干切片的工作。因为这些类型的组织结构很少甚至没有对等的网络激励，员工往往不能彼此学习最佳做法或保持高水平的绩效，工人无法从事管理，两个群体都没有机会向对方学习，因此业务流程僵化且低效。
　　鉴于社会物理学的复杂性，有必要确定和定义其关键要素，使其与出版行业相关联。首先，社会物理学建立学习和社会影响之间的关系。人类主要通过经验和观察来学习（即通过实例的方式），而不是通过推理和逻辑论证学习。社会曝光是人类行為可靠的预测指标，社会影响是塑造人类行为的一种手段。社会影响推动理念的流动，因此我们周遭的人，说了什么、做了什么，他们提供的实例是塑造我们思维和行为的最显著力量。社会影响一个重要的因素便是如何联接人类之间的关系。这种联接越紧密，影响便越大。
　　其次，社会影响与集体智力和分布式智力相关。集体智力是“群体的个人以看似聪明的方式集体行动”（马龙，2012）。集体智力的一个应用是解决问题，其中，“集体智力可以被定义为通过发展和集中智力来实现共同目标或解决共同的问题”（布朗和劳德，2001，234）。在这种社会环境中，集体智力的定义是分布式智力的一个子集，分布式智力将非人类智能资源添加到人力资源，“分布式智力是指实体共同努力推理、规划、解决问题、抽象思考、理解思想和语言以及学习的系统。在这里，我们将实体定义为任何类型的智能过程或系统，包括代理商、人、机器人、智能传感器等。在这些系统中，不同的实体通常专注于手头任务的某些方面”（帕克，2007）。一个领域的专业化通常与其他领域的不足相辅相成。在寻找外部智能以补充可用的内部智能时，个体必须能够辨别哪些外部智能的来源与手边的问题相关，并且能够联接它们。分布式智力在人类工作领域中需要社会影响。无论存在与否，这些外部智能的资源仅在它们联接时才起作用。例如跨国银行的市场部门制订和实施营销计划的案例（彭特兰，2014，99—101）。银行的营销活动的成功取决于在营销部门内最大限度地发挥社会影响力。　　分布式智力无形中增加了个人识别和解决超出她或他自己能力的问题的能力。如果个人孤立地工作，或者忽略可用的分布式智能源，或者知道这些分布式智能源，但不能辨别哪些源与手头的问题相关，那么分布式智能是毫无用处的。
　　第三，社会物理学可以利用社会影响力来解决问题。协作解决问题表明网络在工作中超越了人群智慧的概念（索罗维基，2004）。由于分布式智力假设需要利用他人提供的资源，一个组织可以通过增加激励来利用个体互相联络时产生的社会影响力。如果个人获得奖励或正强化影响他人（即组织对员工的互动和影响力赋予价值），他们更有可能相互影响。比如红气球挑战赛（彭特兰，2014，122-124），其团队目标是找到位于美国大陆各地的十个红气球。该比赛的获奖团队很好地利用了社交媒体和奖励机制，不仅为发现红色气球的人提供奖金，也奖励最终帮助团队发现红色气球位置、影响团队中其他成员的人。由此发现，以物质激发社会影响力能够产生比只奖励特定行为（例如，最终发现气球）更好的结果。公司的这一想法，从多元角度看其价值不断增加。如果想法是同质的或源自有限的资源池，你最终会产生群体思维或者群体心理（莱勒，2012）。因此，蓬勃发展的组织通过寻求探索（在本地网络之外寻求想法）和参与（在内部权衡和采用最有希望的想法）之间的适当平衡来优化思想流程。探索是“使用社会网络收集想法和信息。探索是思想流的一部分，将新的想法带入工作组或工作社区中”（彭特兰，2014，39）。其合作伙伴的参与被理解为“重复的合作互动”，“建立信任并增加关系的价值，这为建立合作行为所需的社会压力奠定了基础。换言之，即参与文化建设” （彭特兰，2014， 74）。大数据允许我们基于局部影响力计算思想行为流的概率。
　　社会物理学为出版行业提供了实现成功的不同机会，其中必杀技在于从标题选择转变为出版社如何组织和操作。如果我们采用社会物理学，组织中的探索能力、思想流、参与度都会成为成功的重要衡量标准。从市场导向的角度来看，关注组织会错过业务成功的节点。大数据（例如，收集数据、测量和分析公司的社交互动）如何产生更多收入，或帮助出版商找到下一个畅销选题？社会物理学通过应用数学计算（即算法）来识别大数据，以辨别出版社内部以及出版社之间和出版行业其余部分的互动模式。它已经开发了从组织、员工、客户进行的各种活动中收集大量新数据的手段。这些数据为描绘一个更全面、更精确的组织如何运作提供范本，反过来又为组织的长期成功提供了变革或调整的基础。组织设计不必受大数据（即数字）的影响，设计创新理念也要顾及无形的人类品质的重要性。“现在世界正深入数据时代，看似‘数字’已经取代了曾经非常有价值的人类素质。当试图解决世界上的一些大问题时，人们倾向于咨询数字，而不是最有影响力的人……工程师认为他们可以利用一些不可量化的品质，如同情心和人类深刻的理解力，来解决看似无法解决的问题。这种以人为中心的方法不仅能以最大的影响和意义确定潜在的问题，而且还能产生改变生活的快速、彻底、变革性的解决方案”（更好的设计，2016）。
　　团队互动性、创造力和生产力，都直接影响出版社的组织设计。哈伦·J.奈米斯认为，作为团体互动的一部分，不同意见实际上能够产生更多的新想法，从而在提高生产效率方面产生相同作用，它并没有减少创造力（奈米斯，佩尔索纳兹等，2004）。当面临问题时，通过鼓励人们分享意见、质疑或挑战意见，出版商才能更好地提供服务。对这些想法进行互动的过程迫使那些参与者深思熟虑，考虑他们可能没有意识到的困难。在这个过程中，出现了新的或修改后的想法，最终将会获得足够的支持。
　　如果出版社想要优化思想流，就必须找到探索和参与之间的最佳结合点。但是，鼓励工作人员探索，出版社需要提供奖励，奖励范围从着手研究到工作描述，奖励提交新想法或利用社会压力增加社会影响等诸多行为。同时，出版社需要启动一个从讨论、争辩，到最终决定是否采纳由探究（即参与）引发的新想法的工作流程。
　　思想流的培养和新理念的内化，都得益于最大限度地发挥社会互动的工作环境。建筑和室内设计有助于通过增加跨区域、部门和工作组线之间的相互作用来使思想流动。高层办公大楼中不同楼层的区域、部门或工作组，使得工作人员聚集在一起，但最大限度地减少了他们与其他区域、部门或工作组能够互相之间的互动。同样，室内设计采用中心区隔离的方式往往造成个体的分离。要增强思想流动，无论一个公司采用何种架构和内部设计，它都应该鼓励社会交往，让不同区域、部门或工作组能够互相认识、观察和学习。这种互动会形成更大的创造力和解决问题的能力。
　　奖励员工的新思想是旧套路。而奖励那些影响过他们的同事，那些贡献了新想法，提高生产力和创造力的人，则是新的利好因素，就如同早期的紅气球挑战讨论。生产力的提高，是因为人们学会更快地解决问题。创造力在从外部探索的节奏和社会互动性引发的内部测试中成长。当公司设计的组织最大限度发挥这种类型在社会交往中衍生的生产力和创造力时，公司就能保持活力。
　　思想的价值是随着多样性的增加而提高的。如果思想是同质的或来自一个有限的资源，你就结束了集体思维，或从众心理（莱勒，2012）。因此，蓬勃发展的组织优化思想的流动，寻求在探索（寻求外部网络的想法）和参与（权衡和采用最有前途的想法）之间的平衡。建筑与室内设计可以帮助公司进行社会互动。社会影响导致有益的思想流，如果个人和公司可以作为一个整体贡献卓有成效的思想（即通过分布式智力学习保留和内化），那么组织就能享受实现这个想法带来的长期好处。
　　6 大数据：商业模式
　　大数据将不可避免地扰乱出版行业的现状。为了适应这个现象，企业将不得不修改现有的商业模式，或者从根本上创造全新的商业模式。基于大数据的商业模式将特权数据和分析的结果、评估特权数据和分析的结果作为核心业务的关键。这个评估过程同样可以让出版商适应从市场角度到其他通过大数据反映新出现的优先权和获取洞察力的角度的转换。例如，社会物理学的设想优先考虑的是社会影响，而经济概念是一种交换网络，它适用于社会影响。　　引入一种新的商业模式有别于改变战略。原设想什么是企业和为什么它能够经营下去，后者涉及如何完成其目标。商业模式的概念在上世纪90年代互联网泡沫期间发展繁荣（埃文斯，2015），因为当时许多术语的变化是不确定的，因此涉及的概念也难以统一定义。《金融时报》词典描述如下：
　　奥斯特瓦德的“商业模式帆布”（2008）概念化了商业模式的九个基本要素。两个基本的部分是成本结构和收入流（即代表对立方的利润和损失声明）。三个关键有助于降低成本：关键合作伙伴，关键活动和关键资源。在收入流方面是客户关系、客户细分和渠道（销售或分销），是成本和收益间的桥梁。出版公司在修订或创建新的商业模式时，需要考虑到这些方面的所有业务6。
　　相反的是策略，假定在一个业务模型的框架下，制定一个计划来执行模型。多种策略可以应用到相同的业务模型，尽可能多的相同的策略可以被用于多個业务模型。大数据对出版业的影响将重新审视这两个商业模式和战略。
　　在一个有社会影响力的商业模式中，企业的主要业务是关注大数据的社会影响。此外，如果企业认为市场是一个非均匀的交换网络，而不是一个假定自由市场理论的均匀市场，那么市场交换功能的实现将主要依靠社会影响力。从本质上讲，一个出版商实现社会影响力的商业模式是用信息取代内容作为核心资产。内容将是一种信息的形式，因此它将被视为核心资产的一个子集，而不是专注于生产内容，并将内容作为书籍、期刊和衍生产品。有社会影响的商业模式将重点发布活动的标识、创建、跟踪、测量，并提供基础设施，以支持社会影响。在外部，这可能会转化为专注于客户的行为和关系。在内部，该企业可以利用社会影响，以改善其业务的各个方面，从招聘决策上寻找方法来提高效率，以确定和开发新的商业机会。出版商仍然会生产、经营和销售书籍、期刊和其他产品，除非企业将从事这些活动作为一种实现社会影响的手段。
　　社会影响商业模式的价值命题元素将解决出版行业日益增长的需求和数据丰富但洞察力差的问题。出版商与客户分离，将自己的生意商品化。出版商将利用数据获得直接承担的社会影响，以产生应对这些现有障碍的深刻见解。他们提供给客户的好处是成为社会影响资产、信息来源和潜在的可信任的个人数据守护者。
　　出版商将从内容生产者转变为数据收集和挖掘公司，其价值体现在他们发现和利用数据形成洞察力的能力上。出版行业的其他部门也将同样确定并追逐新的商业机会。目前行业内不同部门的边界分离状态将模糊和消失，以促进新兴商业的所有新领域和现有角色、责任的重新配置。
　　整个出版业成功的核心是基于社会物理学的结果，正如第5节所述的社会影响。传统的出版商购买大数据，并采用一个社会影响商业模式面对诸多障碍，以获得大数据带来的收益。采用大数据的严峻挑战就在奥斯特瓦德的商业模式帆布的九个元素中。
　　当然，当涉及大数据时，成本是一个主要因素。直到最近，只有最大的组织可能会考虑全面采用一个大的数据程序。主要的零售商（如沃尔玛、谷歌和亚马逊）、联邦政府、高值（如银行、商品、保险、医疗保健）行业或高容量（如旅游、通讯、研究和发展、社会媒体）、行业可能有数据的临界质量，有财政资金支持建设和维护技术基础设施，并聘请和培养合格的员工进行数据挖掘。但对于出版行业来说，也许在行业内最大的组织可以说清楚采用大数据的成本，但目前为止，很少有人能负担得起。
　　文森佐·鲁西（Vincenzo Russi），提出了一个通过大数据让出版社和经销商可以有成本效益的商业案例（鲁西，2014）。解决方案的一部分，是精心设计的大数据分析，并协同工作，如采用低成本的存储数据。
　　迈耶·恩伯格和屈里耶（2013，83-86）以谷歌和亚马逊为例，做了一个关于出版行业当前所接受的数据化程度的调研。他们对比谷歌和亚马逊所做的文本，发现这两个公司都有数字化的文本作为数据，但只有谷歌有数据化的数字档案。谷歌图书是他们通过扫描旧的印刷材料创建的数字档案。此外，谷歌还增加了语义标签（用于搜索、索引和发现）并将此归档作为一个数据集，通过分析数据发现其他相关的用途。通过挖掘这些数据，他们丰富了材料翻译内容，提高了谷歌的在线翻译服务质量。迈耶·恩伯格和屈里耶（2013，85）认为，“谷歌知道数据化信息的多种潜在用途。所以，谷歌巧妙地用数据化文本从其图书扫描项目上提高机器翻译服务”。另一个用途是在文化基因学领域，基础性文章的标题说明了一切，“培养使用数百万的数字化图书的定量分析”（米歇尔等，2010）。
　　相比之下，亚马逊已经将大量现有图书数字化为电子书。它出售这些数字内容的访问权限，并在Kindle上发布这些数字内容。然而，亚马逊“未能利用可能的新使用的文本作为数据……”这些文本是被数据化了的，而不仅仅是数据。但是，亚马逊除了在“统计意义上重要的词语”方面提供卓越的服务——通过运算，在不同主题的图书间寻找并不那么明显的联系，但其在线零售商并没有将其大量、丰富的词语用于数据分析。它认为它的图书业务是基于人们阅读的内容，而不是基于对数据文本的分析（迈耶·恩伯格和屈里耶，2013，86）。调研报告的最后一句话指出在旧范式及新范式中使用大数据的核心区别；此外，仅仅通过将大数据作为内容进行处理，出版商只能够将数据的一部分价值变现。迈耶·恩伯格和屈里耶（2013，99）指出，“数据，从其主要用途到其潜在的未来用途，它的价值会发生转移”，这一观点具有深远的影响。例如会对企业如何评估以及如何处理它们拥有的数据产生影响，可能迫使公司改变它们的商业模式，会改变组织看待和使用数据的方式。
　　不考虑大公司之间的差异性，谷歌和亚马逊均认同与消费者的友好关系可以拉动公司产品的销量。这些公司都在自己专攻的领域（尽管它们的活动领域重叠度越来越高）建立了与消费者的直接联系，并且能够从这些消费者身上收集大量的数据（G ·帕克，2014）。它们知道，是什么影响了消费者的购买决定，以及这些消费者是怎样影响其他潜在消费者的购买决定。在目前基于市场的商业模式中，出版商要想准确把握消费者，主要依靠的仍是中介（例如分销商），比如说通过中介获取有关其产品的理想消费者的信息。中间商通过建立与消费者之间的联系，进而帮助建立出版商与消费者之间的关系。现实中，出版商与它的消费者之间至少隔着一层中介，也就是达文波特提到的出版商处于“劣势”地位（达文波特，2014）。然而，如果出版商选择一种基于社会影响的、能够优先建立与它们想要获得的消费者之间联系的商业模式，它们必然要重新审视自己对于中间商的依赖程度。如果出版商想要掌控自己的命运，需要建立与自己核心受众间的直接联系。而大数据可以帮助它们做到这一点。　　出版商将会尽力洞察其消费者，以收集高细粒度及高精确度的用户数据（例如用户行为、用户画像、用户人口统计信息等）。它们会尽力获取一些有关潮流、趋势的信息，以帮助其率先在某个新兴领域占领市场。更重要的是，它们将重点关注社会影响力对于消费者的影响，以及消费者带来的社会影响。它们将尝试深入了解出版活动的具体运作，以及改进出版过程的方法。如上述第5节所述，社会影响是改进出版过程的关键方法之一。新的商业机会将尤其青睐出版商，特别是销售淡季时市场上处于停滞状态的出版商。大数据能够提升出版商的市场洞察力。
　　以市场为导向的商业模式和基于社会影响的商业模式都能够涵盖产品（例如书籍、期刊）的生产及销售，但是这些活动将以不同的方式进行估值和运作。18世纪发展起来的传统的自由市场理论认为，人们本能地竞争，市场可以有效分配资源。基于对大数据的分析，社會物理学得出，关于自由市场理论的假设并不能准确反映人类经验。买方和卖方之间的关系并非像自由市场理论认为的那样是对称的，而是不对称的，正如在交换网络中买方与卖方的关系一样。彭特兰认为，“交换网络比市场更好的主要原因在于信任”（彭特兰，2014，200）。如果交换网络能更精确地描述贸易和商业，将这个模型与考虑到关系（即信任）重要性的社会物理学的基本结论相结合，可以使我们具备基于社会影响的商业模型的基础。
　　与许多其他产业一样，出版行业在传统的自由市场理论的基础上运作。在这一过程中，大量买家从大量卖家手中进行购买的对称关系决定了某一既定产品的价值。以市场为导向的商业模式专注于生产上市产品（例如图书、期刊、衍生产品等），并且这些产品产生的销售收入是这一商业模式的财务基础。市场导向下出版社的核心资产是出版商所控制的“内容”。出版社是否成功取决于由这些内容开发出的产品是否成功，以及能否说服消费者来购买这些产品。从某方面来说，出版企业类似于信用卡企业，信用卡企业的主要业务是处理付款，而一个不断成长的商业应该是在不断收集并挖掘与那些交易相关的数据，并且出售那些通过数据分析得出的结论。同样，出版商的主要业务是生产并销售内容。但是内容中的数据，和购买这些内容的消费者的数据，以及有关消费者与内容如何互动的数据（例如，在电子设备上阅读电子书），才是更为重要的出版业务。
　　尽管基于市场的商业模式和基于社会影响的商业模式可能对社会以及商品、服务（市场vs.交易）如何交易作出不同的假设，但是出版商可以采用任意一种方式作为其商业活动的指导。从市场导向的商业模式向基于大数据的社会影响的商业模式跨越，在概念上来说并不困难。谷歌和亚马逊这样的公司已经做出了表率。但通过大数据的影响来转变一个企业，并使其采用社会影响的商业模式确实不易实现。
　　由大数据驱动的公司具有许多明显的特征。第一，具有高信息可见性，这些公司被称作信息组织（伯纳，格劳普纳等，2014）。第二，拥抱大数据的公司一般都具有强大的分析能力（格罗斯曼和西格尔，2014）。正如迈耶·恩伯格和屈里耶（2013，50—72）指出的，分析的焦点已经从因果关系转向相关性，其中基于大数据的可能性胜过基于小数据的确定性。第三，这些公司调整其组织设计，以利用通过分析得出的实时数据进行决策（加尔布雷斯，2014）。第四，大数据成为新的商业机会的驱动力，而不仅仅是这些公司技术工具中的一种有用工具。
　　在出版产业之外，将数字战略作为自己战略核心的企业和组织越来越多。例如全球著名的雀巢公司，建立了一个“数字化加速小组”（DAT），它已经对其旗下2000个品牌的盈利产生了显著影响（布莱克肖，2013；克拉森，2014）。雀巢的DAT策略只有在将整个企业转变为信息组织的条件下才能奏效。试图弄清楚如何最好地接受大数据，可以看看活性钛国际金属公司（RTI International Metals， Inc.）这一实例（亚伯&托卡斯基，2014）。RTI是一个主要提供研究和技术服务的组织，它代表一个完全基于数据而存在的技术公司，这使得RTI成为出版业极为感兴趣的案例（即它们都基于数据且依赖于知识工作者）。RTI目前必须分析的数据已经不再是经过专门设计和控制的数据（即经过完美设计的科学研究及调查的结果），但是目前依旧包括不受控制的数据，也正是大数据涵盖的内容。要生存下去，RTI需要在与大数据的混合中重塑自己。
　　出版企业在采用大数据的同时，依旧可以坚持其核心业务以及当前的价值主张。这种方法相当于把大数据作为一种战略和一种追求现有优先权的工具，而不改变其现行的商业模式。采用这种策略的出版商和媒体企业有哈珀·柯林斯（雷斯蒂沃·阿莱西，2014），律商联讯，施普林格，英国广播公司（范·里基蒙纳姆，2014），以及爱思唯尔（哈索诺&陈，2015）。此外，还有像亚马逊和意大利迈赛季戈尔（鲁西，2014）这样的公司，采用大数据在出版领域获得了成功，不用考虑它们处在哪一行业，毕竟它们既是经销商又是出版商。从获取标题、宣传、市场营销，到产品开发，再到确定特定分发渠道的时机以及单位体量等方面，这些大企业都能够利用它们对大数据的分析做出明智的决定。
　　将大数据纳入企业的经营战略，并不是说要采用一个全新商业模式，也不是说从行业固有部门中剥离出一部分或者成立一个全新部门。大数据对整个出版行业带来了挑战与新机遇，我们或许可以从国际商业机器公司（IBM）的发展历程中获得一些启示性意义。1911年，三家独立公司（列表机公司，1896年创立于华盛顿；计算表公司，1901年创建于俄亥俄州代顿；国际时代唱片公司，1900年创办于纽约州恩迪科特）合并，组建计算-制表-记录（C-T-R）公司，成为商业机器的创造者和制造商。1924年，为了更准确地反映公司业务范围与业务覆盖的地理范围，该公司更名为国际商业机器公司（IBM）。在计算机发明前，IBM公司数十年一直是制表机和打印机的主导生厂商。第二次世界大战后，晶体管和计算机被发明出来，IBM公司于是从机械设备制造商转变为电子产品和计算机制造商。20世纪80年代至90年代初，个人电脑、用户服务器、局域网和因特网的发展，又推动IBM从商业计算硬件设备集成制造商转变为IT业务解决方案商，包括商业咨询与商业培训。现如今，有别于公司名称，IBM公司不再生产制造商业机器，而是提供技术与商业服务、软件、系统与技术，包括提供数据分析。借鉴IBM公司的发展策略，出版行业需要充分利用大数据的影响实现自身转变，甚至走出过去的核心业务领域。　　史萊克·肖克利等人（2012）针对组织（企业）如何投身“大数据应用”并从大数据中发掘最大商业价值，提出了五条主要建议：
　　? 前期投入致力于形成以顾客为中心的效果
　　? 规划一个企业层面的大数据蓝图
　　? 从现存数据入手先实现短期目标
　　? 根据业务的核心程度培养相应分析能力
　　? 基于可量化结果建构商业案例
　　上述是实施大数据计划的一个蓝图，但是它没有指明应该采用哪种全新商业模式，也没有从换位思考的角度观察贸易和商业。一个具有社会影响力的商业模式应该是明确而具体的，这样出版商才能真正执行这些建议。
　　采用具有社会影响力的商业模式，并不是要求出版商完全抛弃内容这一核心业务。通过收集和挖掘用户数据，出版商将扩大其业务范围，而不是放弃一个业务转而开始一个完全不同的、相关性较弱的新业务。这种商业模式上的改变，仅仅影响内容相对于数据的价值关注度以及出版商与读者关系的维系方式。也就是说，基于出版商与其读者的关联，数据成为主要资产，内容成为次要资产，数据和内容共同满足读者需求。
　　事实上，在由数据主导的社会中，信息本身可以变成一种控制权在用户手中的商品。个人信息作为独属个人的资产，需要受到法律保护。无论这个信息是什么、由谁收集的、如何捕捉到的或者储存在什么地方。伴随个体对个人信息的拥有权一起诞生的是社会各个工作领域中产生的信息需求，要求存在接近这些数据或其中部分数据的途径。社会群体需要在这些不时发生的利益搏斗中找到平衡7。最终达成的结果是，个人可以自主选择要和哪家公司分享自己的个人数据。就像用户通过银行满足金融需求一样（包括储存、保护个人金钱），个人可以依赖数据机构满足自身的数据需求，包括存储、管理个人信息。一个有社会影响力的商业模式并不一定要求出版商去从事大数据的收集、存储、管理和现实挖掘工作，但是它可以引导出版商进行转变，使大数据收集、存储、管理和现实挖掘工作成为出版商核心业务中的一部分。
　　7 结论
　　来自全球各地的数据对整个社会发展越来越重要，出版行业必须紧跟潮流，将大数据放在举足轻重的战略地位。本文概括了大数据可能存在并且可能会对出版业产生影响的五大领域，其中部分领域（如销售、市场和宣传，以及可发现性和可访问性）已经与大数据密不可分，出版业的其他领域不久后也将感受到大数据带来的影响，如在出版社组织架构设计中、在商业模式采用中以及出版核心职能中（如编辑工作）。
　　大数据将确保出版商基于实时数据进行决策，实现产品快速生产并投向市场，产品和市场也将变得越来越专业化。总体看，出版行业成功采用大数据，有四个关键因素发挥重要作用。
　　7.1 大数据取代内容作为主要资产
　　内容就是数据。在大数据环境中，人们阅读的内容只是出版行业中业务资产的一部分，对数据文本以及所有数据（即大数据）的分析才是核心资产。因此，所有数据都应被视作有价值。
　　7.2 将大数据价值无限延伸
　　这里再重申下迈耶·恩伯格和屈里耶（2013）提出的观点：“数据的价值会从其主要应用领域转向其未来潜在的应用领域。”即数据具有潜在价值，或“期权价值”以及无形价值（如迈耶·恩伯格和屈里耶（2013）所说的）。故数据内含价值以及收集、持有或拥有数据权的公司其价值将无限扩大。甚至“数据排放”也是有价值的（迈耶·恩伯格和屈里耶，2013，113-114）。
　　7.3 社会影响力是大数据世界中的主要价值
　　社会影响力是出版行业如何与其他行业联系的关键，也是企业内部运作和成功的关键。衡量社会影响力并不只是获得若干数据指标（像脸书上的朋友数量），而是要去了解本企业对个人、有共同兴趣的团体、整个公司以及自身客户产生的实际影响。
　　7.4 将社会经济领域视为一个交换网络是主要方向
　　只有在交换理论更好地反映和解释现实生活的情况下，完全撇开一个长期存在的经济理论（如自由市场理论）而支持一个新理论，这一行为才具有意义。大数据指出了这一论点，并且同时表明这与交换网络中社会影响（即信任）的重要性密切相关。这个方向对出版行业有广泛影响。
　　出版行业对大数据潜在影响的适应情况，取决于行业内各个部门是否能感知大数据与本部门的关联性。出版商、出版代理商、市场部门、宣传部门、书店、分销商、生产商、印刷商等，都必须认真考虑大数据带来的潜在影响。显然，大数据产生的利益具有全球性。但从大数据衍生出的具有深刻洞察力的功能性应用来看，它也将不断带来区域性利益。如果我们可以从社会物理学中学到一些关于大数据对出版行业的潜在影响，那思想流一定是充分利用大数据带来一切可能性的核心。与思想流相关的是社会影响和人际关系，这也是出版行业以及社会其他行业成功的关键。出版行业在应对大数据时，最好优先考虑人为因素与数据本身。
　　参考文献
　　[1]Berner， Martin， Enrico Graupner， and Alexander Maedche. 2014. “The Information Panopticon in the Big Data Era.” Journal of Organizational Design 3（1）： 14-19；http：//www.jorgdesign.net/index.php/jod/issue/viewIssue/1453/
　　18？acceptCookies=1
　　[2] “Better Design Through Humanity.” 2016. Northwestern Engineering （Spring）： 14–23
　　[3]Blackshaw， Pete. 2013. “How Digital Acceleration Teams Are Influencing Nestlé’s 2，000 Brands： An Interview with Pete Blackshaw.” By Michael Fitzgerald. MIT Sloan Management Review， September 22. http：//sloanreview.mit.edu/article/testing-123 　　[4]Brown， Phillip， and Hugh Lauder. 2001. “Human Capital， Social Capital， and Collective Intelligence.” In Social Capital： Critical Perspectives， ed. S. Baron， J. Field， and T. Schuller， 226–42. Oxford： Oxford University Press
　　[5]Callahan， Sean. 2016. “LinkedIn’s Sean Callahan on the Power of Data To Transform Book Publishing.” By Ellen Harvey. Book Business， May 12. http：//www.bookbusinessmag.com/post/linkedins-sean-callahan-power-data-transform-book-publishing
　　[6]Davenport， Thomas H. 2014. “Book Publishing’s Big Data Future.” Harvard Business Review， March 3. https：//hbr.org/2014/03/book-publishings-big-data-future/#
　　[7]Gabel， Tim J.， and Cathy Tokarski. 2014. “Big Data and Organization Design： Key Challenges Await the Survey Research Firm.” Journal of Organization Design 3（1）： 37–45
　　[8]Galbraith， Jay R. 2014. “Organizational Design Challenges Resulting From Big Data.” Journal of Organization Design 3（1）： 2-13
　　[9]Garner， Bryan A. 2016. “How To Incorporate Big Data into Your Day-to-Day Toolkit.” ABA Journal， May 1.http：//www.abajournal.com/magazine/article/paper_vs._pixels_how_to_incorporate_big_data_into_your_day_to_day_toolkit
　　[10]Grossman， Robert L.， and Kevin P. Siegel. 2014. “Organizational Models for Big Data and Analytics.” Journal of Organization Design 3（1）： 20-25
　　[11]Harsono， Yukun， and Jason Chan. 2015. “The Big （Data） Deal in Scholarly Publishing.” Elsevier Connect （blog post）， June 22. https：//www.elsevier.com/connect/the-big-data-deal-in-scholarly-publishing
　　[12]Hidalgo， Justo. 2016. “Data Science in the Book Publishing Industry—To Be Or Not To Be.” SmartBook （blog post）， June 8. http：//www.smartbook-tisp.eu/resources/data-science-in-the-book-publishing-industry-to-be-or-not-to-be
　　[13]Hilderley， Sarah. 2013. “Accessible Publishing Best Practice Guidelines for Publishers.” Version 4 May 2013. Edituer. http：//www.accessiblebooksconsortium.org/inclusive_publishing/en/accessible_best_practice_guidelines_for_publishers.html
　　[14]Huber， George P. N.D. “Description and Definition of Organization Design.” Organization Design Community. http：//orgdesigncomm.com/Organization-design
　　[15]Kates， Amy， and Jay R. Galbraith. 2007. Designing Your Organization： Using the Star Model to Solve 5 Critical Design Challenges. San Francisco： Jossey-Bass
　　[16]Klaassen， Abbey. 2014. “Nestle’s Global Program Produces Its Digital Disciples： Digital Acceleration Team Aims to Bring Far-Flung Company Into Fast-Evolving World.” Ad Age， October 13. http：//adage.com/article/digital/nestle-s-global-program-produces-digital-disciples/295359 　　[17]Kobo. 2014. “Publishing in the Era of Big Data.” White paper. http：//news.kobo.com/_ir/159/20149/Publishing%20in%20the%20Era%20of%20Big%20Data%20-%20Kobo%20Whitepaper%20Fall%202014.pdf
　　[18]Kompella， Kashyap. 2015. “A Guide to Big Data Tools for Publishers.” EContent， June 3. http：//www.econtentmag.com/Articles/Editorial/Feature/A-Guide-to-Big-Data-Tools-for-Publishers-104251.htm
　　[19]Lehrer， Jonah. 2012. “Groupthink： The Brainstorming Myth.” New Yorker， January 30. http：//www.newyorker.com/magazine/2012/01/30/groupthink
　　[20]Lichtenberg， James. 2014. “Big Data： Should Publishers Even Care？” Publishers Weekly， May 2. http：//www.publishersweekly.com/pw/by-topic/industry-news/publisher-news/article/62114-big-data-should-publishers-even-care.html
　　[21]Liptak， Adam， and Alexandra Alter. 2016. “Challenge to Google Books Is Declined by Supreme Court.” New York Times， April 18. http：//www.nytimes.com/2016/04/19/technology/google-books-case.html？_r=0
　　[22]Lohr， Steve. 2012. “How Big Data Became So Big.” New York Times， August 1. http：//www.nytimes.com/2012/08/12/business/how-big-data-became-so-big-unboxed.html
　　[23]2013. “The Origins of ‘Big Data’： An Etymological Detective Story.” New York Times， February 1. http：//bits.blogs.nytimes.com/2013/02/01/the-origins-of-big-data-an-etymological-detective-story
　　[24]Malone， Thomas. 2012. “Collective Intelligence： A Conversation with Thomas W. Malone [11.21.12].” Edge， November 21. https：//www.edge.org/conversation/thomas_w__malone-collective-intelligence
　　[25]Mayer-Sch?nberger， Viktor， and Kenneth Cukier. 2013. Big Data： A Revolution That Will Transform How We Live， Work， and Think. Boston： Houghton Mifflin Harcourt Michel， Jean-Baptiste， Yuan Kui Shen， Aviva P. Aiden et al. 2010. “Quantitative Analysis of Culture Using Millions of Digitized Books.” Originally published online December 16， 2010. Science 331， no. 6014 （January 14， 2011）： 176–82. [doi： 10.1126/science.1199644].http：//science.sciencemag.org/content/early/2010/12/15/science.1199644
　　[26]Nemeth， C. J.， M. Personnaz， B. Personnaz， and J. Goncalo. 2004. “The Liberating Role of Conflict in Group Creativity： A Cross-National Study.” European Journal of Social Psychology 34： 365-74
　　[27]Nielsen Book. “Nielsen and GFK Begin a Collaboration in the Book Industry” （Press Release）. October 26， 2015. http：//www.nielsen.com/us/en/press-room/2015/nielsen-and-gfk-begin-a-collaboration-in-the-book-industry.html 　　[28]Osterwalder， Alex. 2008. “Business Model Canvas.” http：//businessmodelgeneration.com/canvas/bmc
　　[29]Ovans， Andrea. 2015. “What Is a Business Model？” Harvard Business Review， January 23. https：//hbr.org/2015/01/what-is-a-business-model
　　[30]Parker， George. 2014. “Cheap Words： Amazon Is Good for Customers. But Is It Good for Books？” New Yorker， February 17 and 24. http：//www.newyorker.com/magazine/2014/02/17/cheap-words
　　[31]Parker， Lynne E. 2007. “Distributed Intelligence： Overview of the Field and its Application in Multi-Robot Systems.” Association for the Advancement of Artificial Intelligence.https：//www.aaai.org/Papers/Symposia/Fall/2007/FS-07-06/FS07-06-002.pdf.
　　[32]Pentland， Alex. 2014. Social Physics： How Social Networks Can Make Us Smarter. New York： Penguin
　　[33]Restivo-Alessi， Chantal. 2014. “How HarperCollins’s Chief Digital Officer Uses Big Data To Make Publishing More Profitable.” An Interview with Chantal Restivo-Alessi. By Rebecca Greenfield （January 23， 2014）. FastCompany. http：//www.fastcompany.com/3025254/most-creative-people/how-harpercollinss-chief-digital-officer-uses-big-data-to-make-publishi
　　[34]Rijmenam， Mark van. 2014. “Four Big Data Use Cases from the Media and Publishing Industry： BBC， Healthcare.gov and More.” Datafloq （blog post）， September 16. https：//datafloq.com/read/four-big-data-use-cases-media-publishing-industry-/30
　　[35]Russi， Vincenzo. 2014. “Big Data Without Big Investments： Quick， Scalable， Lean and Effective.” SmartBook， November 5. http：//www.smartbook-tisp.eu/resources/big-data-without-big-investments-quick-scalable-lean-and-effective
　　[36]Schmidt， Eric， and Jared Cohen. 2013. The New Digital Age： Reshaping the Future of People， Nations and Business. New York： Alfred A. Knopf
　　[37]Schroeck， Michael， Rebecca Shockley， Janet Smart et al. 2012. “Analytics： The Real-World Use of Big Data.” IBM Global Business Services， Business Analytics and Optimization Executive Report. Somers， NY： IBM Institute for Business Value and Sa?d Business School at the University of Oxford. https：//www.ibm.com/smarterplanet/global/
　　files/se__sv_se__intelligence__Analytics_-_The_real-world_use_of_big_data.pdf
　　[38]Surowiecki， James. The Wisdom of Crowds： Why the Many Are Smarter Than the Few and How Collective Wisdom Shapes Business， Economies， Societies， and Nations. New York： Doubleday， 2004
　　[39]TechAmerica Foundation. 2012. Demystifying Big Data： A Practical Guide to Transforming the Business of Government. TechAmerica Foundation. http：//www.techamerica.org/Docs/fileManager.cfm？f=techamerica-bigdatareport-final.pdf （summarized at http：//www.kdnuggets.com/2012/10/techamerica-demystifying-big-data-report.html）
　　[40]Vena， Marcello. 2014. “Big Data： Dispelling the Myths About One of Publishing’s Hottest Buzzwords.” Digital Book World. October 16. http：//www.digitalbookworld.com/2014/big-data-dispelling-the-myths-about-one-of-publishings-hottest-buzzwords
　　[41]Woolley， A.， C. Chabris， A. Pentland et al. 2010. “Evidence for a Collective Intelligence Factor in the Performance of Human Groups.” Science 330， no. 6004 （October 29）： 686–88. Doi： 10.1126/science.1193147
　　（收稿日期：2016-10-23）

其他文献

全球化融合与本土化坚守

[摘要] 指出对于跨国企业而言，要获得消费者青睐，必须在全球化的基础上兼顾在地化，一方面采用顶尖科技和优质服务来提升产品品质，同时又要以入乡随俗的销售方式获取消费者信任。深入分析日本纪伊国屋书店这一跨国文化企业的典型代表，其在扩张进程、商品选择、促销方式和全球运营等方面的经验和特色，在全球化扩张与本地化实践基础上实现的文化创新，能为我国文化企业走出国门、走向世界提供借鉴经验。　　[关键词] 全球

期刊

我心中的好书·《平生六记》

推荐理由以“严秀”笔名发表杂文而知名于世的曾彦修（1919—2015年），历任《南方日报》首任社长、人民出版社总编辑等职。1957年被打成当年中国出版界最大的“右派分子”。他坚持斯文同怀、惺惺相惜的人文精神，晚年有“夜半扪心曾问否，微觉此生未整人”之句，获得了百岁文人周有光先生“良知未泯”四字的论定赞评。本书即为其所经历的“土改”、“三五反‘打虎’”、“镇压、肃清反革命”、“四清”和“反右”等时

期刊

煦煦春阳的师教

我的导师肖东发先生于2016年4月15日因突发疾病溘然长逝，留给我无尽的哀痛与思念。毫无防备的诀别让这份哀痛格外刺心，先师生前的谆谆教导令这份思念分外悠长。历史学家罗尔纲曾在感念恩师胡适的教诲时，谓之“煦煦春阳的师教”。先生生前极爱此言，常以之论北大的师德传统，说“北大人的风骨和精神得以代代相传靠的正是这‘煦煦春阳的师教’”。在我心中，先生之教正如这“煦煦春阳”。　　先生籍贯天津，生于沈阳，与共和

期刊

传统新闻媒体转战社交媒体的内容运营策略

[摘要] 选取澎湃新闻微信公众号推送讯息作为分析对象，从话题类别、话题关键词、语言风格、情感诉求点及文章来源五个编码类目，分别对《头条》《澎湃思想》《澎湃时局》《澎湃联播》《澎湃打虎》五个分类栏目进行内容分析。在内容分析结果的基础上总结澎湃新闻的产品策略及发展趋势，指出将新闻产品当作朋友圈社交资源、设计用户体验盘活用户关系、精准推送抵达纵深社区三个发展方向。　　[关键词] 澎湃新闻内容分析产

期刊

我心中的好书·《时过境未迁》

推荐理由本书共分“撷史”、“评史”和“智史”三篇，是作者王海光先生研究和思考中国当代史的文集。作者依据不可多得的档案、文书和当事人笔录等史料，对中国当代的一些重大政治、历史问题，如新中国城乡“二元户籍制度”的社会背景、上世纪五十年代所谓“右派言论”中反映出的社会舆情、六十年代中叶发生的“红卫兵运动”，以及毛泽东（1893-1976年）时代的发生多次“路线斗争”的时政原因等，进行了富有勇气和智慧的

期刊

我心中的好书·《我与书的自传》

推荐理由本书收文65篇，讲述的是上海藏书家、作家张泽贤先生淘书、搜书、读书、爱书、藏书、写书的故事，以及如何与书本结缘、与书人为友的近半个世纪的亲历亲为。大致分为五部分，每部分的文章有多有少，有其“书缘”起源的故事，有其淘书的途径和方法，有识书、读书的心灵感悟，有写作的心得，及与书籍版本有关的人物等。本书素材真实，细节生动，知识性和可读性较好。读者可强烈地感受到作者对于书本浓烈的热爱情结，及作者

期刊

高校学报本校科研人员发文情况探究

[摘要] 对104个高校人文社会科学学报的数据采集，探索现阶段高校学报的本校科研人员发文情况，并分析其对高校学报影响力的影响。研究表明：高校学报的本校科研人员发文比率在20%—60%之间；985或211高校、具有社科博士点高校学报更倾向于刊发本校作者的论文；从区域上来看，华东、华北、东北的高校学报更倾向于刊发本校作者的论文；CSSCI和非CSSCI高校学报在本校科研人员发文占比上差异不显著；高校

期刊

我心中的好书·《书生行止》

推荐理由本书分为三辑，是江苏作家、南京藏书家薛冰先生的文化与文献随笔集。书中内容涉及人文师友、中国方志、城市史、插图艺术、民歌与民俗研究、小说创作、书话和书评及海内外的“书香之旅”等方面。作者说文谈史，思路活跃，活泼细致的文笔，足以引导读者在书山学林中漫游。　　（《书生行止》，薛冰著，百花文艺出版社2014年8月版。责任编辑：徐福伟。180页，定价25.0元。）　　推荐人：徐雁，南京大学信息管理

期刊

我心中的好书·《墨香书影》

推荐理由本书系最新问世的“全民阅读书香文丛”之一。全书分为《知人论学》《书林尝脔》两辑，系河北学者型藏书家、河北大学文学院教授时永乐先生（1957—2014年）的学术随笔集。书中各篇或述淘书、藏书的经历，或述研读论学、说文解史的心得，或述忆念师长的情愫，文风朴素。他认为目录学“是读书的向导”和“科学研究的指南”，“一个真正的学者要钻研而不要钻营”，并指出“仕而优则学”的古训至今仍有“重要的现实意

期刊

我心中的好书·《从徐霞客到梵高》

推荐理由本书是作者余光中先生所写中文山水游记、梵高绘画艺术及中国白话文写作等为主题的评论文章和演讲文集。他认为，所谓“游记”，兼有叙事、写景、抒情、议论的特点，是散文艺术的集中体现。并提出包括评论在内的“知性散文”写作，在心境清明、言之有物外，应该把文章写得条理井然、文采斐然和情趣盎然。他探讨著名印象派画家梵高（1853-1890）绘画艺术的四篇文章，正是写在世界各地纪念梵高去世一百周年的日子里

期刊

大数据出版

与本文相关的学术论文