论文部分内容阅读
在这样一个人人都在为 “大数据 ”趋之若鹜的时代,数字史学无疑令人着迷。但自以罗森茨威格(Roy Rosenzweig)为代表的学者提出 “数字史学 ”的概念以来,经过几十年的发展,国内世界史学界对数字史学还比较陌生。造成这种困境的原因在于,国外的数字史学圈长期致力于的一项工作是对史料的数码化整理。这些工作并非不重要,甚至可以说相当具有基础性:文献的数字化处理是解决巧妇难为无米之炊的前提,可视化的成果展现是让历史研究走进公众视野的必由之路。但是,更具核心价值的具体研究环节如果长期缺失,数字史学的前景堪忧。实际上,真正运用数码科技,直接从史料中挖掘有效信息,并且进行符合学术规范的历史分析,换句话说,有干货的历史研究成果不是太多,而是太少。从这个意义上说,美国内布拉斯加大学林肯分校的威廉 ·托马斯(William Thomas)关于美国内战时期铁路问题的研究专著就显得异常重要,可以成为我们了解数字史学如何进行具体研究的极好案例。
从传统学科上划分,托马斯的著作属于美国史范畴,其主题是讨论铁路在美国内战前后所扮演的重要角色。这看上去是一个非常传统的研究课题。他在书中提到的比较有创新的见解,是对“现代性 ”这个概念进行了新的阐释。在托马斯看来,所谓现代性在十九世纪中期的美国社会表现为一种对身体移动的掌控。能够自由迁徙,不受限制地旅行,这就是现代社会。铁路的出现为身体移动带来了极大便利,以至于在后来的内战中,铁路成为输送兵力和武器的高效交通工具,最终让北部联邦军在谢尔曼(William Sherman)的率领下,抓住了铁路的战略意义,通过控制、利用以至于破坏南方的铁路系统,为联军的胜利做出了重要贡献:所有这些事实都在指向一个显而易见的真理,铁路是 “现代性最直接的指标 ”。托马斯在书中还用大量篇幅叙述了南方黑奴如何利用铁路逃往北方自由世界的过程,让铁路承载的现代性意味更加明显。所以,内战前的北方精英,尤其是废奴运动的支持者有一个共识,铁路将会像播种机一样,在所到之处播撒文明与道德的种子,奴隶制度会因此瓦解。持这种天真想法的大有人在,英国商人科布登(Richard Cobden)在一八五九年进行了一次乘火车的美国之行后(行程达四千英里),也愈发笃信这个观点。这种盲目的乐观假定了一个前提,铁路与奴隶制格格不入。
然而,托马斯让我们看到了一个错位,奴隶制大行其道的南方,反而是铁路建设更加积极和发达的区域。南方奴隶主用行动圆满解决了这种错位感:密集的奴隶劳动参与南方的铁路建设,带来了交通便利,让种植园经济具有了更广阔的市场,从而增加了对奴隶的需求,抬高了奴隶价格,由此推动了奴隶贸易的发展,也让以火车站为中心的城市得到了商业机会,最终带来了经济的全面增长。这个事实让我们不得不接受这样的逻辑:尽管奴隶制看上去与现代性针锋相对,但事实表明,铁路、奴隶制与现代性能够和谐共存。在某种意义上说,南方的铁路建设要比北方更加多快好省,隧道、高架桥更密集,成本反而还比北方便宜一半。因为奴隶主可以更有效率地调动奴隶参与建设,结果 “全世界最优秀的铁路建设专家 ……都在美国的南方开工 ”。这不仅让北方所推崇的技术的现代化能够带来观念的现代性这个信念破产,而且南方从铁路上的获益,让他们更加迷信自己得到了上天的眷顾,是不折不扣的 “现代性 ”国家。
从美国史研究的角度看,托马斯的许多结论并没有特别创新之处。不过,本书的真正价值不在于对美国史研究的原创性,而在于他的研究方法,特别是对数字史学的意义。托马斯的这部专著大量使用数字化工具进行历史问题的研究,包括词频的可视化, GIS,文本挖掘,这些都是近年来颇为流行的技术手段。
上文提到的内战时期铁路与现代性的错位,严格讲并非托马斯的原创。铁路作为现代化的象征与助推剂,并不天然地同北方有亲缘性,南方同样在主动地使用它,虽然其目的是为了巩固奴隶制。熟悉美国史的学者都了解这个假说,只是学界还缺乏全面的分析让这个模糊的印象变成合理的结论。托马斯采用了数字史学的方法,对大量基于货运清单、薪水册、人口统计年鉴的数据进行了分析,并用 GIS技术形象地指出,南方在铁路里程上并不逊于北方,至于人均拥有火车站的数量,南方甚至要高于北方。换句话说,托马斯的研究展现了数字史学的巨大优势,将一种似是而非的假说用坚实的数据与可靠的分析合理化。对于必然会牵扯大量数据的历史研究课题,数字史学方法论或许是最佳的选择。
自兰克以来,历史学家都致力于让自己从事的学科更具科学性。虽然胡适所谓历史就是任人打扮的小女孩这样的历史虚无主义也有一批拥趸,但是有情怀的学者或许并不甘心历史学沦为与“小女孩 ”相提并论的境地。科学性意味着客观性。对历史学科而言,能够实现客观性的重要途径,是在历史分析的过程中,充分占有和挖掘史料。这种穷尽相关史料的愿望,在主张 “史学即史料学 ”的傅斯年那里是一个奢望,但是在数字史学的方法论中将成为一种常态,因为我们借助电脑程序,采用数据挖掘技术,能够从以 “大数据 ”形态存在的史料中获取有效信息,让历史研究更具客观性,并向规范性与科学性的维度迈进。
托马斯的数字史学方法也让我们见识了历史研究成果的多元化呈现。我们不要以为托马斯的研究成果仅仅是一部专著而已,本书其实是名为 “铁路与美国的现代化 ”这个庞大的数字史学项目的阶段性成果。参与到这个项目组的学者有历史、计算机、地理学、经济学等多学科背景,形成了包括专著、论文、会议、演讲等多种成果发布形态。托马斯还在教学中致力于推广课题的理念,吸引了大量年轻人参与项目的演练。最新的一项成果是托马斯与另外两位有地理学背景的研究者合作完成的一篇论文,分析了铁路工人的流动情况:跟我们的传统认知不同,十九世纪中期,在铁路工人的层面,并没有所谓大规模的西进运动,相反有由西往东到巴尔的摩的东进趋势。他们所使用的核心数据是一八四二至一八五七年间巴尔的摩 —俄亥俄铁路公司的工人薪水册。
实际上,这个项目组专门创建了一个网站(地址为 http:// 复的境界,从而让研究结论更加railroads.unl.edu/)来展示他们的研 经受得起考验。究成果。这个网站不仅有大量项 作为数字史学的研究成果,目所依据的原始史料,而且对一 托马斯的作品让我们看到了未来些数据进行了可视化处理,尤其 历史研究的状态。除非历史学家是对铁路的建设情况,使用 GIS 抱定把自己炼成全才的决心,单技术进行了信息输出。这些内容 打独斗的历史研究在未来几乎是都是开放的,网友可以随时免费 一种奢望了。多年前,第三代年下载使用。网站还用博客的形式 鉴学派的领军人物之一的勒华拉与访问者进行交流,一方面披露 杜里曾预言,未来的历史学家要项目组的最新研究成果,另一方 成为程序员。这个设想在今天看面网友可以通过留言直接与相关 来并不现实,历史学家可以了解研究者交流。 这种发布研究成果的方式, 由历史学家一人承担,不仅没有完全颠覆了传统的历史研究成果 必要,而且是不可能完成的任务。形态。线上的网站秉承互联网的 托马斯领衔的这个 “铁路与现代开放与免费精神,也让研究成果 化”项目组,就不是一个人单挑借助网络技术更加普及;线下的 能够承受的,而需要集各色人才专业书籍与学术论文,又兼顾了 的力量;换句话说,合作研究是传统的学术交流。网站上的原始 将来数字史学研究的一种基本的资料和数据,就像实验室提供的 工作状态。
不过,本书的缺点正反映了者自行解读,重新验证研究者的 数字史学研究者可能面临的尴尬结论是否正确。这或许是许多侧 窘境。托马斯要处理的信息量太重数字人文的项目组把自己冠名 大,他在书中有时会偏离主题去为实验室(Lab)的原因,他们就 解读那些看上去更有趣的材料。想把包括历史学在内的人文研究 这从一个侧面反映出我们所面临做到能够像化学实验那样不断重 的大数据时代,是一个信息庞杂的时代。历史学家可能需要在充斥的垃圾信息中挖掘真正有价值的内容,这并不是一个惬意的事情。然而,有一个比喻恰到好处,我们现代人不会因为电子邮件常常有垃圾邮件,而完全弃用电子邮箱。同理,数字史学时代的史家与读者,也不会因为信息过于庞杂、常常生出被无用信息淹没的无助感而拒绝信息技术。实际上,数字史学擅长的课题正是大跨度的历史问题,需要面临庞大的信息量;不过正如美国布朗大学活跃的数字史学专家古尔第(Jo Guldi)强调 “长时段 ”的回归那样,让海量信息变得有序,在大数据中挖掘精粹,才是数字史学的发展前景。
一个基于数字史学的历史作品,如果在史学层面有硬伤,就会让研究大打折扣。托马斯的研究没能逃过这样的命运。他对铁路在美国发展的历史梳理并不准确,涉及的一些专有名词和数据存在出入。这会让读者怀疑,在数字史学的研究项目中,对一些计算工具的使用,不过是一种傲慢的炫耀,就如有评论家指出的那样,托马斯对谢尔曼的书信文本进行可视化处理时,并没有做出深入的内容解读,似乎仅仅为了漂亮的云标签而刻意为之。这些问题都在提醒我们,真正有分量的数字史学研究依然任重道远。
(William Thomas, The Iron Way, Railroads, the Civil War, and the Making of Modern America , New Haven: Yale University Press, 2011)
从传统学科上划分,托马斯的著作属于美国史范畴,其主题是讨论铁路在美国内战前后所扮演的重要角色。这看上去是一个非常传统的研究课题。他在书中提到的比较有创新的见解,是对“现代性 ”这个概念进行了新的阐释。在托马斯看来,所谓现代性在十九世纪中期的美国社会表现为一种对身体移动的掌控。能够自由迁徙,不受限制地旅行,这就是现代社会。铁路的出现为身体移动带来了极大便利,以至于在后来的内战中,铁路成为输送兵力和武器的高效交通工具,最终让北部联邦军在谢尔曼(William Sherman)的率领下,抓住了铁路的战略意义,通过控制、利用以至于破坏南方的铁路系统,为联军的胜利做出了重要贡献:所有这些事实都在指向一个显而易见的真理,铁路是 “现代性最直接的指标 ”。托马斯在书中还用大量篇幅叙述了南方黑奴如何利用铁路逃往北方自由世界的过程,让铁路承载的现代性意味更加明显。所以,内战前的北方精英,尤其是废奴运动的支持者有一个共识,铁路将会像播种机一样,在所到之处播撒文明与道德的种子,奴隶制度会因此瓦解。持这种天真想法的大有人在,英国商人科布登(Richard Cobden)在一八五九年进行了一次乘火车的美国之行后(行程达四千英里),也愈发笃信这个观点。这种盲目的乐观假定了一个前提,铁路与奴隶制格格不入。
然而,托马斯让我们看到了一个错位,奴隶制大行其道的南方,反而是铁路建设更加积极和发达的区域。南方奴隶主用行动圆满解决了这种错位感:密集的奴隶劳动参与南方的铁路建设,带来了交通便利,让种植园经济具有了更广阔的市场,从而增加了对奴隶的需求,抬高了奴隶价格,由此推动了奴隶贸易的发展,也让以火车站为中心的城市得到了商业机会,最终带来了经济的全面增长。这个事实让我们不得不接受这样的逻辑:尽管奴隶制看上去与现代性针锋相对,但事实表明,铁路、奴隶制与现代性能够和谐共存。在某种意义上说,南方的铁路建设要比北方更加多快好省,隧道、高架桥更密集,成本反而还比北方便宜一半。因为奴隶主可以更有效率地调动奴隶参与建设,结果 “全世界最优秀的铁路建设专家 ……都在美国的南方开工 ”。这不仅让北方所推崇的技术的现代化能够带来观念的现代性这个信念破产,而且南方从铁路上的获益,让他们更加迷信自己得到了上天的眷顾,是不折不扣的 “现代性 ”国家。
从美国史研究的角度看,托马斯的许多结论并没有特别创新之处。不过,本书的真正价值不在于对美国史研究的原创性,而在于他的研究方法,特别是对数字史学的意义。托马斯的这部专著大量使用数字化工具进行历史问题的研究,包括词频的可视化, GIS,文本挖掘,这些都是近年来颇为流行的技术手段。
上文提到的内战时期铁路与现代性的错位,严格讲并非托马斯的原创。铁路作为现代化的象征与助推剂,并不天然地同北方有亲缘性,南方同样在主动地使用它,虽然其目的是为了巩固奴隶制。熟悉美国史的学者都了解这个假说,只是学界还缺乏全面的分析让这个模糊的印象变成合理的结论。托马斯采用了数字史学的方法,对大量基于货运清单、薪水册、人口统计年鉴的数据进行了分析,并用 GIS技术形象地指出,南方在铁路里程上并不逊于北方,至于人均拥有火车站的数量,南方甚至要高于北方。换句话说,托马斯的研究展现了数字史学的巨大优势,将一种似是而非的假说用坚实的数据与可靠的分析合理化。对于必然会牵扯大量数据的历史研究课题,数字史学方法论或许是最佳的选择。
自兰克以来,历史学家都致力于让自己从事的学科更具科学性。虽然胡适所谓历史就是任人打扮的小女孩这样的历史虚无主义也有一批拥趸,但是有情怀的学者或许并不甘心历史学沦为与“小女孩 ”相提并论的境地。科学性意味着客观性。对历史学科而言,能够实现客观性的重要途径,是在历史分析的过程中,充分占有和挖掘史料。这种穷尽相关史料的愿望,在主张 “史学即史料学 ”的傅斯年那里是一个奢望,但是在数字史学的方法论中将成为一种常态,因为我们借助电脑程序,采用数据挖掘技术,能够从以 “大数据 ”形态存在的史料中获取有效信息,让历史研究更具客观性,并向规范性与科学性的维度迈进。
托马斯的数字史学方法也让我们见识了历史研究成果的多元化呈现。我们不要以为托马斯的研究成果仅仅是一部专著而已,本书其实是名为 “铁路与美国的现代化 ”这个庞大的数字史学项目的阶段性成果。参与到这个项目组的学者有历史、计算机、地理学、经济学等多学科背景,形成了包括专著、论文、会议、演讲等多种成果发布形态。托马斯还在教学中致力于推广课题的理念,吸引了大量年轻人参与项目的演练。最新的一项成果是托马斯与另外两位有地理学背景的研究者合作完成的一篇论文,分析了铁路工人的流动情况:跟我们的传统认知不同,十九世纪中期,在铁路工人的层面,并没有所谓大规模的西进运动,相反有由西往东到巴尔的摩的东进趋势。他们所使用的核心数据是一八四二至一八五七年间巴尔的摩 —俄亥俄铁路公司的工人薪水册。
实际上,这个项目组专门创建了一个网站(地址为 http:// 复的境界,从而让研究结论更加railroads.unl.edu/)来展示他们的研 经受得起考验。究成果。这个网站不仅有大量项 作为数字史学的研究成果,目所依据的原始史料,而且对一 托马斯的作品让我们看到了未来些数据进行了可视化处理,尤其 历史研究的状态。除非历史学家是对铁路的建设情况,使用 GIS 抱定把自己炼成全才的决心,单技术进行了信息输出。这些内容 打独斗的历史研究在未来几乎是都是开放的,网友可以随时免费 一种奢望了。多年前,第三代年下载使用。网站还用博客的形式 鉴学派的领军人物之一的勒华拉与访问者进行交流,一方面披露 杜里曾预言,未来的历史学家要项目组的最新研究成果,另一方 成为程序员。这个设想在今天看面网友可以通过留言直接与相关 来并不现实,历史学家可以了解研究者交流。 这种发布研究成果的方式, 由历史学家一人承担,不仅没有完全颠覆了传统的历史研究成果 必要,而且是不可能完成的任务。形态。线上的网站秉承互联网的 托马斯领衔的这个 “铁路与现代开放与免费精神,也让研究成果 化”项目组,就不是一个人单挑借助网络技术更加普及;线下的 能够承受的,而需要集各色人才专业书籍与学术论文,又兼顾了 的力量;换句话说,合作研究是传统的学术交流。网站上的原始 将来数字史学研究的一种基本的资料和数据,就像实验室提供的 工作状态。
不过,本书的缺点正反映了者自行解读,重新验证研究者的 数字史学研究者可能面临的尴尬结论是否正确。这或许是许多侧 窘境。托马斯要处理的信息量太重数字人文的项目组把自己冠名 大,他在书中有时会偏离主题去为实验室(Lab)的原因,他们就 解读那些看上去更有趣的材料。想把包括历史学在内的人文研究 这从一个侧面反映出我们所面临做到能够像化学实验那样不断重 的大数据时代,是一个信息庞杂的时代。历史学家可能需要在充斥的垃圾信息中挖掘真正有价值的内容,这并不是一个惬意的事情。然而,有一个比喻恰到好处,我们现代人不会因为电子邮件常常有垃圾邮件,而完全弃用电子邮箱。同理,数字史学时代的史家与读者,也不会因为信息过于庞杂、常常生出被无用信息淹没的无助感而拒绝信息技术。实际上,数字史学擅长的课题正是大跨度的历史问题,需要面临庞大的信息量;不过正如美国布朗大学活跃的数字史学专家古尔第(Jo Guldi)强调 “长时段 ”的回归那样,让海量信息变得有序,在大数据中挖掘精粹,才是数字史学的发展前景。
一个基于数字史学的历史作品,如果在史学层面有硬伤,就会让研究大打折扣。托马斯的研究没能逃过这样的命运。他对铁路在美国发展的历史梳理并不准确,涉及的一些专有名词和数据存在出入。这会让读者怀疑,在数字史学的研究项目中,对一些计算工具的使用,不过是一种傲慢的炫耀,就如有评论家指出的那样,托马斯对谢尔曼的书信文本进行可视化处理时,并没有做出深入的内容解读,似乎仅仅为了漂亮的云标签而刻意为之。这些问题都在提醒我们,真正有分量的数字史学研究依然任重道远。
(William Thomas, The Iron Way, Railroads, the Civil War, and the Making of Modern America , New Haven: Yale University Press, 2011)