论文部分内容阅读
论文撤稿数量的增长,既反映了现代科技的进步,也从侧面反映了奔走在学术打假前线的“学术侦探”的存在。各种编辑软件的诞生使得论文造假越来越容易,但另一方面,科技的进步也给“学术侦探”提供了更多的武器,使得“打假”更容易了。现如今,任何一家有声誉的出版社或期刊,都会在录用文章之前进行查重。
“图片侦探”
前《细胞生物学杂志》副主编麦克·罗斯纳是学术界响当当的“图片处理侦探”。
1997-2007年,罗斯纳在美国《细胞生物学杂志》担任副主编;2006-2013年,他在洛克菲勒大学出版社担任执行理事。2002年,他在《细胞生物学杂志》执行了一项新政策:筛查接收到的论文中的所有图片。这最终导致该杂志拒收大约1%已通过同行评议的论文。两年后,美国研究诚信办公室为杂志和出版社推出了筛查图片的软件。
罗斯纳认为,图片也是数据,重要性和论文中的数字及任何其他支撑性数据相当。有鉴于此,他在2013年开办了一间咨询公司,为期刊、出版社和大学提供生物医学方面的图片处理业务。
斯坦福大学微生物学家伊丽莎白·比克也有“图片侦探”之称。
比克在荷兰老牌名校乌得勒支大学获得博士学位后,在斯坦福大学微生物学与免疫学系工作多年,2016年加入位于美国洛杉矶的肠道茵群检查(uBiome)公司担任科学编辑总监,该公司乃世界领先的微生物基因组学研究公司。
在斯坦福大学工作时,比克曾带领团队,花了数年时间审阅1995-2014年间来自40本不同科学期刊的20621篇已发表论文。2016年,比克和两名微生物学杂志编辑一同公开了研究结果:其中782篇文章存在图片处理不當问题,比例达3.8%。但发现了问题,并不意味着问题就能得到解决。比克将其研究成果告知了相关期刊,只有三分之一有回应。
随后,比克又领导一个团队筛选了2009-2016年在《分子与细胞生物学》(MCB)杂志上发表的960篇论文,并在去年发布研究成果:59篇(6.1%)论文存在“不恰当的图片重复使用”情况,包括同一图片在同一期刊多次使用,同一篇文章的不同实验中使用了相同图片等。研究人员把这个情况通报给杂志社,最终有42篇论文更正了图片,5篇被撤稿,另外12篇论文由于种种原因未采取任何措施。
研究还发现,已发表论文如果被发现存在不恰当图片使用问题,平均每篇得花6个小时解决;而如果在论文发表之前就提前介入,可能只需要30分钟就够了。
比克认为,许多不恰当图片的使用问题并非学术不端,而是不小心犯错。比克提出,更好的策略是在论文发表之前就揪出这些图片问题,她希望这项研究能警醒期刊编辑和同行评议人员重视这一问题,建议期刊编辑在收到论文后就扫描一遍里面的图片,这样做要比发表后发现问题再来应对各种麻烦节省时间。
“数据流氓”
35岁的詹姆斯·希瑟尔斯和57岁的尼克·布朗被誉为“数据警察”,他们却自嘲为“数据流氓” ——无组织的散兵游勇。给论文“找茬”纯属业余爱好,他们没有任何资金支持,也和任何官方机构无关。
希瑟尔斯出生在澳大利亚,在悉尼大学获得了硕士和博士学位,分别研究过经济学和生理学,如今是美国波士顿东北大学计算行为科学的博士后。而布朗在英国长大,是剑桥大学工程学专业出身,当了多年的计算机网络经理,如今在荷兰格罗宁根大学攻读心理学博士学位。
希瑟尔斯和布朗并不认为自己是在“打假”或者揭发学术不端。数据上的小问题可能是一时疏忽导致的错误,也有可能是巨大问题的冰山一角,而他们只负责当说实话的“流氓”。布朗说:“我们只检查数据的不一致,而把推测为什么的事情交给别人。”
这对搭档靠希瑟尔斯编写的简单软件,为揭发有问题论文开辟了全新的思路——这款缩写为“精灵”的软件能够利用统计学原理,从论文发表的结果重建出原数据的可能面貌。
布朗估计,到目前为止,两人联合或各自独立做的分析,已经导致了几十篇论文的修改以及十多篇论文的撤稿,其中包括康奈尔大学知名研究者布莱恩·万辛克的5篇论文。
2012年,万辛克在《吸引人的食物名字能增加小学生的蔬菜摄入》一文中提出,如果把某种十分讨厌的蔬菜命名为“x射线眼胡萝卜”,小孩子就会大吃特吃。希瑟尔斯用“精灵”重建可能的论文原数据,结果发现,要得到论文里的平均值和样本量,实验中至少要有一个孩子需要吃掉60根胡萝卜,才能产生与实验数据相匹配的结果!这数据明显是有问题的。
随后,两人分析了万辛克过去几年发表的几十篇论文,发现了大量“异常”,比如有4篇关于吃比萨的论文(其中一篇的结论是“只要有女人在,男人会吃掉更多比萨”),里面有150多处数据不一致。两人向万辛克所在的院系以及负责学术规范的相关机构发了电邮。逐渐地,邮件回复变成了“正在调查”这样的口径。
于是,两人决定把疑问公开。2016年,布朗和几名伙伴先发了一篇文章,名叫“数据烧心:想要消化康奈尔食品和品牌实验室4篇比萨论文的企图”,文中进行了详细的数据分析;然后,希瑟尔斯在博客平台Medium上发表多篇文章,提出了万辛克研究的问题所在。
这吸引了大量关注,欧美主流媒体先后报道,有记者在调查后也对万辛克的研究提出了质疑。2017年,在重重压力之下,万辛克通过发言人诚恳道歉,并不得不对过去几年发表的十几篇文章进行修改,其中有5篇被撤稿。
如今,两人在圈内已经拥有了一定的名声,不少研究人员和科研机构会将可疑论文发给他们进行调查。
希瑟尔斯相信,他和布朗的举动代表的只是论文分析技术不断发展的开始,待其改良并正式化后,人人都有望掌握。他希望,将来能设计出一种可升级的在线课程,来传播这些方法。
“图片侦探”
前《细胞生物学杂志》副主编麦克·罗斯纳是学术界响当当的“图片处理侦探”。
1997-2007年,罗斯纳在美国《细胞生物学杂志》担任副主编;2006-2013年,他在洛克菲勒大学出版社担任执行理事。2002年,他在《细胞生物学杂志》执行了一项新政策:筛查接收到的论文中的所有图片。这最终导致该杂志拒收大约1%已通过同行评议的论文。两年后,美国研究诚信办公室为杂志和出版社推出了筛查图片的软件。
罗斯纳认为,图片也是数据,重要性和论文中的数字及任何其他支撑性数据相当。有鉴于此,他在2013年开办了一间咨询公司,为期刊、出版社和大学提供生物医学方面的图片处理业务。
斯坦福大学微生物学家伊丽莎白·比克也有“图片侦探”之称。
比克在荷兰老牌名校乌得勒支大学获得博士学位后,在斯坦福大学微生物学与免疫学系工作多年,2016年加入位于美国洛杉矶的肠道茵群检查(uBiome)公司担任科学编辑总监,该公司乃世界领先的微生物基因组学研究公司。
在斯坦福大学工作时,比克曾带领团队,花了数年时间审阅1995-2014年间来自40本不同科学期刊的20621篇已发表论文。2016年,比克和两名微生物学杂志编辑一同公开了研究结果:其中782篇文章存在图片处理不當问题,比例达3.8%。但发现了问题,并不意味着问题就能得到解决。比克将其研究成果告知了相关期刊,只有三分之一有回应。
随后,比克又领导一个团队筛选了2009-2016年在《分子与细胞生物学》(MCB)杂志上发表的960篇论文,并在去年发布研究成果:59篇(6.1%)论文存在“不恰当的图片重复使用”情况,包括同一图片在同一期刊多次使用,同一篇文章的不同实验中使用了相同图片等。研究人员把这个情况通报给杂志社,最终有42篇论文更正了图片,5篇被撤稿,另外12篇论文由于种种原因未采取任何措施。
研究还发现,已发表论文如果被发现存在不恰当图片使用问题,平均每篇得花6个小时解决;而如果在论文发表之前就提前介入,可能只需要30分钟就够了。
比克认为,许多不恰当图片的使用问题并非学术不端,而是不小心犯错。比克提出,更好的策略是在论文发表之前就揪出这些图片问题,她希望这项研究能警醒期刊编辑和同行评议人员重视这一问题,建议期刊编辑在收到论文后就扫描一遍里面的图片,这样做要比发表后发现问题再来应对各种麻烦节省时间。
“数据流氓”
35岁的詹姆斯·希瑟尔斯和57岁的尼克·布朗被誉为“数据警察”,他们却自嘲为“数据流氓” ——无组织的散兵游勇。给论文“找茬”纯属业余爱好,他们没有任何资金支持,也和任何官方机构无关。
希瑟尔斯出生在澳大利亚,在悉尼大学获得了硕士和博士学位,分别研究过经济学和生理学,如今是美国波士顿东北大学计算行为科学的博士后。而布朗在英国长大,是剑桥大学工程学专业出身,当了多年的计算机网络经理,如今在荷兰格罗宁根大学攻读心理学博士学位。
希瑟尔斯和布朗并不认为自己是在“打假”或者揭发学术不端。数据上的小问题可能是一时疏忽导致的错误,也有可能是巨大问题的冰山一角,而他们只负责当说实话的“流氓”。布朗说:“我们只检查数据的不一致,而把推测为什么的事情交给别人。”
这对搭档靠希瑟尔斯编写的简单软件,为揭发有问题论文开辟了全新的思路——这款缩写为“精灵”的软件能够利用统计学原理,从论文发表的结果重建出原数据的可能面貌。
布朗估计,到目前为止,两人联合或各自独立做的分析,已经导致了几十篇论文的修改以及十多篇论文的撤稿,其中包括康奈尔大学知名研究者布莱恩·万辛克的5篇论文。
2012年,万辛克在《吸引人的食物名字能增加小学生的蔬菜摄入》一文中提出,如果把某种十分讨厌的蔬菜命名为“x射线眼胡萝卜”,小孩子就会大吃特吃。希瑟尔斯用“精灵”重建可能的论文原数据,结果发现,要得到论文里的平均值和样本量,实验中至少要有一个孩子需要吃掉60根胡萝卜,才能产生与实验数据相匹配的结果!这数据明显是有问题的。
随后,两人分析了万辛克过去几年发表的几十篇论文,发现了大量“异常”,比如有4篇关于吃比萨的论文(其中一篇的结论是“只要有女人在,男人会吃掉更多比萨”),里面有150多处数据不一致。两人向万辛克所在的院系以及负责学术规范的相关机构发了电邮。逐渐地,邮件回复变成了“正在调查”这样的口径。
于是,两人决定把疑问公开。2016年,布朗和几名伙伴先发了一篇文章,名叫“数据烧心:想要消化康奈尔食品和品牌实验室4篇比萨论文的企图”,文中进行了详细的数据分析;然后,希瑟尔斯在博客平台Medium上发表多篇文章,提出了万辛克研究的问题所在。
这吸引了大量关注,欧美主流媒体先后报道,有记者在调查后也对万辛克的研究提出了质疑。2017年,在重重压力之下,万辛克通过发言人诚恳道歉,并不得不对过去几年发表的十几篇文章进行修改,其中有5篇被撤稿。
如今,两人在圈内已经拥有了一定的名声,不少研究人员和科研机构会将可疑论文发给他们进行调查。
希瑟尔斯相信,他和布朗的举动代表的只是论文分析技术不断发展的开始,待其改良并正式化后,人人都有望掌握。他希望,将来能设计出一种可升级的在线课程,来传播这些方法。