论文部分内容阅读
让我们把镜头拉回到2014年3月的斯台普斯中心,斯蒂芬·库里和他的勇士队友们正在挑战快船队。当大卫·李错失了一次上篮后,布雷克·格里芬跳起争抢篮板,可惜球却被拨到了三分线外的库里手中。毫无疑问,库里会投篮的。他刚一拿球,就做出了投篮动作,而克里斯·保罗也回到了他的防守位置。库里转而向前运球,寻找在罚球弧顶的投篮机会。他找到了,出手了,但是保罗也跟上了防守,库里没投进。
在数据栏里,这只是一次微不足道的错失投篮而已。谁在乎呢?没有哪组数据会关注,是保罗追上了库里,守住了相当不错的位置,才造成库里不得不在拿球后向前突破,进而没得分。保罗被视为NBA最佳防守球员之一,但我们却没有什么图表或高端标准,可以证明这一普遍认同的观点。实际上,我们的数据只是用来判断进攻球员的,多么复杂都不怕。相反的,防守分析却依然非常落伍,只是停留在抢断和封盖这老掉牙的环节上。
感谢球员追踪系统的革命,这一切是时候改变了。
同一周的晚些时候,亚历桑德罗·弗兰克斯,安德鲁·米勒两位哈佛大学的博士生,在波士顿举行的麻省理工学院斯隆体育分析大会上展示了他们的论文成果。弗兰克斯、米勒与哈佛数据中心的卢克·保儒恩教授通力合作,分析了2年多来NBA的防守情况。你不用去看复杂的论文,这可以介绍精华版给你,简而言之,我们接下来要说的就是一套能让NBA的防守表现分析更棒的体系。
测量防守是很具挑战性的事情,而那些伟大的防守专家,在数据表的清单中也根本不会显眼。进攻端的精华镜头比比皆是,但防守者却很难获得官方数据表的认同。换而言之就是,某些家伙的防守不错,观众们却很可能不会发现。关于防守的分析,实在是太少了。2年前,扎克·洛维有一篇关于猛龙的文章很不错,伊桑·谢伍德·斯特劳斯也曾经关注过勇士的防守,但真正有价值的防守分析依然屈指可数。
2013年夏天,NBA为29个球场安装了球员追逐系统。每个看起来普通的移动,从此开始被分类——从长距离奔跑到运球突破。当然,最终它带来的额外好处是:我们终于有机会去分析NBA球场上每一秒的防守动作了。
弗兰克斯和米勒的初始目标非常简单:组建一个模型,它能够在NBA比赛中评估每个防守行为。套用负责NBA追踪系统的副总裁助理莱恩·沃金思的说法,“通过对位分配以及职责分配,你可以测量防守者在整场比赛中的影响力。”
这是第一步,也是最关键的一步,我们拥有了对球员防守进行测评的智慧。
尽管弗兰克斯和米勒雄心十足,但数据模型的组建和估算却极为复杂。搞定800亿字节的球员追踪数据,这绝对是一桩苦差事。但是,他们依然立志要完成这个任务,在花费了成吨的时间后,他们完成了对数千个小时录像进行编码和记录的工作。
曙光在这时乍现了。学术方面,他们的研究成果在《应用概率纪事》上发表,并得到了同行的高度评价。此外,弗兰克斯和米勒还在波士顿的会议上,向大家介绍了他们开发的全新的用以定义更新防守指标的模型。他们没有放过2013-14赛季的任何一个毫秒,评判着防守者的表现。比如2013年圣诞节,火箭来到圣安东尼奥对阵马刺,比赛还剩5分钟时,托尼·帕克将球传给了科怀·伦纳德,此时后者已经能够在右翼获得空当机会。詹姆斯·哈登本应该是防守伦纳德的,但他却被蒂姆·邓肯给阻挡了。伦纳德接到了球,哈登冲上去一跃而起,却被伦纳德晃过。后者向前一小步运球,冷静的完成了中投。
正如弗兰克斯在电子邮件中说的,“通过一对一防守时同步性的细节了解,我们可以制作复杂的模型,以此来描述个人防守者是如何影响对方的投篮频率以及球场不同位置上的投篮效率的。”
二位博士将呈现两个关键数据,一是防守投篮的图表,以此揭示一名进攻者如何在防守者紧盯时投篮和得分;第二组数据,是评估每100次控球,防守者能够让对手得多少分。
按弗兰克斯和米勒的说法,保罗是NBA最棒的外线防守球员。他们有十足的证据表明,保罗要比联盟中的任何后卫都更能抑制和干扰投篮行为。也就是说,不管保罗是在防守投篮大师斯蒂芬·库里,还是传球大师拉简·朗多,保罗基本都能让他们减少投篮机会,且降低投篮命中率。伦纳德和保罗相似,他防守的人很难获得预期投篮机会,即便他们投了,也更多会投失。像保罗和伦纳德这样的球员,不管是在防守谁,都能让对手的效率降低,而哈登则会增加对手的进攻能力。
通过两位博士的数据模型,我们还能看到一些很有意思的事情,比如进攻球员在面对罗伊·希伯特和蒂姆·邓肯时,很多人会有“偏向虎山行”的想法,但面对德怀特·霍华德,进攻球员则基本放弃了在近距离投篮的可能性。
这反映的是球员的个人特点,还是球队的防守?有一点可以肯定,鲁迪·戈伯特让特雷·伯克成为了更好的防守者,就像希伯特让保罗·乔治的防守变得更棒了一样。
另外一项重要的数据,是干扰率。上赛季,NBA球员共尝试了超过20万次投篮。我们现在就可以瞧瞧,哪位内线球员干扰了最多的投篮。
从数据表上看,不仅是希伯特干扰了对手42%的投篮,而且他的替补球员伊安·马辛米也排到了第3位。这让我们不禁想到,步行者的防守会逼迫对手的投手们去面对他们的中锋。而这也造成了大卫·韦斯特的“低迷”,他的干扰率可是倒数第一。
干扰率是一回事,而总结出降低得分能力则是另外一回事。
这组数据让我们能够发现球员防守的另一个显著能力。我们会在球员投篮动作发生时(在出手前的0.5-1秒)观察他的对位防守者,计算“尝试防守”和“降低得分”两个值。为了做好这件事,我们观察了所有的一对一防守者,计算了每100次进攻,他们在对方投篮时做出了几次防守动作,以及对方得了多少分。
在弗兰克斯-米勒的系统中,没有人能像CP3那么粘人,他在一对一防守的100次进攻中,只让对手得到11分,达米恩·利拉德,库里,帕克,他都不怕。保罗最多能让对手的命中率降低80%,而哈登则反过来,让对手命中率增长了114%。
此前,我们已经讨论了球员追踪系统是如何令篮球分析发生革命性变化的,不过到目前为止,我们真正关心的依然是进攻篮球分析。进攻端的篮球性感而美丽,而且总体上也是更容易建立模型,让测量完成量化分析。
然而,那些老掉牙的防守数据却还在影响着体育酒吧中的争论,更重要的是,这些数据竟然还在影响着自由球员的合同谈判。当我们见证着篮球正在向着它自己的大数据时代迎头进发时,老旧的东西也该变变了。不幸的是,由于联盟的一些限制,这方面的很多进程被锁在了训练场,即便一些球队拥有着防守分析的模型,但他们却也不会将发现公之于众。
上述研究或许不会让篮球发生质的变化,但它至少向大众球迷呈现了可读性的NBA防守评估。想要更好的理解防守表现,我们还有很长的路要走。由于我们此前没有太多的球队战术和轮换的知识积累,我们很难知晓一名球员应该去完成哪些动作。除非格雷格·波波维奇,汤姆·锡伯杜愿意向公众展现他们的防守战术,而我们更多的只能对此进行有针对性的推测。
无论如何,鉴于数据分析似乎永远都偏向于进攻端,弗兰克斯和米勒的工作变得弥足珍贵。通过建立数据模型、计算和球员追踪系统的综合,球员在防守端的表现被形象的展现在了我们面前,这是史无前例的机会。
NBA正在经历着关注度的大爆发,成千上百万的球迷都沉迷于学习比赛,研究他们喜爱的球员。不幸的是,即便你们研究了所有的数据,也很难在攻防两端都找到同样伟大的数据。希望,这次的研究能够开启改革之路。
在数据栏里,这只是一次微不足道的错失投篮而已。谁在乎呢?没有哪组数据会关注,是保罗追上了库里,守住了相当不错的位置,才造成库里不得不在拿球后向前突破,进而没得分。保罗被视为NBA最佳防守球员之一,但我们却没有什么图表或高端标准,可以证明这一普遍认同的观点。实际上,我们的数据只是用来判断进攻球员的,多么复杂都不怕。相反的,防守分析却依然非常落伍,只是停留在抢断和封盖这老掉牙的环节上。
感谢球员追踪系统的革命,这一切是时候改变了。
同一周的晚些时候,亚历桑德罗·弗兰克斯,安德鲁·米勒两位哈佛大学的博士生,在波士顿举行的麻省理工学院斯隆体育分析大会上展示了他们的论文成果。弗兰克斯、米勒与哈佛数据中心的卢克·保儒恩教授通力合作,分析了2年多来NBA的防守情况。你不用去看复杂的论文,这可以介绍精华版给你,简而言之,我们接下来要说的就是一套能让NBA的防守表现分析更棒的体系。
测量防守是很具挑战性的事情,而那些伟大的防守专家,在数据表的清单中也根本不会显眼。进攻端的精华镜头比比皆是,但防守者却很难获得官方数据表的认同。换而言之就是,某些家伙的防守不错,观众们却很可能不会发现。关于防守的分析,实在是太少了。2年前,扎克·洛维有一篇关于猛龙的文章很不错,伊桑·谢伍德·斯特劳斯也曾经关注过勇士的防守,但真正有价值的防守分析依然屈指可数。
2013年夏天,NBA为29个球场安装了球员追逐系统。每个看起来普通的移动,从此开始被分类——从长距离奔跑到运球突破。当然,最终它带来的额外好处是:我们终于有机会去分析NBA球场上每一秒的防守动作了。
弗兰克斯和米勒的初始目标非常简单:组建一个模型,它能够在NBA比赛中评估每个防守行为。套用负责NBA追踪系统的副总裁助理莱恩·沃金思的说法,“通过对位分配以及职责分配,你可以测量防守者在整场比赛中的影响力。”
这是第一步,也是最关键的一步,我们拥有了对球员防守进行测评的智慧。
尽管弗兰克斯和米勒雄心十足,但数据模型的组建和估算却极为复杂。搞定800亿字节的球员追踪数据,这绝对是一桩苦差事。但是,他们依然立志要完成这个任务,在花费了成吨的时间后,他们完成了对数千个小时录像进行编码和记录的工作。
曙光在这时乍现了。学术方面,他们的研究成果在《应用概率纪事》上发表,并得到了同行的高度评价。此外,弗兰克斯和米勒还在波士顿的会议上,向大家介绍了他们开发的全新的用以定义更新防守指标的模型。他们没有放过2013-14赛季的任何一个毫秒,评判着防守者的表现。比如2013年圣诞节,火箭来到圣安东尼奥对阵马刺,比赛还剩5分钟时,托尼·帕克将球传给了科怀·伦纳德,此时后者已经能够在右翼获得空当机会。詹姆斯·哈登本应该是防守伦纳德的,但他却被蒂姆·邓肯给阻挡了。伦纳德接到了球,哈登冲上去一跃而起,却被伦纳德晃过。后者向前一小步运球,冷静的完成了中投。
正如弗兰克斯在电子邮件中说的,“通过一对一防守时同步性的细节了解,我们可以制作复杂的模型,以此来描述个人防守者是如何影响对方的投篮频率以及球场不同位置上的投篮效率的。”
二位博士将呈现两个关键数据,一是防守投篮的图表,以此揭示一名进攻者如何在防守者紧盯时投篮和得分;第二组数据,是评估每100次控球,防守者能够让对手得多少分。
按弗兰克斯和米勒的说法,保罗是NBA最棒的外线防守球员。他们有十足的证据表明,保罗要比联盟中的任何后卫都更能抑制和干扰投篮行为。也就是说,不管保罗是在防守投篮大师斯蒂芬·库里,还是传球大师拉简·朗多,保罗基本都能让他们减少投篮机会,且降低投篮命中率。伦纳德和保罗相似,他防守的人很难获得预期投篮机会,即便他们投了,也更多会投失。像保罗和伦纳德这样的球员,不管是在防守谁,都能让对手的效率降低,而哈登则会增加对手的进攻能力。
通过两位博士的数据模型,我们还能看到一些很有意思的事情,比如进攻球员在面对罗伊·希伯特和蒂姆·邓肯时,很多人会有“偏向虎山行”的想法,但面对德怀特·霍华德,进攻球员则基本放弃了在近距离投篮的可能性。
这反映的是球员的个人特点,还是球队的防守?有一点可以肯定,鲁迪·戈伯特让特雷·伯克成为了更好的防守者,就像希伯特让保罗·乔治的防守变得更棒了一样。
另外一项重要的数据,是干扰率。上赛季,NBA球员共尝试了超过20万次投篮。我们现在就可以瞧瞧,哪位内线球员干扰了最多的投篮。
从数据表上看,不仅是希伯特干扰了对手42%的投篮,而且他的替补球员伊安·马辛米也排到了第3位。这让我们不禁想到,步行者的防守会逼迫对手的投手们去面对他们的中锋。而这也造成了大卫·韦斯特的“低迷”,他的干扰率可是倒数第一。
干扰率是一回事,而总结出降低得分能力则是另外一回事。
这组数据让我们能够发现球员防守的另一个显著能力。我们会在球员投篮动作发生时(在出手前的0.5-1秒)观察他的对位防守者,计算“尝试防守”和“降低得分”两个值。为了做好这件事,我们观察了所有的一对一防守者,计算了每100次进攻,他们在对方投篮时做出了几次防守动作,以及对方得了多少分。
在弗兰克斯-米勒的系统中,没有人能像CP3那么粘人,他在一对一防守的100次进攻中,只让对手得到11分,达米恩·利拉德,库里,帕克,他都不怕。保罗最多能让对手的命中率降低80%,而哈登则反过来,让对手命中率增长了114%。
此前,我们已经讨论了球员追踪系统是如何令篮球分析发生革命性变化的,不过到目前为止,我们真正关心的依然是进攻篮球分析。进攻端的篮球性感而美丽,而且总体上也是更容易建立模型,让测量完成量化分析。
然而,那些老掉牙的防守数据却还在影响着体育酒吧中的争论,更重要的是,这些数据竟然还在影响着自由球员的合同谈判。当我们见证着篮球正在向着它自己的大数据时代迎头进发时,老旧的东西也该变变了。不幸的是,由于联盟的一些限制,这方面的很多进程被锁在了训练场,即便一些球队拥有着防守分析的模型,但他们却也不会将发现公之于众。
上述研究或许不会让篮球发生质的变化,但它至少向大众球迷呈现了可读性的NBA防守评估。想要更好的理解防守表现,我们还有很长的路要走。由于我们此前没有太多的球队战术和轮换的知识积累,我们很难知晓一名球员应该去完成哪些动作。除非格雷格·波波维奇,汤姆·锡伯杜愿意向公众展现他们的防守战术,而我们更多的只能对此进行有针对性的推测。
无论如何,鉴于数据分析似乎永远都偏向于进攻端,弗兰克斯和米勒的工作变得弥足珍贵。通过建立数据模型、计算和球员追踪系统的综合,球员在防守端的表现被形象的展现在了我们面前,这是史无前例的机会。
NBA正在经历着关注度的大爆发,成千上百万的球迷都沉迷于学习比赛,研究他们喜爱的球员。不幸的是,即便你们研究了所有的数据,也很难在攻防两端都找到同样伟大的数据。希望,这次的研究能够开启改革之路。