论文部分内容阅读
巴拉克奥巴马当选总统的两年后,民主党遭遇了几十年来最重大的挫败。民主党在议会的多数优势曾给奥巴马带来了立法上的成功,改革了医疗保险和金融市场。但在中期选举中,这种优势被一扫而空。众议院的控制权被逆转,而民主党在参议院的领导地位也缩水成了微弱优势,已经难以掌控该院。专家们费力地解释茶党兴起的原因。选民们对奥巴马的政治议题感到失望,这一点显而易见,因为独立选民突然转舵支持共和党,民主党选民则不愿出门投票。2010年,民主党全国委员会(Democratic NationalCommittee)在奥巴马时代的第一次考试中未能过关:没能把曾经的奥巴马联盟继续团结在一起。
但对于民主党而言,在所有这些失败中尚有一丝凄凉的安慰:丹瓦格纳(Dan Wagner)之前已经预见到了这场挫败。2009年1月,瓦格纳被民主党全国委员会聘为目标定位总监,负责收集和分析选民信息,用来帮助委员会通过直邮和电话的方式接触个体选民。他把这些信息输入到自己的统计模型中,结果发现这些原材料实际上已经相当于一系列对选民态度和倾向性的问卷调查了。他请委员会的技术部门研发了一套软件,把这些信息转换成表格。他把这个软件叫做“调查经理(SurveyManager)”。
那年秋天,纽约上州举行了一场特殊选举来填补一个国会席位的空缺,瓦格纳在选举日远未到来之时就成功地预测出了最后的票数差距,误差小于150票。几个月后,民意调查人员预测玛莎科克利(Martha Coakley)将毫无疑问地赢得另一场补选,填补泰德肯尼迪(Ted Kennedy)逝世后空出来的马萨诸塞州联邦参议员席位。但是瓦格纳的调查经理软件正确地预测出共和党人斯科特·布朗(Scott Brown)会在这个民主党势力强大的州胜出。“在你将要获得胜利的时候做出正确的预测是一回事,而在你将要失败的时候正确地做出预测又是另外一回事了。”位于民主党全国委员会的总统竞选团体“为美国组织起来”的全国副主管杰里米伯德说。(译注:2013年1月,“为美国组织起来”已经变身为继续帮助奥巴马实现政治议程的非牟利团体“行动组织”。)
而在输掉选举的5个月前就能正确做出预测又是另一回事了。当2010年中期选举临近的时候,瓦格纳做了一个统计模型,预测参议院和74个国会选区的竞选结果。他从6月份起就开始预测了。后来证明,他当时得出的胜负票差准确得惊人。但是他并不是通过传统的民意调查做到这一点的,而是一票一票地统计选票。当几千通电话调查的结果和民主党全国委员会数据库中丰富的统计档案匹配起来的时候,瓦格纳第一次意识到民主党有麻烦了。民主党的核心选民告诉委员会的电话调查员,他们出__投票的可能性远低于统计概率的预测。瓦格纳还可以计算出民主党的动员计划需要付出多少努力才能提高支持者的投票率,他还知道在大多数选区,动员计划不足以弥补调查经理软件上显现的差距。
瓦格纳对国会竞选的预测只有平均2.5%的误差。“很多人不明白这背后的数学方法,但知道这种方法产生了价值。对他们来说,这个数字是一个证明,”“为美国组织起来”的主管米奇斯图尔特说,“当第一次补选结束后,他的话在民主党全国委员会内部就成为了金字标准。”
瓦格纳所获成就的重要性远远不止于在距选举日几个月前就能宣布准是获胜者。他的方法实际上是和20世纪追踪民意的工具做了一个清晰的了断。上个世纪使用的方法是隔离出小样本作为整体的代表。而瓦格纳是从一批骨干分析人员中脱颖而出。这些人把每个选民视为独立个体,逐渐累积对每个人的观念和行为的推测,直到为每个人拼画出一幅肖像。
瓦格纳的这套方法标志着一种酝酿了10年的新思路开始付诸实践。预测者眼中的选民不再局限于政治地理学或人口学类别如年龄和性别中。这些传统的人口学类别划分依赖于民意调查员询问的选民属性,以及市场营销人员为商业目的对消费者进行的划分。如今,选民被视为一个个公民个体,每个人都能按照自己的具体状况被测量和评估。现在,该由那些希望领导这些公民的候选人来创造一场选战了,在这场战役中,他就将以这种针对个体的方式来和民众们展开互动。
在选民们第二度把奥巴马送上总统宝座以后,他的竞选团队因为对技术的使用而一举成名。这些技术由一个政治选举中不常见的程序员和工程师团队开发,重新定义了个人使用互联网、社交媒体和智能手机参与政治过程的方式。其中一项手机应用程序让选民调查员不用跑到竞选办公室里就能下载和返回调查表;网络平台Dashboard可以给最积极的支持者排序,把志愿者的活动游戏化:“目标分享”协议可以挖掘奥巴马支持者在Facebook上的人脉网络,寻找竞选团队想要注册、动员或游说的人。
但隐藏在所有这些方法底下的,是用来描述特定选民的分数:一种预测个人行为的新政治货币。竞选团队不仅仅能知道你是什么人,它还非常清楚怎么把你变成它想要你成为的人。
4年前,瓦格纳在芝加哥一家经济咨询公司工作,在那里发挥他在芝加哥大学研读计量经济学时获得的预测技能。当时巴拉克奥巴马是伊利诺伊州的参议员,瓦格纳成了他的拥趸,决定助阵这名自己家乡的参议员角逐2008年的总统选举。当时24岁的瓦格纳很快来到了爱荷华州的州府得梅因,负责把该州选民的档案数据输入系统。在这些档案的指导下,奥巴马在爱荷华民主党党内会议上取得了关键性的胜利(获选民主党总统候选人)。在长时间的党内初选过程中,瓦格纳从一个州辗转至另一个州,对选民数据以及使用统计模型来筛选选民的方式日益熟悉。在大选中,他被任命为五大湖/俄亥俄河谷地区的首席目标定位员,这里是全国拉锯最激烈的战场。
奥巴马胜选后,他的首席顾问团中有许多人移居到了华盛顿,开始为执政做准备。瓦格纳则被要求留守后方,在一个选后专门小组中工作,回顾这场在外部世界看来没有任何技术失误的选战。
2008年的总统选举中,奥巴马阵营中的目标定位员们给这个国家中的每一位选民都打了两个分数。这两个分数是基于每个人在两种和选战息息相关的行为上的可能性:投票、支持奥巴马。这些分数是由持续展开、前所未有的大量调查得来的。在每个两党竞争激励的摇摆州,竞选团队的电话调查中心每周都会拨出5千至1万个电话,进行所谓的简短访问,快速衡量某位选民的倾向性。此外,他们还会再拨打1千个电话,进行更类似传统问卷的历时较长的访问。为了得出基于个体的预测,算法会在选民反馈的观点和竞选团队收集到的每个选民的数据之间寻找模式。每位选民有1千个之多的变量,数据的来源包括选民登记信息、消费者数据仓库,以及以往的选战人际关系。
这种创新方式在前线操作中最具价值。在那里,一个几近完美的微目标定位模型循环系统引导志愿者走访或电话访问某位选民,根据系统事先拟定的问题展开对话。而每次这样的互动所产生的数据会传回到奥巴马竞选团队的电脑中,进一步改善模型,指示志愿者接下来哪户人家的大门值得去融一融。这一过程的效率之高、规模之大,使得民主党在为选民做特征记录时远远走在了前面。约翰麦凯恩(John McCain)的竞选团队在大部分州仅仅使用了一次数据模型,在当年夏季把每位选民归入到其微目标定位系统的某个分类中。当选举的动态发生变化时,麦凯恩的顾问团无法重新计算出选民们支持某位候选人的可能性。而奥巴马团队的分数则每周调整,对新事件比如莎拉佩林被提名副总统候选人或雷曼兄弟集团倒闭做出回应。
不过,在奥巴马团队的内部,大家都清楚数据技术存在不足。有个问题在政治信息基础设施中很典型,就是有关人们的资料信息和竞选团队与他们的互动数据是分开储存的。这主要是因为这些数据库是由不同的咨询团队分别研发,而他们并无兴趣让各自的系统联合起来运作。
不过,专门小组知道,下次选战不会再有这样的问题。因为奥巴马将会以一个在任总统的身份进行自己的最后一次总统选举,而不再是以挑战者的角色来对阵一个当权者。4年来,这个小组的成员们都明白,他们这个团队将掌控民主党的组织架构。决定市场行为的将是他们这个小组的需求,而非咨询公司或供应商的意见。他们的报告建议创建一个“选民关系管理系统”,让整个竞选团队中的所有工作人员都不再把每个人单单地视为选民、志愿者、捐赠人或网站用户,而是完全意义上的公民。“我们意识到,竞选团队中的其他人在和我们的数据及(信息)基础设施的互动上存在问题,我们需要把这个系统提供给团队的所有部门。”专门小组数据应用研发员克里斯·文格任说。
文格任后来担任了民主党全国委员会的目标定位研发员。他监督了一系列购买活动。这些花费的目的是为了让民主党不再依赖外来数据。委员会购置了一套西门子企业系统
但对于民主党而言,在所有这些失败中尚有一丝凄凉的安慰:丹瓦格纳(Dan Wagner)之前已经预见到了这场挫败。2009年1月,瓦格纳被民主党全国委员会聘为目标定位总监,负责收集和分析选民信息,用来帮助委员会通过直邮和电话的方式接触个体选民。他把这些信息输入到自己的统计模型中,结果发现这些原材料实际上已经相当于一系列对选民态度和倾向性的问卷调查了。他请委员会的技术部门研发了一套软件,把这些信息转换成表格。他把这个软件叫做“调查经理(SurveyManager)”。
那年秋天,纽约上州举行了一场特殊选举来填补一个国会席位的空缺,瓦格纳在选举日远未到来之时就成功地预测出了最后的票数差距,误差小于150票。几个月后,民意调查人员预测玛莎科克利(Martha Coakley)将毫无疑问地赢得另一场补选,填补泰德肯尼迪(Ted Kennedy)逝世后空出来的马萨诸塞州联邦参议员席位。但是瓦格纳的调查经理软件正确地预测出共和党人斯科特·布朗(Scott Brown)会在这个民主党势力强大的州胜出。“在你将要获得胜利的时候做出正确的预测是一回事,而在你将要失败的时候正确地做出预测又是另外一回事了。”位于民主党全国委员会的总统竞选团体“为美国组织起来”的全国副主管杰里米伯德说。(译注:2013年1月,“为美国组织起来”已经变身为继续帮助奥巴马实现政治议程的非牟利团体“行动组织”。)
而在输掉选举的5个月前就能正确做出预测又是另一回事了。当2010年中期选举临近的时候,瓦格纳做了一个统计模型,预测参议院和74个国会选区的竞选结果。他从6月份起就开始预测了。后来证明,他当时得出的胜负票差准确得惊人。但是他并不是通过传统的民意调查做到这一点的,而是一票一票地统计选票。当几千通电话调查的结果和民主党全国委员会数据库中丰富的统计档案匹配起来的时候,瓦格纳第一次意识到民主党有麻烦了。民主党的核心选民告诉委员会的电话调查员,他们出__投票的可能性远低于统计概率的预测。瓦格纳还可以计算出民主党的动员计划需要付出多少努力才能提高支持者的投票率,他还知道在大多数选区,动员计划不足以弥补调查经理软件上显现的差距。
瓦格纳对国会竞选的预测只有平均2.5%的误差。“很多人不明白这背后的数学方法,但知道这种方法产生了价值。对他们来说,这个数字是一个证明,”“为美国组织起来”的主管米奇斯图尔特说,“当第一次补选结束后,他的话在民主党全国委员会内部就成为了金字标准。”
瓦格纳所获成就的重要性远远不止于在距选举日几个月前就能宣布准是获胜者。他的方法实际上是和20世纪追踪民意的工具做了一个清晰的了断。上个世纪使用的方法是隔离出小样本作为整体的代表。而瓦格纳是从一批骨干分析人员中脱颖而出。这些人把每个选民视为独立个体,逐渐累积对每个人的观念和行为的推测,直到为每个人拼画出一幅肖像。
瓦格纳的这套方法标志着一种酝酿了10年的新思路开始付诸实践。预测者眼中的选民不再局限于政治地理学或人口学类别如年龄和性别中。这些传统的人口学类别划分依赖于民意调查员询问的选民属性,以及市场营销人员为商业目的对消费者进行的划分。如今,选民被视为一个个公民个体,每个人都能按照自己的具体状况被测量和评估。现在,该由那些希望领导这些公民的候选人来创造一场选战了,在这场战役中,他就将以这种针对个体的方式来和民众们展开互动。
在选民们第二度把奥巴马送上总统宝座以后,他的竞选团队因为对技术的使用而一举成名。这些技术由一个政治选举中不常见的程序员和工程师团队开发,重新定义了个人使用互联网、社交媒体和智能手机参与政治过程的方式。其中一项手机应用程序让选民调查员不用跑到竞选办公室里就能下载和返回调查表;网络平台Dashboard可以给最积极的支持者排序,把志愿者的活动游戏化:“目标分享”协议可以挖掘奥巴马支持者在Facebook上的人脉网络,寻找竞选团队想要注册、动员或游说的人。
但隐藏在所有这些方法底下的,是用来描述特定选民的分数:一种预测个人行为的新政治货币。竞选团队不仅仅能知道你是什么人,它还非常清楚怎么把你变成它想要你成为的人。
4年前,瓦格纳在芝加哥一家经济咨询公司工作,在那里发挥他在芝加哥大学研读计量经济学时获得的预测技能。当时巴拉克奥巴马是伊利诺伊州的参议员,瓦格纳成了他的拥趸,决定助阵这名自己家乡的参议员角逐2008年的总统选举。当时24岁的瓦格纳很快来到了爱荷华州的州府得梅因,负责把该州选民的档案数据输入系统。在这些档案的指导下,奥巴马在爱荷华民主党党内会议上取得了关键性的胜利(获选民主党总统候选人)。在长时间的党内初选过程中,瓦格纳从一个州辗转至另一个州,对选民数据以及使用统计模型来筛选选民的方式日益熟悉。在大选中,他被任命为五大湖/俄亥俄河谷地区的首席目标定位员,这里是全国拉锯最激烈的战场。
奥巴马胜选后,他的首席顾问团中有许多人移居到了华盛顿,开始为执政做准备。瓦格纳则被要求留守后方,在一个选后专门小组中工作,回顾这场在外部世界看来没有任何技术失误的选战。
2008年的总统选举中,奥巴马阵营中的目标定位员们给这个国家中的每一位选民都打了两个分数。这两个分数是基于每个人在两种和选战息息相关的行为上的可能性:投票、支持奥巴马。这些分数是由持续展开、前所未有的大量调查得来的。在每个两党竞争激励的摇摆州,竞选团队的电话调查中心每周都会拨出5千至1万个电话,进行所谓的简短访问,快速衡量某位选民的倾向性。此外,他们还会再拨打1千个电话,进行更类似传统问卷的历时较长的访问。为了得出基于个体的预测,算法会在选民反馈的观点和竞选团队收集到的每个选民的数据之间寻找模式。每位选民有1千个之多的变量,数据的来源包括选民登记信息、消费者数据仓库,以及以往的选战人际关系。
这种创新方式在前线操作中最具价值。在那里,一个几近完美的微目标定位模型循环系统引导志愿者走访或电话访问某位选民,根据系统事先拟定的问题展开对话。而每次这样的互动所产生的数据会传回到奥巴马竞选团队的电脑中,进一步改善模型,指示志愿者接下来哪户人家的大门值得去融一融。这一过程的效率之高、规模之大,使得民主党在为选民做特征记录时远远走在了前面。约翰麦凯恩(John McCain)的竞选团队在大部分州仅仅使用了一次数据模型,在当年夏季把每位选民归入到其微目标定位系统的某个分类中。当选举的动态发生变化时,麦凯恩的顾问团无法重新计算出选民们支持某位候选人的可能性。而奥巴马团队的分数则每周调整,对新事件比如莎拉佩林被提名副总统候选人或雷曼兄弟集团倒闭做出回应。
不过,在奥巴马团队的内部,大家都清楚数据技术存在不足。有个问题在政治信息基础设施中很典型,就是有关人们的资料信息和竞选团队与他们的互动数据是分开储存的。这主要是因为这些数据库是由不同的咨询团队分别研发,而他们并无兴趣让各自的系统联合起来运作。
不过,专门小组知道,下次选战不会再有这样的问题。因为奥巴马将会以一个在任总统的身份进行自己的最后一次总统选举,而不再是以挑战者的角色来对阵一个当权者。4年来,这个小组的成员们都明白,他们这个团队将掌控民主党的组织架构。决定市场行为的将是他们这个小组的需求,而非咨询公司或供应商的意见。他们的报告建议创建一个“选民关系管理系统”,让整个竞选团队中的所有工作人员都不再把每个人单单地视为选民、志愿者、捐赠人或网站用户,而是完全意义上的公民。“我们意识到,竞选团队中的其他人在和我们的数据及(信息)基础设施的互动上存在问题,我们需要把这个系统提供给团队的所有部门。”专门小组数据应用研发员克里斯·文格任说。
文格任后来担任了民主党全国委员会的目标定位研发员。他监督了一系列购买活动。这些花费的目的是为了让民主党不再依赖外来数据。委员会购置了一套西门子企业系统