论文部分内容阅读
交友网站是如何帮你找对象的?
“寻找爱情。真爱保证。”
——默契网的口号
我有一位朋友,就称她“鲁比”吧。最近,她的约会生活处于枯竭期,实际上,比这更糟,更像是受到酸雨断断续续袭扰的枯竭期。危机终于在某天夜里爆发,由于挫败和绝望涌上心头,鲁比掏出信用卡,按下按键,向默契网(Match.com)送出39.99美元,成为享有一个月在线约会服务的会员。第二天,她告诉了我这个决定,同时,迈上了为期一个月通过在线约会寻找爱情的征程。当时,我从开始就怀疑她所有的努力能否真的奏效,但我当时却无法充分解释,为什么默契网看起来如此不精致?
“它们的广告都在忽悠人。”我对鲁比说(这里描述的一些经历实际上来源于我周遭的朋友,我希望隐匿她的名字)。“你既年轻又漂亮,而且生活在大都会里!为什么要把时间浪费在陌生人身上呢?”然而,鲁比在美国中西部长大,她从来没有动摇过自己的信念:在任何领域里,只要努力,就能成功。于是,她决定在默契网上全力以赴。
每个星期,她要花上几天时间去调整自己的档案、搜索无数个男人的档案、与最看得上眼的人交换电子邮件、然后约会。有一次,她甚至牺牲周末上午的时光,与一位欧陆哲学博士生去喝咖啡,那个男人却根本没有提出任何想了解她的问题。一个月渐渐过去,她的标准越来越低。档案中那些将照片只拍到眉毛来掩饰日渐上移的发迹线的男人不再被排除在外。鲁比转向“低端市场”,相应地重置了“我在寻找什么样的人”的设置,但她收获的仅仅是更多的“悲惨”约会。到了月底,她不得不承认失败了。可是,我们仍然好奇,这个自诩每天吸引20,000个新会员的、美国最受欢迎的付费交友网站怎么就在鲁比身上失败了呢?
出于对该网站匹配算法的好奇,我建立了自己的档案。由于我已经了解了一个女性在默契网上会经历些什么,于是,我装作是一个男的。我将自己身高多加了两英寸,使用的照片是我Facebook上一个看起来挺窝囊的朋友的头像。
最后形成的人是“多愁善感的哥们450”,他是一个身高5英尺9英寸、有“运动员身材和肤色”的27岁犹太人,年收入四到六万,喜欢瑜伽和猫。尽管我在网站上待的一个月里,有一些女士过来看过他的档案,但是,没有人给他发过邮件,甚至连一个“媚眼”也没有。
公平地说,“多愁善感的哥们450”并没有将自己完全真实地放在网络上。他从来没有给网站推荐的“相互匹配者”发送邮件。但是,这些匹配者和“每日5名”(由该网站的“先进婚介服务”选择,它提示用户查看当日的匹配结果,并为每个档案选择“可以”,“不行”或“也许”)确实包含了一些关于匹配如何选择的线索。我需要这些线索,因为该网站没人愿意就此文章发表评论,他们有一个并不过分的理由,该网站的技术是独家的。“匹配如何运行?”的简单答案似乎是:“不是它表面看上去的运行方式。”
“多愁善感的哥们”并没有选择潜在约会对象的身高、种族、收入或体型。“给我个惊喜吧!”我想。
但是,在第一组推荐的约会对象中,匹配者们与“哥们”的相似之处还不如匹配者之间的共同点更多。这组人中,包括一个小个子的23岁的犹太女性,她有一张坐在高档餐厅里的可爱照片,还有两张在男人臂弯里的照片。她喜欢《经济学人》,但也喜欢《我们周刊》(八卦杂志,编注)。她的爱好包括“早午餐”。该网站说我们相匹配,是因为我们都是爱狗者、长子、以及运动员身材和肤色。
该网站说,第二个匹配者也是基于出生顺序和宠物偏好的一致性来选择的。但是,我发现她也是个犹太人,也很年轻(24岁),而且也很矮,只有5英尺2英寸。她在“自我介绍”的板块中宣称,“在扬基队比赛场里拥有固定位子的人将被优先考虑”。一张身着球衫参加棒球比赛的照片更是加强了她的宣言,另一张照片是她穿着内裤和背心摆造型。
当网站询问我是否对她有兴趣时,我点击了“也许”,接着我又对其他几个矮小年轻的犹太姑娘点了“也许”。我不想选择“是”,因为这会自动通知她们:我对她们有兴趣。但是一个在Top5中看到我档案的女人点选“是”,于是我查看了她。
她是一个24岁的妇产科实验室技术员,档案写得语无伦次,漏洞百出。她喜欢逛商场,讨厌乡村音乐,她的头像是一张咬着吸管的古怪照片。看来,该网站极力想找出我们之间的共同点,它指出,“就像你一样,她也没结过婚!”我查看了一下自己的档案,提醒自己并非“抢手货”,然后,我就合上了我的笔记本。我开始理解当初鲁比加入该网站时我感到怀疑的原因。这太恶心了,设想一下,现实世界中,有一个男人如同刚才我一样坐在那里,匆匆查看女人们的照片,疯狂地想吸引她们的注意力,甚至不惜上传他们穿着泳衣的照片,一脸坏笑地扭动着身躯,撅出自己的屁股。
这是一项大生意。根据弗里斯特调研公司的分析,2008年,网上约会取得了9.57亿美元的收入,成为在线付费内容收入的第三大产业,仅次于音乐下载和游戏。预计到2013年,这行业会保持着10%的年增长率。即使(或尤其)在经济收缩的大背景下,默契网也在蓬勃发展。
身为默契网上的一个“男人”,我感觉自己像是在进行网上购物一样,这是有道理的。该网站使用相同类型的数据挖掘技术,叫做潜在语义索引(latentsemantic indexing,LSI),类似Google的搜索引擎,用它来进行网页的相关性排序。
将人和产品成功匹配的技巧(或者人与其他人,或人和其他通过“档案”将自己包装成像产品一样的人)就是数学。
“你和我不能想象出四维空间,但是数学和计算机可以,”博客发布平台六度公司(sixApart)的副总裁大卫-雅各布斯(David Jacobs)说,他曾经使用相似的技术设计社交媒体网站。“默契网用于寻找匹配者所添加的每项属性,可认作在‘空间’中创造了新的维度。该算法创造了一个具有大约数百或数千个轴向的虚拟图形。
这真是直截了当。但是,该技巧的另一半并不清晰:它必须分析客户浏览信息的方式,而不是他们提供的排名和反馈信息。在为“多愁善感的哥们450”推荐匹配者时,可以因为我们“都是长子”,也可以因为网站知道类似“多愁善感的哥们”的用户会点击挣钱较少、身高较矮、并属于相同种族的女性档案。这两个原因是不同的。
“这些公司都在大力投资于研发,试图找出一种作为竞争优势的‘违心技巧’(他们所说的),”雅各布斯说。“他们从来都不会共享细节,因为,他们认为这是秘密武器。而且,我猜测这些‘违心技巧’不是单独的向量。有些因素人们声称不关心,但事实并非如此,种族因素就可能是这样的向量,能够明显识别出。
雅各布斯并没有表示,默契网的开发人员可以通过“违心技巧”自动地洞察出谁会爱上谁。更可能的是,程序员使用一种叫做特征值矩阵分解法(singular-value decomposition,SVD)的代数工具,它在统计学中有很多应用。默契网的计算机不知道,人类在选择宗教或体型等条件时所想要的约会对象的特点。然而,它们可以识别模式:SVD给两位具有一些相同喜好和特点的用户互相认可对方的可能性打分。
在雅各布斯填补了我关于LSI知识的空白之后,默契网给我的解释(“你们在同一个月出生”)如此简单才显得有些道理。除开其他的因素,它观察那些我花最多时间阅读的档案,以及类似我的用户喜欢的档案,通过这个,找出并推荐匹配对象。
这有点令人毛骨悚然啊,计算机竟然可以找出“多愁善感的哥们”真正想要什么样的人,或者,至少了解他在寻找什么样的人,假如他真的存在。唯一让人略为轻松的是,至少在鲁比的案例中,所有的预测技术一而再、再而三地错了。
在该网站多待一些时间,也许会给鲁比带来好运:该网站已经更加了解她。可惜的是,那以后,她一直在网络外的真实世界中寻找约会对象。这种方法也有好的一面。对于新手,至少你可以等到与某人在现实中见面后,再向他展示你穿比基尼的样子。
“寻找爱情。真爱保证。”
——默契网的口号
我有一位朋友,就称她“鲁比”吧。最近,她的约会生活处于枯竭期,实际上,比这更糟,更像是受到酸雨断断续续袭扰的枯竭期。危机终于在某天夜里爆发,由于挫败和绝望涌上心头,鲁比掏出信用卡,按下按键,向默契网(Match.com)送出39.99美元,成为享有一个月在线约会服务的会员。第二天,她告诉了我这个决定,同时,迈上了为期一个月通过在线约会寻找爱情的征程。当时,我从开始就怀疑她所有的努力能否真的奏效,但我当时却无法充分解释,为什么默契网看起来如此不精致?
“它们的广告都在忽悠人。”我对鲁比说(这里描述的一些经历实际上来源于我周遭的朋友,我希望隐匿她的名字)。“你既年轻又漂亮,而且生活在大都会里!为什么要把时间浪费在陌生人身上呢?”然而,鲁比在美国中西部长大,她从来没有动摇过自己的信念:在任何领域里,只要努力,就能成功。于是,她决定在默契网上全力以赴。
每个星期,她要花上几天时间去调整自己的档案、搜索无数个男人的档案、与最看得上眼的人交换电子邮件、然后约会。有一次,她甚至牺牲周末上午的时光,与一位欧陆哲学博士生去喝咖啡,那个男人却根本没有提出任何想了解她的问题。一个月渐渐过去,她的标准越来越低。档案中那些将照片只拍到眉毛来掩饰日渐上移的发迹线的男人不再被排除在外。鲁比转向“低端市场”,相应地重置了“我在寻找什么样的人”的设置,但她收获的仅仅是更多的“悲惨”约会。到了月底,她不得不承认失败了。可是,我们仍然好奇,这个自诩每天吸引20,000个新会员的、美国最受欢迎的付费交友网站怎么就在鲁比身上失败了呢?
出于对该网站匹配算法的好奇,我建立了自己的档案。由于我已经了解了一个女性在默契网上会经历些什么,于是,我装作是一个男的。我将自己身高多加了两英寸,使用的照片是我Facebook上一个看起来挺窝囊的朋友的头像。
最后形成的人是“多愁善感的哥们450”,他是一个身高5英尺9英寸、有“运动员身材和肤色”的27岁犹太人,年收入四到六万,喜欢瑜伽和猫。尽管我在网站上待的一个月里,有一些女士过来看过他的档案,但是,没有人给他发过邮件,甚至连一个“媚眼”也没有。
公平地说,“多愁善感的哥们450”并没有将自己完全真实地放在网络上。他从来没有给网站推荐的“相互匹配者”发送邮件。但是,这些匹配者和“每日5名”(由该网站的“先进婚介服务”选择,它提示用户查看当日的匹配结果,并为每个档案选择“可以”,“不行”或“也许”)确实包含了一些关于匹配如何选择的线索。我需要这些线索,因为该网站没人愿意就此文章发表评论,他们有一个并不过分的理由,该网站的技术是独家的。“匹配如何运行?”的简单答案似乎是:“不是它表面看上去的运行方式。”
“多愁善感的哥们”并没有选择潜在约会对象的身高、种族、收入或体型。“给我个惊喜吧!”我想。
但是,在第一组推荐的约会对象中,匹配者们与“哥们”的相似之处还不如匹配者之间的共同点更多。这组人中,包括一个小个子的23岁的犹太女性,她有一张坐在高档餐厅里的可爱照片,还有两张在男人臂弯里的照片。她喜欢《经济学人》,但也喜欢《我们周刊》(八卦杂志,编注)。她的爱好包括“早午餐”。该网站说我们相匹配,是因为我们都是爱狗者、长子、以及运动员身材和肤色。
该网站说,第二个匹配者也是基于出生顺序和宠物偏好的一致性来选择的。但是,我发现她也是个犹太人,也很年轻(24岁),而且也很矮,只有5英尺2英寸。她在“自我介绍”的板块中宣称,“在扬基队比赛场里拥有固定位子的人将被优先考虑”。一张身着球衫参加棒球比赛的照片更是加强了她的宣言,另一张照片是她穿着内裤和背心摆造型。
当网站询问我是否对她有兴趣时,我点击了“也许”,接着我又对其他几个矮小年轻的犹太姑娘点了“也许”。我不想选择“是”,因为这会自动通知她们:我对她们有兴趣。但是一个在Top5中看到我档案的女人点选“是”,于是我查看了她。
她是一个24岁的妇产科实验室技术员,档案写得语无伦次,漏洞百出。她喜欢逛商场,讨厌乡村音乐,她的头像是一张咬着吸管的古怪照片。看来,该网站极力想找出我们之间的共同点,它指出,“就像你一样,她也没结过婚!”我查看了一下自己的档案,提醒自己并非“抢手货”,然后,我就合上了我的笔记本。我开始理解当初鲁比加入该网站时我感到怀疑的原因。这太恶心了,设想一下,现实世界中,有一个男人如同刚才我一样坐在那里,匆匆查看女人们的照片,疯狂地想吸引她们的注意力,甚至不惜上传他们穿着泳衣的照片,一脸坏笑地扭动着身躯,撅出自己的屁股。
这是一项大生意。根据弗里斯特调研公司的分析,2008年,网上约会取得了9.57亿美元的收入,成为在线付费内容收入的第三大产业,仅次于音乐下载和游戏。预计到2013年,这行业会保持着10%的年增长率。即使(或尤其)在经济收缩的大背景下,默契网也在蓬勃发展。
身为默契网上的一个“男人”,我感觉自己像是在进行网上购物一样,这是有道理的。该网站使用相同类型的数据挖掘技术,叫做潜在语义索引(latentsemantic indexing,LSI),类似Google的搜索引擎,用它来进行网页的相关性排序。
将人和产品成功匹配的技巧(或者人与其他人,或人和其他通过“档案”将自己包装成像产品一样的人)就是数学。
“你和我不能想象出四维空间,但是数学和计算机可以,”博客发布平台六度公司(sixApart)的副总裁大卫-雅各布斯(David Jacobs)说,他曾经使用相似的技术设计社交媒体网站。“默契网用于寻找匹配者所添加的每项属性,可认作在‘空间’中创造了新的维度。该算法创造了一个具有大约数百或数千个轴向的虚拟图形。
这真是直截了当。但是,该技巧的另一半并不清晰:它必须分析客户浏览信息的方式,而不是他们提供的排名和反馈信息。在为“多愁善感的哥们450”推荐匹配者时,可以因为我们“都是长子”,也可以因为网站知道类似“多愁善感的哥们”的用户会点击挣钱较少、身高较矮、并属于相同种族的女性档案。这两个原因是不同的。
“这些公司都在大力投资于研发,试图找出一种作为竞争优势的‘违心技巧’(他们所说的),”雅各布斯说。“他们从来都不会共享细节,因为,他们认为这是秘密武器。而且,我猜测这些‘违心技巧’不是单独的向量。有些因素人们声称不关心,但事实并非如此,种族因素就可能是这样的向量,能够明显识别出。
雅各布斯并没有表示,默契网的开发人员可以通过“违心技巧”自动地洞察出谁会爱上谁。更可能的是,程序员使用一种叫做特征值矩阵分解法(singular-value decomposition,SVD)的代数工具,它在统计学中有很多应用。默契网的计算机不知道,人类在选择宗教或体型等条件时所想要的约会对象的特点。然而,它们可以识别模式:SVD给两位具有一些相同喜好和特点的用户互相认可对方的可能性打分。
在雅各布斯填补了我关于LSI知识的空白之后,默契网给我的解释(“你们在同一个月出生”)如此简单才显得有些道理。除开其他的因素,它观察那些我花最多时间阅读的档案,以及类似我的用户喜欢的档案,通过这个,找出并推荐匹配对象。
这有点令人毛骨悚然啊,计算机竟然可以找出“多愁善感的哥们”真正想要什么样的人,或者,至少了解他在寻找什么样的人,假如他真的存在。唯一让人略为轻松的是,至少在鲁比的案例中,所有的预测技术一而再、再而三地错了。
在该网站多待一些时间,也许会给鲁比带来好运:该网站已经更加了解她。可惜的是,那以后,她一直在网络外的真实世界中寻找约会对象。这种方法也有好的一面。对于新手,至少你可以等到与某人在现实中见面后,再向他展示你穿比基尼的样子。