论文部分内容阅读
当网络的“人肉搜索”是否需要立法监管的问题还在激烈讨论中时,今年6月28日,微软悄然推出一款能够直观显示被搜索者人脉关系的“人立方”关系搜索引擎。在这里,你能搜索出李宇春是姚明的妹妹,比尔·盖茨居然同潘金莲扯上了关系……
“人立方”关系搜索引擎一出现,就在网上引起热议,有人认为这是一个大玩具,也是一个恶搞的利器;还有人则认为,这是一个让我们更没有隐私的凶器。
更多的人则在思考,未来,当我们的一切都被公布于那张庞大的“人立方”地图上,你最希望知道什么呢?几步可以认识自己的偶像?你的新老板是不是自己的远房亲戚?还是看看你怎么联系到布什总统……
奥运期间,微软人立方搜索推出中国运动员的“全家福”,这个独具特色的人物关系图像是散落在银河中的星座。每个人以一个圆圈代表,不同的人物用不同的颜色体现出来,颜色越不同,人物关系关联性越弱。以搜索对象为圆心,从每个圆圈向四周散射出若干连线,发射出的辐射线条多少和半径体现人物的热度和受关注的程度。
微软亚洲研究院研究员聂再清博士把人立方的开发看成一种偶然,“微软的Libra学术搜索(libra.msra.cn)做得很成功,后来,为了让这种应用更加大众化,我们在2006年5月份开始做人物搜索。人立方这个名字也是我们一位同事在午饭闲聊时想到的,后来越发觉得贴切。”当时并没有过多的考虑商业应用的因素。
聂再清介绍,人立方关系搜索从超过十亿的中文网页中自动地抽取出人名、地名、机构名以及中文短语,并且通过算法自动地计算出它们之间存在关系的可能性;同时,人立方关系搜索还索引了支持它们之间关系的网页文字。此外,人立方关系搜索还自动地找出人名之间最可能的关系描述词、与人名最可能相关的称呼、作品词条等。简单说,它能展示出你所搜索对象的关系网。
登陆“人立方”搜索网站可以看到,首页上除搜索栏之外,也设立了“搜索人气榜”、“姓名大全”和“奥运关系图”。在网站首页的下方,更分有“体育”、“娱乐”、“政治”、“商界”、“学术”和“机构”6大类别,并且把这6大类别里面的各个热门人物或机构都一一列出,方便网友查询。
如果,你在“人立方”的搜索栏键入“姚明”的名字,搜索出来的结果被分为“关系”、“网页”、“资讯”和“简介”4个方面。点击“关系”,立刻显示一张二维的效果图,是一张姚明的关系图,在姚明名字的周围出现各种颜色、距离不同的姓名,有麦蒂、奥尼尔、王治郅、叶莉、乔丹、章明基……点击连接两个名字之间的白线,图上显示出这些名字同姚明的关系:队友、对手、女友、接班人、经纪人,在这些名字之中,居然还出现了李宇春,而图上标明李宇春同姚明的关系是“妹妹”,这一切只是源于某个社区论坛中的一句话,“人都说李宇春是姚明的妹妹”。
网友前年一道介绍,人立方关系搜索目前最大的亮点在于趣味性。其实,这个系统只是自动的搜索网页,其信息来源无非是网站的新闻报道、社区论坛、博客链接、空间等,只要你曾经在自己的博客上评论过某位名人,都有可能被系统自动搜索到,电脑只会自动算出他们存在关系的可能性,而不会去管他到底是不是真的。
前年一道说,目前的“人立方”搜索除了娱乐大众之外,几乎没有任何意义,它只不过是把很多缺乏真实性的信息杂鞣在一起罢了,总是能搜出匪夷所思的结果,比如李宇春是姚明的妹妹,比尔·盖茨居然同潘金莲扯上了关系等。但是,“人立方”的特色正是在于它并不试图反映真实的关系,而只在意网络大众的舆论和行为,于是,它被很多网友当作新一轮的恶搞利器。
也有网友对它的出现表示担忧,reliitt就表示,“人立方”的出现将使“人肉搜索”更方便,从而引发更多的“网络暴力”事件。因为,一般网友在网上进行人肉搜索的时候,还要花时间理清搜索得来的人物关系,现在人立方推出一个“网状关系图”,被搜索者的人脉关系能够一目了然,减轻了人肉搜索者的工作量,可能还会大大提高他们的工作效率,让他们搜索到更多的东西。
业内专家陈永东表示,应该承认,人立方搜索的总体设计的确有创意,它可以瞬间为你理出一张“关系网“。但人立方搜索也存在诸多的致命伤,比如在人立方搜索中,可能以互联网上众多的信息为搜索对象,其中必然包含一些不准确的、虚假的信息。例如,“李宇春是姚明的妹妹”本是个谣传,在人立方搜索关于“姚明”的“关系图”中却赫然在目。另外,中国人那么多,出现些重名的也属正常,但是在人立方搜索中,却要么只有其中一个最出名的人的关系图,要么两个或多个相同的人同时出现在一个关系图中。
针对这种问题,聂再清表示,人立方的第二个版本会解决掉重名人的身份识别难点,抓取信息的时候识别有价值的网页,而不是抓取BBS上的口水帖和虚假信息。微软亚洲研究院最终的目标就是把网页搜索一行行的展示,变成对象搜索平面关系的铺展,“用户这种不同的使用体验对于搜索引擎来说,就像DOS系统到Windows的革命一样。”
“人立方”关系搜索引擎一出现,就在网上引起热议,有人认为这是一个大玩具,也是一个恶搞的利器;还有人则认为,这是一个让我们更没有隐私的凶器。
更多的人则在思考,未来,当我们的一切都被公布于那张庞大的“人立方”地图上,你最希望知道什么呢?几步可以认识自己的偶像?你的新老板是不是自己的远房亲戚?还是看看你怎么联系到布什总统……
奥运期间,微软人立方搜索推出中国运动员的“全家福”,这个独具特色的人物关系图像是散落在银河中的星座。每个人以一个圆圈代表,不同的人物用不同的颜色体现出来,颜色越不同,人物关系关联性越弱。以搜索对象为圆心,从每个圆圈向四周散射出若干连线,发射出的辐射线条多少和半径体现人物的热度和受关注的程度。
微软亚洲研究院研究员聂再清博士把人立方的开发看成一种偶然,“微软的Libra学术搜索(libra.msra.cn)做得很成功,后来,为了让这种应用更加大众化,我们在2006年5月份开始做人物搜索。人立方这个名字也是我们一位同事在午饭闲聊时想到的,后来越发觉得贴切。”当时并没有过多的考虑商业应用的因素。
聂再清介绍,人立方关系搜索从超过十亿的中文网页中自动地抽取出人名、地名、机构名以及中文短语,并且通过算法自动地计算出它们之间存在关系的可能性;同时,人立方关系搜索还索引了支持它们之间关系的网页文字。此外,人立方关系搜索还自动地找出人名之间最可能的关系描述词、与人名最可能相关的称呼、作品词条等。简单说,它能展示出你所搜索对象的关系网。
登陆“人立方”搜索网站可以看到,首页上除搜索栏之外,也设立了“搜索人气榜”、“姓名大全”和“奥运关系图”。在网站首页的下方,更分有“体育”、“娱乐”、“政治”、“商界”、“学术”和“机构”6大类别,并且把这6大类别里面的各个热门人物或机构都一一列出,方便网友查询。
如果,你在“人立方”的搜索栏键入“姚明”的名字,搜索出来的结果被分为“关系”、“网页”、“资讯”和“简介”4个方面。点击“关系”,立刻显示一张二维的效果图,是一张姚明的关系图,在姚明名字的周围出现各种颜色、距离不同的姓名,有麦蒂、奥尼尔、王治郅、叶莉、乔丹、章明基……点击连接两个名字之间的白线,图上显示出这些名字同姚明的关系:队友、对手、女友、接班人、经纪人,在这些名字之中,居然还出现了李宇春,而图上标明李宇春同姚明的关系是“妹妹”,这一切只是源于某个社区论坛中的一句话,“人都说李宇春是姚明的妹妹”。
网友前年一道介绍,人立方关系搜索目前最大的亮点在于趣味性。其实,这个系统只是自动的搜索网页,其信息来源无非是网站的新闻报道、社区论坛、博客链接、空间等,只要你曾经在自己的博客上评论过某位名人,都有可能被系统自动搜索到,电脑只会自动算出他们存在关系的可能性,而不会去管他到底是不是真的。
前年一道说,目前的“人立方”搜索除了娱乐大众之外,几乎没有任何意义,它只不过是把很多缺乏真实性的信息杂鞣在一起罢了,总是能搜出匪夷所思的结果,比如李宇春是姚明的妹妹,比尔·盖茨居然同潘金莲扯上了关系等。但是,“人立方”的特色正是在于它并不试图反映真实的关系,而只在意网络大众的舆论和行为,于是,它被很多网友当作新一轮的恶搞利器。
也有网友对它的出现表示担忧,reliitt就表示,“人立方”的出现将使“人肉搜索”更方便,从而引发更多的“网络暴力”事件。因为,一般网友在网上进行人肉搜索的时候,还要花时间理清搜索得来的人物关系,现在人立方推出一个“网状关系图”,被搜索者的人脉关系能够一目了然,减轻了人肉搜索者的工作量,可能还会大大提高他们的工作效率,让他们搜索到更多的东西。
业内专家陈永东表示,应该承认,人立方搜索的总体设计的确有创意,它可以瞬间为你理出一张“关系网“。但人立方搜索也存在诸多的致命伤,比如在人立方搜索中,可能以互联网上众多的信息为搜索对象,其中必然包含一些不准确的、虚假的信息。例如,“李宇春是姚明的妹妹”本是个谣传,在人立方搜索关于“姚明”的“关系图”中却赫然在目。另外,中国人那么多,出现些重名的也属正常,但是在人立方搜索中,却要么只有其中一个最出名的人的关系图,要么两个或多个相同的人同时出现在一个关系图中。
针对这种问题,聂再清表示,人立方的第二个版本会解决掉重名人的身份识别难点,抓取信息的时候识别有价值的网页,而不是抓取BBS上的口水帖和虚假信息。微软亚洲研究院最终的目标就是把网页搜索一行行的展示,变成对象搜索平面关系的铺展,“用户这种不同的使用体验对于搜索引擎来说,就像DOS系统到Windows的革命一样。”