论文部分内容阅读
“绿坝”有无溃坝之忧?
Is Green Dam Easy to Crack?
工信部发布的通知规定:自7 月1 日起,在中国境内生产销售的计算机在出厂前将预装 “绿坝• 花季护航”上网过滤软件。它有过滤不良信息、控制上网时间、限制聊天交友、限制电脑游戏等功能。然而,对于其功能的实现效果,各方反应不一,有人激烈攻击它为“流氓软件”。
陈英
(工信部软件司副司长)
主动过滤技术先进
事实上,大部分的软件采访的技术方案是黑名单库的方式,这是被动的一种技术,只能屏蔽上了黑名单的不良网站,一旦更改域名或网址,将轻易躲过监控。而我们选择的这两款软件,采取的是内容过滤方式,这是一种主动的方式,只要含有这些色情的、淫秽的、暴力的这样一些不适合青少年接触的内容,它就会自动被屏蔽掉了。
Randy Yao
(密歇根大学计算机系博士后)
存在两处严重的安全漏洞
经过不到一天的检测,我们发现了两处主要的程序错误,一个与监管网站的进程有关,一个与在线更新黑名单有关。这两处错误都将导致严重的安全漏洞,使得各方都允许远程执行任意代码,并对用户计算机采取控制。
首先是绿坝一旦被安装后,它将拦截互联网流量和进程,看看是否有访问网站的黑名单。由于程序错误,用户访问的任何网站可以充分利用这些问题来控制电脑。这可能允许恶意网站窃取个人资料,发送垃圾邮件,或将计算机置于一个僵尸网络之中。其次,我们还发现绿坝在黑名单更新进程中的漏洞。如果用户激活在线更新进程,就使得软件制造商或冒充的第三方,可以在完成更新之后执行恶意代码,或安装恶意软件。此外,绿坝使用了计算机视觉技术以阻止包含裸露的在线图片。但我们发现,该程序包含的代码库和一个配置文件引自开源图像识别软件OpenCV。我们还找到了一个加密的配置文件wfileu.dat,该文件从CyberSitter 网站引用黑名单网站清单。
在不到12 小时的测试中我们发现了上述问题,我们相信这可能只是冰山的一角。纠正这些问题,需要大量的修改和彻底的重新测试。而这些工作要在7 月1 号大规模预装的期限之前完成,是非常困难的。
张晨民
(金惠公司总经理,金惠为该软件的两家开发商之一)
图像识别正确率高
绿坝的图像识别正确率高达94.3%,这个都是在官网上有正式公布的,是前期工信部组织权威评测的结果。之后会根据各种渠道搜集到的用户反馈意见进行升级,用户可以通过管理软件免费在线更新。绿坝软件是可以实现完全卸载的,但是需要在管理界面里手动进行有关操作后,再重启计算机才能完全卸载。这和一般的免费软件的过程是没什么差别的。我们的软件在拦截不良图片方面是采用的基于图像本身的过滤技术,并不需要提前知道图像的来源。因此也不需要从用户那里搜集信息,不存在网络监控的问题。请用户放心。
袁进辉:
(图像搜索博士后,清华大学智能系统实验室)
图像识别技术尚不成熟
目前信息识别主要通过两种手段:对于文字,主要通过关键字匹配和过滤;图像要难一点,需要通过“机器学习”的方式:首先要建立一个大型的数据库,然后进行参数分析,把“不良信息”的呈现规律找出来,然后对软件进行“训练”,优化算法,最后嵌入到产品中。现在图像识别的研究前沿,是教计算机对具有一般特征的物体进行识别,比如一辆汽车,一个行人,或者一台电脑。至于像“不良信息”这种针对性特别强的,相对比较好做,而且已经有一些较为成熟的技术。关键看你“规律”如何设定,否则还是可能判断错。比方说,对某张可能“涉黄”的人体图片,要判断是不是“不良信息”,机器并不需要识别出来是个人,或者只是个物体。它只需要建立一个“皮肤”模型,通过对“颜色”及“裸露程度”等信息来判断。这样的话,一块和人体皮肤接近的橡胶,或是一块面料,都有可能被软件识别出来,认为是“不良信息”。
Is Green Dam Easy to Crack?
工信部发布的通知规定:自7 月1 日起,在中国境内生产销售的计算机在出厂前将预装 “绿坝• 花季护航”上网过滤软件。它有过滤不良信息、控制上网时间、限制聊天交友、限制电脑游戏等功能。然而,对于其功能的实现效果,各方反应不一,有人激烈攻击它为“流氓软件”。
陈英
(工信部软件司副司长)
主动过滤技术先进
事实上,大部分的软件采访的技术方案是黑名单库的方式,这是被动的一种技术,只能屏蔽上了黑名单的不良网站,一旦更改域名或网址,将轻易躲过监控。而我们选择的这两款软件,采取的是内容过滤方式,这是一种主动的方式,只要含有这些色情的、淫秽的、暴力的这样一些不适合青少年接触的内容,它就会自动被屏蔽掉了。
Randy Yao
(密歇根大学计算机系博士后)
存在两处严重的安全漏洞
经过不到一天的检测,我们发现了两处主要的程序错误,一个与监管网站的进程有关,一个与在线更新黑名单有关。这两处错误都将导致严重的安全漏洞,使得各方都允许远程执行任意代码,并对用户计算机采取控制。
首先是绿坝一旦被安装后,它将拦截互联网流量和进程,看看是否有访问网站的黑名单。由于程序错误,用户访问的任何网站可以充分利用这些问题来控制电脑。这可能允许恶意网站窃取个人资料,发送垃圾邮件,或将计算机置于一个僵尸网络之中。其次,我们还发现绿坝在黑名单更新进程中的漏洞。如果用户激活在线更新进程,就使得软件制造商或冒充的第三方,可以在完成更新之后执行恶意代码,或安装恶意软件。此外,绿坝使用了计算机视觉技术以阻止包含裸露的在线图片。但我们发现,该程序包含的代码库和一个配置文件引自开源图像识别软件OpenCV。我们还找到了一个加密的配置文件wfileu.dat,该文件从CyberSitter 网站引用黑名单网站清单。
在不到12 小时的测试中我们发现了上述问题,我们相信这可能只是冰山的一角。纠正这些问题,需要大量的修改和彻底的重新测试。而这些工作要在7 月1 号大规模预装的期限之前完成,是非常困难的。
张晨民
(金惠公司总经理,金惠为该软件的两家开发商之一)
图像识别正确率高
绿坝的图像识别正确率高达94.3%,这个都是在官网上有正式公布的,是前期工信部组织权威评测的结果。之后会根据各种渠道搜集到的用户反馈意见进行升级,用户可以通过管理软件免费在线更新。绿坝软件是可以实现完全卸载的,但是需要在管理界面里手动进行有关操作后,再重启计算机才能完全卸载。这和一般的免费软件的过程是没什么差别的。我们的软件在拦截不良图片方面是采用的基于图像本身的过滤技术,并不需要提前知道图像的来源。因此也不需要从用户那里搜集信息,不存在网络监控的问题。请用户放心。
袁进辉:
(图像搜索博士后,清华大学智能系统实验室)
图像识别技术尚不成熟
目前信息识别主要通过两种手段:对于文字,主要通过关键字匹配和过滤;图像要难一点,需要通过“机器学习”的方式:首先要建立一个大型的数据库,然后进行参数分析,把“不良信息”的呈现规律找出来,然后对软件进行“训练”,优化算法,最后嵌入到产品中。现在图像识别的研究前沿,是教计算机对具有一般特征的物体进行识别,比如一辆汽车,一个行人,或者一台电脑。至于像“不良信息”这种针对性特别强的,相对比较好做,而且已经有一些较为成熟的技术。关键看你“规律”如何设定,否则还是可能判断错。比方说,对某张可能“涉黄”的人体图片,要判断是不是“不良信息”,机器并不需要识别出来是个人,或者只是个物体。它只需要建立一个“皮肤”模型,通过对“颜色”及“裸露程度”等信息来判断。这样的话,一块和人体皮肤接近的橡胶,或是一块面料,都有可能被软件识别出来,认为是“不良信息”。