互联网社区问答平台上基于“众包”的信息污染:测量、分析与防治

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hqxt2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“众包”的工作方式由来已久,并且日益盛行。通过“众包”的方式,雇主可以从人群中购买服务,整合人力来完成一个复杂的工作。近些年来,“众包”方式被广泛应用于互联网中,“众包”平台就是作为该方式的运行媒介而产生的。然而,“众包”平台在为大规模社会合作提供基础服务的同时也经常被恶意使用,雇主可以雇佣大量人力向网络发布大量带有偏见的评论和垃圾信息,甚至包含病毒的链接。这种由“众包”平台导致的向网络信息污染,其用户参与度高、影响范围广,俨然已经形成了一个完整的网络生态系统,对网络安全造成严重的威胁。但是,人们对这样的生态系统仍缺乏认识,任由其对信息资源以及人类身心健康等造成损害或其他负面影响。本文首次聚焦于“众包”平台中的“黑暗面”,研究了产生于“猪八戒”(大型中文“众包”平台)上,以“百度知道”(国内最大的社区问答平台)为污染目标的“众包”活动。提出了一个大规模的网络测量方法来收集“猪八戒“和“百度知道”的数据。通过把“猪八戒“的“众包”需求和威客,以及“百度知道“的垃圾账号和垃圾信息连接起来,提出一个隐藏于“众包”平台下的对网络信息造成污染的网络生态系统。同时从垃圾信息的规模与范围、威客的“女巫账号”及其相互合作、威客的工作与报酬、“众包”活动的质量控制等不同方面全面深入地分析了该生态系统。另外,基于对“众包”中产生垃圾信息的生态系统的理解以及对社区问答平台中的垃圾账号和普通账号的行为差异的分析,提出一个全新的垃圾账号鉴别方法。
其他文献
随着信息技术的飞速发展以及数据的不断积累,如何从现有的历史数据中发掘对用户未来决策有指导性的信息是计算机科学技术面临的挑战性任务之一。聚类分析技术通过根据数据的相
随着计算机网络技术的迅速发展,无线局域网(WLAN)因其不断提高的传输速率和灵活的移动能力而被人们越来越广泛地应用在各个领域。无线局域网采用无线媒介传输,具有信道开放的
合同网协议是多Agent系统(MAS)中解决分布式任务求解的重要协议,得到充分的利用和广泛的关注。随着研究的深入,合同网协议暴露出很多的不足,研究人员对其进行了扩展和完善,但
随着计算机及网络技术的迅猛发展,多媒体信息已经渗透到人们生产生活的各个方面,并且在近年来呈现出信息交互频繁、数据海量增长、云端服务日益完善的发展特点。视频作为载有
Web系统使用广泛,如何进行有效的测试保证Web系统的可靠性至关重要。但是由于Web应用程序多采用分布式结构,各类实体间的藕合度小,Web及其脚本语言的发展,使其结构与行为特征越来
作为现代通信、介质存储、数据发行、多媒体计算机等技术的关键环节,图像压缩编码始终是信息处理技术研究中最为活跃的领域之一。为了有效的存储、处理和传输大量的数据,从而
随着光通信技术的快速发展特别是密集波分复用技术的发展,单根光纤的传输能力已经达到了Tbps数量级。同时,音、视频等对网络服务质量要求较高的多媒体应用在网络中的比列也在
近年来有关图像中的特征识别技术已经日趋成熟,并且被广泛应用于图像检索、图像识别、物体跟踪等领域;而视频中的特征识别研究则刚刚起步,有关视频检索、视频解析、动作识别
当前,无论是整个社会的发展还是电子十所自身的改革与发展,都对该所人事和工资管理提出了更高、更新的要求。建立以信息技术支持的现代人事和工资管理系统,是建设好电子十所
针对MEMS设计与加工脱节的问题,本文对MEMS工艺验证进行了研究,旨在使MEMS设计者在在进行工艺仿真以及MEMS器件加工之前,先对版图和工序进行可加工性验证,如果版图或工序是不可加