垃圾标签抵御机制的设计与评估

来源 :北京大学 | 被引量 : 0次 | 上传用户:wreck2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标签系统是一种新的信息分类方式,它可以让互联网的用户对网络上的某个资源,或者内容标注任意他们认为合适的词语,该词语是对这个资源或者内容的描述,因此可以帮助用户非常快速地获得资源,而免去了从己知的分类集合中选择某个类别所带来的额外负载。标签系统很容易受到两种类型的攻击,一种攻击会试图让一篇文档出现在某些标签搜索里,但其实它是不应该出现的,也就是垃圾标签;另一种攻击试图通过建立一篇文档与其它文档的关系而达到推销该文档的目的。标签系统可以分为集中式的和分布式的,基于P2P的分布式标签系统,其自我组织、自我维护的特性决定了它比集中式标签系统更容易受到垃圾标签的攻击。   本文专门对P2P标签系统中的垃圾标签问题进行研究分析,并提出了可行、有效地解决方法,也就是文章中将重点介绍的DSpam垃圾标签抵御系统。DSpam系统采用了一种全新的基于社会网络的可信度机制。每次检索标签时,DSpamClient都响应该检索请求的节点分为两大类,即无交互记录节点和有交互记录节点。对于这两类不同的节点,DSpam Client首先计算他们的可靠度,然后把可靠度作为权重,对搜索的结果进行排序。为了获得质量更高的搜索结果,本文还引入了社会网络中的朋友关系作为改进机制。之所以引入该机制,主要是考虑到社会网络的中的朋友之间可以共享各自的交互经验,从而有助于改进DSpam的性能以及收敛性。   最后,本文还对DSpam模型做了模拟实验和对比实验。在仿真环境中,将DSpam模型与现有的3种典型的标签检索模型进行比较。实验结果表明,在随机攻击和共谋攻击下,DSpam模型的性能和收敛性都优于其他标签检索模型,因此可以更加有效地抵御垃圾标签。  
其他文献
本课题来源于国家重大科技基础设施项目东半球空间环境地基综合监测子午链工程(简称子午工程)的数据与通信系统中的数据汇集子系统,并且是整个子午工程核心业务中的重要组成
学位
随着机械工业的不断发展和计算机网络技术研究的不断深入,传统的产品设计模式已经不能满足人们对产品开发的要求,产品的异地协同设计制造与管理是未来产品开发的必然趋势。为
随着工业控制对象的规模日益复杂以及对控制精度的要求日益提高,工业控制过程中的连续动态系统(CVDS)和离散事件动态系统(DEDS)的之间的混杂特性越来越明显,支持多通道控制功
地震数据可视化技术是地震数据处理技术的核心和最主要的组成部分。这项技术在当今石油勘探行业的地震数据处理中发挥了越来越重要的作用。各国对石油、天然气的巨大需求推动
规则引擎是推理引擎的一种,它起源于基于规则的专家系统。近些年来,规则引擎被越来越广泛的应用在业务逻辑的处理过程中,它将业务决策从应用程序代码中分离出来,接收数据输入
勘探石油天然气主要有三种方法。地质法、物探方法和钻探法。在这三方法中,物探方法的地震勘探是现代最主流也是最有效的方法。地震勘探工作包括三个步骤。数据采集、数据处
随着高校信息化的蓬勃发展,许多高校已经建立了相当多数量的应用系统,然而由于开发平台、工具的异构性和紧耦合性导致了应用系统之间不能互通互联、资源共享与软件复用,从而
医学图像归档与通信系统(PACS)作为医院信息系统(HIS)的重要部分,在传输、存储和处理医学影像过程中起着非常重要的作用。由于远程会诊的出现,PACS系统必须适应大规模、开放式
软件开发者对于日趋复杂的软件系统的理解和控制越来越困难,传统软件工程正接近其复杂性和可扩展性的极限.复杂性使软件开发困难,质量难以保证。以较低的代价、在规定的时间
目前,兵器工业第59研究所自然环境试验中心对材料表面腐蚀特征进行评价分析主要是通过人工观测分析的方法。人工观测分析方法由于受人的差异和经验等因素的影响,一方面难以保