论文部分内容阅读
Folksonomy是一种基于Web2.0的新型知识分类方法。Folksonomy由用户、资源、标签三个重要元素组成。具有自由性、共享性和用户性等特点。在实际应用中Folksonomy系统常常受到垃圾信息的侵害。为了解决新领域中的新问题,我们在已有方法的基础上,提出新的方法加以解决。本文借助支持向量机的数学模型构建出针对Folksonomy的大规模垃圾标签检测模型。又在商空间粒度分析理论的启发下,将粒度分析思想引入数据约减领域。提出商空间框架下的大规模SVM数据集约减模型。利用该模型实例化出来的双层减样法对大规模垃圾标签检测模型优化。最终形成基于双层减样支持向量机(BR-SVM)的大规模垃圾标签检测模型。本文取得以下研究成果:
(1)本文借助商空间粒度分析理论,把“粒度”的概念引入约减模型,提出商空间框架下的大规模SVM数据集约减模型。
(2)将提出的“商空间框架下的大规模SVM数据集约减理论模型”具体化后,得到双层减样法。这是本文研究的难点,也是将理论模型实例化的必要环节。该减样法利用“粒度”概念把聚类约减和单点约减有机结合,形成了效果更好的针对支持向量机数据集优化的约减法。
(3)将理论研究的成果运用到Folksonomy标签系统这个新兴领域中,是对本文研究内容的检验。为Folksonomy标签系统设计基于双层减样支持向量机(BR-SVM)的垃圾标签检测模型。模型中还提出了Folksonomy用户建模方法,把用户分类问题转化为文本分类问题。基于BR-SVM的垃圾标签检测模型对于标签系统的垃圾检测效果比现有的同类检测模型效果更好。