论文部分内容阅读
标签系统以及社会网络作为Web2.0技术的典型应用,已经受到了来自产业界和研究界的广泛关注。人们普遍认为,标签作为一种用户自发的对网上内容进行分类和标注的信息,能够促进信息检索的效率,并吸引更多的用户更深入的使用互联网资源。然而这种自组织的数据却为研究者带来了挑战。研究者在从数据的分析,到标签语义结构的挖掘,到最终利用标签信息辅助推荐和检索,进行了一轮初步的研究后,发现对标签系统中数据的了解仍不完整,因而对标签的使用也只限于简单的方法。而在社会网络方面,虽然已有的社会学和物理学领域的基础研究已经相当丰富,但如何从虚拟社会网络所提供的人的活动信息提炼出人与人关联的动机和机制,以及社会网络如何帮助信息的传播,这些问题仍没有建立起与方法的直接对应。
本文针对以上问题,在已有研究的基础上,进行了三个方面的探索:
①用复杂网络的统计分析方法研究了标签数据和社会网络数据。对复杂网络的统计方法,在标签数据特有的三项图中进行改进。根据统计分析结果,深入地阐述了标签数据所表现出的潜在规律性和应用价值。
②从作为特征和作为用户浏览的中间量两个角度,完整的评估了标签在推荐系统中的作用。提出了基于三项图的用户浏览模型,利用基于随机游走的相似度计算,将用户利用标签来寻找潜在资源的不同行为模式融入推荐中,并取得了良好的效果。
③用渗透模型验证了社会网络中存在的标签传播,及其传播的模式。定义了基于信息传导的重要性参数,并通过该参数寻找社会网络中的关键用户。首次将社会网络通过图模型引入推荐中。
总的说来,本文在已有的标签系统和社会网络研究的基础上,做出了进一步的有益探索。