论文部分内容阅读
进入21世纪以来,Web2.0的出现极大地催生了社交网络的发展。虚拟社区,和现实社会一样,有着复杂的社会关系。传统上针对社会关系的研究大都停留在好友推荐、好友排序和关系圈挖掘上面,很少有研究虚拟社区中的网络关系内容本身的。本文中的社会关系研究就是针对关系内容本身,不过本文只研究下面两种情形的社会关系:第一种情形是以话题为中心的社会关系,它是属于“人-物”关系范畴并且以物为中心的关系,包含支持关系、反对关系以及中立关系;第二种情形是以用户为中心的社会关系,它是属于“人-人”关系范畴并且以人为中心的关系,包含支持关系、反对关系、中立关系、同盟关系、宿敌关系以及合作关系。1微博话题的社会关系。本研究将微博话题的社会关系分析看成是一个短文本分类问题,并采用短文本分类的方法解决该问题。在研究过程中,共采用了三种特征提取方法:人工选取法、信息增益法以及融合人工选取与信息增益的合成特征法。在实验数据集上,将三种特征选取方法进行对比,实验表明合成特征法的效果好于人工选取法与信息增益法。2微博用户的社会关系。本研究将微博用户的社会关系分析看成是一个长短文本结合的分类问题,将采用文本分类的方法解决该问题。在分析过程中,采用两种方法:单体分析法、整体分析法。在整体分析法中使用了二次分类算法。实验结果表明二次分类算法的结果优于SVM分类方法。本文的研究成果已经成功应用到两个系统中:微博社会关系系统与海天社会关系系统。微博社会关系系统部署在新浪微博官方应用中,该系统分析了微博用户的社会关系;海天社会关系部署在智能计算实验室的官方网站海天园系统中,该系统展现了话题和用户的社会关系不断交互传播。