论文部分内容阅读
微博是常用的社交媒体,但对于微博图片和文本相关性的研究还很少。为研究中文图文微博相关性,使用了三种方法计算图文微博相似度特征,并将其与图文微博文本特征、社会特征组合起来,采用三种机器学习方法进行相关性分类。实验结果表明,针对三种图文相似度特征计算方法,基于Word Net的方法与基于WordEmbedding的方法效果较好,基于余弦相似度的方法效果较差;而加入文本特征和社会特征后,相关关系识别结果在三种机器学习算法上都有所提高。综合考虑三种因素,使用Word-Embedding方法计算图文微博相似度