论文部分内容阅读
图片搜索引擎返回的结果列表中通常包含大量的相似及重复图片。用户需要花费大量的时间从结果列表中遴选所需的图片。如果能对检索结果进行语义聚类,则能为用户节省大量时间,并且节省页面空间以显示更多检索结果。近年来兴起的生成式统计主题模型在文本归纳及分类应用中得到良好应用。通过对图片抽取特征符,把图片表示为类似文本的词汇-文档模型,生成式统计主题模型在图像理解领域也得到广泛应用。文中对使用搜索引擎检索得到的图片进行特征符提取处理,然后通过统计主题模型的学习过程,获得低维的语义空间,然后在语义空间中进行聚类操作