论文部分内容阅读
针对图像检索中存在的"语义鸿沟"问题,本文提出一种语义学习模型进行图像的自动标注。首先提出连续的概率潜在语义分析(PLSA)模型及对应的参数估计算法,并利用最大惩罚似然的方法解决协方差矩阵的奇异性问题;然后,提出一个根据不同模态数据各自的特点进行处理的概率模型,该模型使用连续PLSA和传统PLSA分别建模视觉特征和文本关键词,并通过不对称学习算法发现两种模态之间共有的语义主题,从而能更精确地对未知图像进行标注。通过在分别包含5 000幅和31 695幅图像的两个标准Corel数据集上进行实验,并与几