论文部分内容阅读
采用用户历史查询词构建用户画像时,现有向量空间模型存在特征稀疏和上下文依赖性强的问题。针对该问题,通过引入LDA主题模型,首先提取查询词潜在主题,得到查询词对应的主题分布;然后将概率最大的主题对应的词扩充到原始特征空间中,丰富用户特征;最后采用SVM分类算法对用户基本属性进行分类,构建用户画像。实验表明,利用LDA模型对用户特征进行扩展比传统向量空间模型用户画像精度提高了1.6%。