论文部分内容阅读
本文从研究和设计的角度出发,对微博检索系统的相关理论与技术对比分析,提出改进,主要的改进工作为:第一,从伪相关反馈扩展角度出发,每个反馈的文档依据查询事件的爆发时间分布具有不同的先验概率,采用不同的时间分布模型,本文提出动态伪相关反馈扩展方案;从扩展查询同义词角度出发,提出基于词向量的相近词查找方案;第二,改进了检索模型,作为扩展的概率模型,本文使用随机性差异框架,该框架具有较强的可扩展性;第三,对于检索的结果进行了二次优化,提出集成学习排序算法策略,促使排序靠后的相关文档获得较高的排序,以提高用户的体验效果。 本文在各模块改进的基础上,提出了完整的微博检索系统框架,通过对比实验证明了该检索系统的有效性,并且检索出的相关文档还能进行二次开发。因此,基于微博的检索技术的研究具有十分重要意义,并且具有较高的实用价值。