基于翻译模型的查询会话检测方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zhongyuzhang09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询会话检测的目的是确定用户为了满足某个特定需求而连续提交的相关查询。查询会话检测对于查询日志分析以及用户行为分析来说是非常有用的。传统的查询会话检测方法大都基于查询词的比较,无法解决词语不匹配问题(vocabulary-mismatch problem)——有些主题相关的查询之间并没有相同的词语。为了解决词语不匹配问题,我们在该文提出了一种基于翻译模型的查询会话检测方法,该方法将词与词之间的关系刻画为词与词之间的翻译概率,这样即使词与词之间没有相同的词语,我们也可以捕捉到它们之间的语义关系。同时,我们也提出了两种从查询日志中估计词翻译概率的方法,第一种方法基于查询的时间间隔,第二种方法基于查询的点击URLs。实验结果证明了该方法的有效性。
其他文献
介绍了应用组培技术繁殖观叶植物的方法及生产过程中应注意的问题与解决办法.
在我国经济迅速发展的进程中,存在着大量不同建造时期、依据不同规范的既有建筑,如何对这类建筑结构的抗震性能进行评估,是一门亟待解决的课题。本文结合钢筋混凝土(以下简称
目的 人机交互方式的丰富性和交互量的日益增加,交互词与其上下位通过联想或者搭配关系,形成一个完成的意义有助于减少用户的思考时间,提高交互效率,因此对交互词和交互效率
高吸水树脂是一种具有优良吸水性和保水性的新型高分子材料,自开发以来被广泛地应用于农业园艺、卫生、建筑业等领域。丙烯酸系吸水树脂吸水能力强但抗盐性、强度差,淀粉系高
目的分析Ⅲ期非小细胞肺癌手术治疗患者预后的影响因素。方法 60例Ⅲ期非小细胞肺癌患者,将36个月后仍然存活的对象纳入存活组,死亡患者纳入死亡组,分析影响患者预后的因素。
创新是时代发展的要求,也是高校办公室工作的灵魂。这就需要转变高校办公室传统管理理念,逐步实现从由领导管人向由制度管人转变、由侧重管理向深化治理转变、由被动执行向高
<正>为了追寻着广府饮食文化的源远流长的历史,参悟南越文明的真实灵韵,对广州惠福路美食花街改造设计中,我们坚持现代性与地域性的结合,思考如何在对广府文化的继承与拓展下
文中对大数据聚类算法K-means算法及其优化进行研究,并主要针对确定聚类数目和初始中心给出了优化的算法。首先,利用平均误差平方和的指标来评估聚类结果的好坏,从而确定聚类
目的 比较吻合器痔上黏膜环切术(PPH)与经肛吻合器直肠切除术(STARR)治疗重度脱垂痔的临床疗效。方法 选择2015年1月至2016年3月北京市隆福医院收治的重度脱垂痔患者70例,根
在详细分析了蚁群算法的数学模型及综述当前国内外蚁群算法研究现状的基础上,文章重点对状态转移概率和信息素更新机制进行改进,并以旅行商问题(TSP)为例进行仿真实验,有效地避