一种分布式用户浏览点击模型算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:yupucn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为从海量搜索点击日志中快速挖掘用户行为,提出一种分布式用户浏览点击模型(UBM)算法。原始UBM算法求出的检验度参数E只与搜索结果文档所在排序位置以及上一文档的点击位置有关,且非常稳定,基于此特性,将EM迭代求解转换为抽样估计检验度以求解吸引度的分布式UBM算法。在Spark数据平台上进行仿真,结果表明,与原始UBM算法相比,该算法能够解决点击日志中存在的严重数据倾斜问题,且运行效率较高。
其他文献
通过磨加方法,将纳米二氧化硅引入到钢板搪瓷釉中,在不改变钢板搪瓷釉工艺性能的条件下,提高钢板搪瓷的耐酸化学稳定性。研究结果表明,磨加一定量纳米二氧化硅到钢板搪瓷釉中,不仅
目的探讨基于微信的Seminar-案例教学法应用于本科护生临床实习教学中的效果。方法方便抽样法选取在大连市某三级甲等医院实习的2012级本科护生42人为对照组,2013级本科护生3
主要介绍玻璃环切均匀性测试技术的实施方法。该测试技术依据玻璃均匀性与力学性能之间的关系,通过对环切检测技术的工作原理、测试装置、测试步骤和使用技巧的论述,分析瓶罐
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
研发创新投入与企业创新之间的协调一致发展是评价企业创新活动有效性的重要表现。通过研究,发现资本、劳动、项目投入是企业研发创新的表征变量,科技产出、经济产出是企业研
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
要促进学生在科学课堂中主动探究, 教师必须从学生学习的角度去设计课堂探究活动, 以学习单任务、 关键问题任务、 核心问题任务等形式驱动学生持续探究, 把课堂的时间与空间
文章依据学院现有的专业布局,讨论了构建数控技术专业群的合理性和必要性,并对专业群的人才培养机制、专业群课程体系构建以及专业群背景下的基于CDIO视角教学模式创新等作了论