基于Hive数据仓库的在线阅读用户建模与聚类方法

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:qichen1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网的高速发展为在线阅读系统带来了海量的用户行为日志。针对日益巨大的TB甚至PB级用户行为日志数据,该文设计一种基于Hive数据仓库的用户模型及用户聚类方案。该方法能够准确的基于用户的阅读行为刻画用户的多维度、多尺度偏好特征,构建动态用户需求模型,并基于用户特征进行聚类,划分用户集,为个性化推荐、搜索或者广告投放等Web个性化应用提供服务。实验结果表明,该方法可以发挥集群存储和运算的优势,具有良好的性能和执行速度。
其他文献
办公室只有一台扫描仪,而且本身不支持网络扫描功能,网内其他用户需要使用扫描仪时只有到连接有该扫描仪的PC上进行操作,然后再将扫描得到的文件发送到自己的电脑中才行,操作起来十分不方便。下面就介绍一款局域网共享软件,就能解决上述问题。在这样的情况下,只要用一款名为Netscan的软件就可轻松达到让扫描仪共享的目的。假设连接扫描仪的PC为A机,网内的其他PC为B机。解压后安装程
<正> 空肠弯曲菌(Campylobacter jejuni)可感染人和各种动物,是人畜较常见的腹泻病原菌之一。在我国分布很广泛。早在1980年,WHO 研究工作组就将弯曲菌所致肠炎列为最常见的
[目的]研究四氢呋喃(THF)职业接触工人尿中THF含量与工作场所空气中THF及THF个体接触量的剂量-效应:关系,探讨尿THF作为职业接触生物监测指标的可行性。[方法]利用溶剂解吸气相色
设D为n阶强连通竞赛图,证明了当n≥5时,D的本原指数3≤r(D)≤m+2,并给出了达到最大值n+2的极图的一刻划及达到最小值3的科的荐干条件。
<正> 细胞的正常生长增殖受着正性调节因子的促进和负性调节因子的抑制这两方面因素的调节。Heldin 认为:细胞恶性增殖是由于正性调节因子作用过强或负性调节因子不足所致。
对有毒有害化学物进行风险评估,是制定限量标准和保障人体健康的基础。近年来,生物学机制模型在风险评估领域中得到越来越广泛的应用。根据解剖、生物化学、生理、代谢动力学等
血和骨髓涂片染色是医学检验中最常做的项目。为了国际间血细胞形态学的交流,血液学国际标准化委员会(ICSH)推荐了Romanowsky 染色方法,并被各国血液学工作者接受,在推广中遇
通过分类统计和多元线性回归,分析了福州市低层大气污染物及降水量对降水pH值的影响.分析结果表明降水pH值与低层大气中总悬浮颗粒含量、降水量呈负相关,说明福州市大气悬浮
近年来,单片机被广泛应用于各行各业中,很多院校开始了有关单片机的课程。根据单片机的教学现状,单片机教学模式需要进一步改革,通过分析"教学做一体化"教学模式的教学理念和
探讨中老年不同时期的脂质代谢紊乱患者对胰岛素抵抗(IR)影响的相关因素.91例中年期、182例老年期脂质代谢紊乱患者检测空腹血糖、胰岛素、甘油三酯(TG)、胆固醇(TC)、高密度脂蛋白