基于信息熵与Mahout的推荐算法的研究

来源 :计算机与数字工程 | 被引量 : 1次 | 上传用户:skyliou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统Mahout提供的推荐算法中的噪音数据问题,提出了用户信息熵模型。用户信息熵模型采用了信息论中信息熵的概念,利用信息熵的大小衡量用户信息的含量,利用用户评分数据得到用户的信息熵,过滤信息熵低的用户以及它们的相关数据,从而达到过滤噪音数据的目的。利用Mahout提供的推荐算法,即基于用户的协同过滤,基于物品的协同过滤以及Slope-One推荐算法对该模型进行验证。实验结果表明,该模型可有效过滤噪音数据,并在平均绝对误差上有了一定的降低。
其他文献
运用物理方法就弱激光对血液中蛋白质活性的调节,主要是对酶活性的激发与抑制进行了分析.认为在激光照射下,血液中蛋白质分子发生了喇曼散射吸收,分子的振动和转动能级发生了
对束宽的不同定义作了比较研究.结果表明,不同定义束宽的数值是不同的.在自由空间中传输时,二阶矩束宽遵守ABCD定律,熵束宽的传输曲线近似于双曲线,但环围功率束宽一般不满足
本文采用差异吸收光谱法对化学增强型细菌视紫红质的状态变化进行了实验研究.发现在585 nm处明显存在一个稳定的中间过程.从分子动力学和实验出发,提出了一个适用于差异吸收
思想解放是建设中国特色社会主义的法宝,贯穿于改革开放的全过程。在新的历史起点上推进改革开放,需要新的思想解放。本文从主题、要务、关键、目标等几个方面,阐述了新的思想解
ARPU值即月均用户账单额,它代表着每个电信用户的利润贡献率,也反映着电信企业经营效益成果的动态.造成电信ARPU值下滑的主要原因是:①由于电信资费调整,使得一些电信业务的
针对受随机故障等随机事件影响的直线型生产线系统,提出一种多种群粒子群分析技术,解决生产线在缓冲区总量固定、生产率最大的目标条件下的缓冲区容量优化分配技术问题。该技