【摘 要】
:
推荐系统作为一种信息过滤技术,能快速的定位到用户感兴趣的物品,解决信息过载和用户喜好之间的矛盾。随着信息量的增加,传统的实体行业也开始将推荐系统纳入自己的特有领域
论文部分内容阅读
推荐系统作为一种信息过滤技术,能快速的定位到用户感兴趣的物品,解决信息过载和用户喜好之间的矛盾。随着信息量的增加,传统的实体行业也开始将推荐系统纳入自己的特有领域来解决信息过载问题。在南水北调信息分发系统中,由于领域信息多种多样,数据结构各不相同,对信息建立一种统一特征提取方法和特征描述模型是相当困难的。加上用户兴趣因人而异,单纯的用户静态信息无法很好地刻画用户兴趣偏好。用户隐式反馈行为是一种易提取,广泛存在于系统的各个模块当中的用户偏好信息。基于隐式反馈的协同过滤推荐也称为单类协同过滤,因此,在南水北调信息分发系统中,研究单类协同过滤推荐系统具有非常重要的现实意义。然而,基于矩阵分解的单类协同过滤由于缺少负反馈信息而存在模型不平衡的问题,需要手动添加负样本来平衡模型。针对选择哪些未浏览信息作为负样本问题,提出了基于概率抽样的负样本选择方法。概率抽样方法将用户未浏览信息作为抽样总体,把负样本选择问题看作是对总体的抽样。用户与信息的关联度以及信息的热门度分别表示负样本的不同特征,可以通过概率抽样方法这些特征融入到负样本的选择过程中。同时为了将关联度和热门度融入到同一负样本抽样过程中,提出了加权特征融合的概率抽样方法来选择负样本。在手动添加负样本后,模型的数据集可以认为是一种二值型数据,传统的概率矩阵分解模型(Probabilistic Matrix Factorization,PMF)不合适对这种用户行为进行建模。针对此问题,本文提出了一种基于二项分布的概率矩阵分解模型(PMF based on Binomial Distribution,PMFBD)。首先利用二项分布模型代替高斯分布模型来建立用户隐式反馈行为的兴趣模型,然后采用Logistic回归函数将用户行为预测值限制在0到1之间,最后给出了 PMFBD模型的随机梯度下降训练方法。实验表明,融入了关联度和热门度的概率抽样负样本选择方法,与随机样本选择方法和基于K近邻(K-Nearest Neighbors,KNN)的样本选择方法相比有一定的优势。其次,加权特征融合的概率抽样方法能将同一未浏览信息的两种特征融入到同一概率抽样过程中,能进一步提高推荐系统的整体性能。随后实验对比了 PMFBD模型和PMF模型在不同正则化系数下的性能指标,在较优的正则化系数下,PMFBD模型的性能要好于PMF模型。最后采用加权特征融合的概率抽样方法来选择负样本,并采用PMFBD模型构建用户兴趣模型作为本文方法与传统方法进行对比,实验结果表明本文方法要好于传统方法。
其他文献
研究背景乳腺癌是全球女性发病率最高的恶性肿瘤,近年来随着诊疗手段的不断进步与发展,乳腺癌的病死率逐年下降,但是治疗中出现的治疗抵抗、复发及转移仍是我们面临的巨大挑战,尤其是在缺乏治疗靶点的三阴性乳腺癌(Triple negative breast cancer,TNBC)中。EGFR是表皮生长因子,它与其下游的多条信号通路在乳腺癌的发生发展及治疗抵抗中有重要作用。程序性死亡配体1(Programm
随着云计算技术的发展,越来越多的云计算服务提供商开始涌现,为公众提供云计算服务,使得云计算技术在商业化运营的道路上逐渐走向成熟。云计算资源的管理、定价和调度等问题
中国经济发展面临新常态问题,经济结构转型升级成为发展难题,提升经济增长的质量和经济发展效率是政府面临的当务之急。而经济结构转型升级的核心就在于如何通过创新促进技术
近几年,智能手机与平板电脑的迅速普及,使得越来越多的黑客将攻击目标从PC端转移到移动设备端。基于Android系统的智能设备市场占有率不断扩大,其受到恶意攻击的可能性急剧上
近几年,随着人均耕地面积的缩减以及环境污染等问题,设施农业越来越受到农业工作者的青睐,植物工厂作为高度发展的设施农业,发展尤为迅速。光照对于植物的生长发育起到了决定性的作用,植物工厂采用纯人工光源,通过控制光照环境来实现植物的高效生产,提高农产品的产量与质量。为了满足农业光照的需求,本文在对现有补光技术分析的基础上,设计了一种科学且具有较高实用性的植物补光系统。本文对植物补光系统的控制策略进行了设
近年来,随着车辆保有量的持续上升和智能交通的建设,自动驾驶系统已成为车辆行业热门的研究方向。全球很多学校和研究机构都在致力研究自动驾驶功能,减少驾驶过程的驾驶失误,提高驾驶安全性。车道保持功能作为自动驾驶主要功能之一,已经受到很多研究机构关注,因此研究车道保持功能有着十分重要的实际价值。论文的主要研究内容如下:通过一种基于自适应阈值的方法实现了道路信息的识别。该方法通过逆透视标定实验消除摄像头的透
高光谱图像在光谱分辨率、信息量、信息采集能力等方面都优于传统的图像,然而,过多的冗余和过大的数据量会导致图像处理效率大大降低。图像压缩是一种重要的解决方式。通过压
随着信息技术的快速发展,虚拟现实技术在人们生活中的影响越来越大。基于虚拟现实的手术训练仿真系统为手术训练和训练效果评估提供了强有力的工具。保证虚拟手术仿真结果真
随着娱乐业、旅游业等第三产业的快速发展,不法分子不再局限于伪造、倒卖车票、船票、邮票等传统的有价票证来牟利,而是越来越多转向伪造、倒卖假门票、假贵宾券、假充值卡等
单质硫固有的电子/离子绝缘性,循环过程中巨大的体积膨胀,以及由可溶性多硫化锂中间体(Li_2S_n,4≤n≤8)引起的“穿梭效应”等问题阻碍了锂硫电池的商业化发展。聚吡咯材料具有较高的电子/离子导电性、良好的化学稳定性等优点,并且能有效抑制多硫化物在放电/充电过程的扩散,因此,在锂硫电池领域中有较大发展潜力。为改善硫-聚吡咯复合正极的电化学性能,本文使用硬模板法制备三维介孔聚吡咯材料,另使用双模板