基于矩阵分解的个性化信息流推荐技术研究

被引量 : 0次 | 上传用户:syris
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web 2.0时代的发展,网络信息流服务已经逐步取代了传统媒体成为人们获取信息的主要途径。这类新兴的互联网信息平台可以根据用户的订阅个性化地传递相关信息流,同时也允许用户之间的各类交互,并以此促进信息的产生与传递。但是,也正是由于其操作简单、交互性强、传播迅速的特点,导致现有信息流系统中普遍存在信息爆炸的现象并造成了用户的阅读负担。因此,对各类信息流系统而言,如何构造一个有效的个性化推荐模型并帮助用户过滤与发现其感兴趣的信息,此时就显得尤为重要。针对上述信息流系统的特点,本文在研究了传统推荐算法原理与应用场景的前提下,提出了一种基于矩阵分解与用户特征词向量提取的推荐模型。其主要思想是,通过文中所提出的两种用户话题特征词向量提取方法,根据用户自身历史数据或是用户关注者历史数据提取其话题特征词向量。并以此作为模型的输入数据,用于取代传统推荐模型中的用户物品评分矩阵。之后,采用类似于MF模型的方法,拆分输入的用户特征词偏好矩阵,并训练得到所有用户与特征词的隐因子向量。最后,再详细描述了利用隐因子向量配合待推荐信息词频向量生成推荐信息的具体方法。并使用随机梯度下降的最优化方法给出了模型的求解过程。此外,针对用户社交特性,本文还引入关系网络中信任传播的思想,并依此提出了一种模型的改进方式。同时,还根据信息流系统的特点,重新给出了准确率、召回率等经典评价指标在模型验证过程中的计算方式。最终,本文在真实数据集上进行了相关实验并对结果给出了分析。首先,详细阐述了实验选取新浪微博作为数据源的理由,并给出了数据集的多项基本信息与统计信息。同时,本文按照实验步骤验证分析了两种阈值对推荐列表长度、模型评价指标的影响。对比了使用两种不同的用户特征向量构造方法时模型的各项指标,并与随机推荐模型进行了对比。实验结果显示,基于用户自身信息的特征词构造方法能使模型具有更好的效果。同时,本文所提出的推荐模型在两种不同的用户特征词向量构造方法下效果均优于随机推荐模型。
其他文献
目的 探讨晚期宫颈癌姑息化疗的最佳治疗方案。方法 晚期宫颈癌患者应用吉西他滨联合培美曲赛方案姑息化疗,观察局部控制率。结论 吉西他滨联合培美曲赛方案姑息化疗提高
世界各国或地区关于赠与合同性质的规定表现出了很大的灵活性和差异性 ,我国理论界对此也产生很大争议 ,本文就结合我国《合同法》的规定对赠与合同是诺成合同还是实践合同进
目的:通过品管圈活动及习惯养成训练模式提高护士查对制度执行力。方法:成立品管圈小组,对护士查对流程执行不到位进行要因分析,制订整改措施,同时结合习惯养成训练模式进行
随着京津冀一体化进程的推进,通州不仅要承载北京城市副中心的功能,同时也要承担京津冀区域合作桥头堡的使命。本研究聚焦通州运河核心区(北京CBD新区),借鉴国内外城市商务商
目的 通过对先天性并指手术治疗常见并发症产生原因的分析 ,找出防治方法。方法 统计 34例先天性并指手术治疗后出现的并发症 ,按产生原因进行分类。结果 非专科医生手术
目的:探讨复方丹参滴注液配伍黄芪治疗羊水过少的临床效果,为临床用药工作的进步与完善提供必要的参考与借鉴。方法:选取我院2009年4月份至2010年4月份收治的70例羊水过少孕
对突发性耳聋患者入院时存在的不同心理状况进行分析,在配合医疗措施的基础上挽救患者的听力,提高患者的生活质量,降低该人群的发病率。
从经济意义上讲,企业从事的具体财务活动是企业总体战略的实施过程,是企业总体战略目标实现的根本保证。企业投资战略是用来规划企业长期财务活动的发展方向及其资源配置的去
本刊于七月十二、二十日先后在北京,天津两地就“百花齐放、百家争鸣”的政策邀请音乐界人士举行座谈会,这里先发表一部分同志的发言,其他同志的发言以后将陆续在本刊登出。
桥梁高墩施工技术水平,直接关系着整个桥粱施工项目的质量,同时还会影响桥梁项目的使用寿命。随着滑模与爬模桥梁高墩施工工艺在实际工作中的应用和推广,使得桥梁高墩施工质