基于个性化新闻推荐模型及算法的研究

被引量 : 9次 | 上传用户：zhang506079845

【摘要】

：

在信息过量且愈发碎片化的时代,“个性化”推送可以说是为网络新闻找到了一条增加用户黏性的有效渠道。目前,个性化新闻推荐相关研究受到越来越多的人的关注。由于新闻的个性

【作者】

：

余燕川

【发表日期】

：

2015年01期

【关键词】

：

数据挖掘新闻关键词二次聚类用户模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在信息过量且愈发碎片化的时代,“个性化”推送可以说是为网络新闻找到了一条增加用户黏性的有效渠道。目前,个性化新闻推荐相关研究受到越来越多的人的关注。由于新闻的个性化推荐服务水平仍存在较大差距,如果能够更好的挖掘用户的潜在兴趣并进行相应的新闻推荐,就能够产生更大的社会和经济价值。本文对个性化新闻推荐模型及算法的研究,能够更加准确地预测新闻用户即将浏览的新闻,使用户体验更佳。目前个性化新闻推荐已有很多模型和算法,传统的基于内容推荐的新闻与已阅读的新闻相似性过高,用户体验较差,而使用协同过滤方法时,又不可能按照电子商务推荐的方法,因为新闻是持续性更新的,以新闻分类为单元的协同过滤预设分类往往分类粒度比较大。故本文采用的方法结合了基于内容和协同过滤的方法,对新闻数据进行二次聚类。该方法首先利用数据挖掘技术整理新闻数据,采用基于语义的关键词提取方法提取每篇新闻文章的关键词,并统计其在该篇文档中的词频,再合并两篇新闻文档的关键词,根据关键词之间的语义距离将其分为多个聚类簇。然后计算关键字在聚类簇上的词频向量,利用余弦相似性定理计算两篇新闻文档的相似性对其进行一次密度聚类。最后以密度聚类中每个聚类簇随机抽样的m个数据点作为中心在所有新闻数据中采取快速聚类方式,再把这m个小类簇组合到同一个簇内。本文在二次聚类方法的基础上根据用户阅读历史和待推荐新闻的聚类分布,兼顾新闻的时新性和热度等因素,建立用户模型函数进行推荐。论文完成的工作与研究内容:1、研究了TF-IDF关键词的提取方法发现其忽略了语义之间的共现,采用基于语义的关键字提取方法提取关键字,提出了每篇新闻文档在关键字聚类簇上的词频计算方法来判断文档的相似性。2、研究了基于内容和协同过滤的推荐方法,发现其不足和优点,文中采用的新方法结合了内容和协同过滤的方式,即基于内容和协同过滤的二次聚类方法。在内容方面兼顾用户历史浏览数据,在协同过滤方面针对用户以往阅读历史以待推荐新闻所在的簇建立关联矩阵,最后通过矩阵分解(SVD)方法来预测用户对待推荐新闻的兴趣度。3、根据用户阅读历史和待推荐新闻的聚类分布,兼顾新闻的时新性和热度等因素,建立了带有时间标记的用户模型函数预测兴趣度,将时间信息融入到新闻推荐中。4、在个性化新闻推荐应用中,对文中方法、基于内容的新闻推荐方法、基于协同过滤的推荐方法进行比较分析,得出结论。本文对个性化新闻模型及算法的研究后采用的新方法推荐效果更佳,可以将相关新闻聚集在一起,而且又不导致过高的运算开销,并通过参数估计方法计算各参数的最佳值,且有效地实现了跨类别推荐,达到推荐多样化的目的,还扩展到了语义级别,使其研究有很大的应用价值。

其他文献

健康城镇化的评价指标体系及发展对策研究

我国的城镇化已经进入一个全新快速推进的阶段，进程中诸多的问题也阻碍着城镇化的发展，许多研究和政策方面问题突出，城镇化前进的道路和发展取向不一。城镇化的健康发展是新型城

学位

城镇化健康城镇化路径选择制度安排

带定位囊的前列腺扩开导管的研制与应用

<正>具有我国自主知识产权的经尿道棒状水囊扩开术治疗前列腺增生(benign prostatic hyperplasia,BPH)技术,虽然临床疗效已被肯定,但由于前列腺扩开导管无定位装置,致使初学

期刊

前列腺增生导管

埋地电缆雷电感应过电压观测和分析

通过测量自然闪电条件下埋地电缆的雷电感应过电压,探讨了不同类型电缆屏蔽层对芯线上感应过电压的影响。结果表明:电缆屏蔽层具有明显降低雷电感应过电压的作用;对同一次自

期刊

雷电电磁脉冲耦合埋地电缆感应过电压屏蔽

阿穆尔州腾达区埃文基地名探析

俄罗斯阿穆尔州腾达区的地名大部分由埃文基人命名,这些地名描绘了阿穆尔埃文基人的日常生产和生活,揭示了俄语操持者对源自埃文基语地名的认知规律。

期刊

阿穆尔州腾达区埃文基地名

我国高校对外汉语教学模式的现状与对策

本文笔者通过中国知网、万方等国内主流数据库对涉及我国高校对外汉语教学的现状与对策的研究文献进行了检索并重点性的研读,结合自身多年的教学经验,分析了当下高校对外汉语

期刊

现代交际对外汉语教学教学模式策略

低碳经济为新型陶瓷材料产业点燃绿色商机

<正>材料是人类社会进步的物质基础与先导,现代高技术的发展更是密切依赖于新材料的发展,也是发展科学技术的重要支柱和突破口,进入21世纪以来,新技术革命的浪潮席卷全球,世

期刊

新型陶瓷材料多孔陶瓷材料陶瓷刀具低碳经济

温州市中心城区城市扩展边界研究

随着经济的快速发展及城市化进程的不断加快,温州城市规模不断扩大,土地利用的矛盾与问题日益突出,严重制约了城市的可持续发展。同时,温州市海洋经济的发展对城市布局提出了

学位

城市扩展边界划定城市规模温州市

人民幸福是“中国梦”的终极目标

<正>习近平同志当选中共中央总书记伊始,就带领中共中央政治局常委参观国家博物馆《复兴之路》展览,并发表重要讲话。这表明"中华民族伟大复兴"是新一届中共中央领导集体的执

期刊

“中国梦”中华民族伟大复兴奋斗目标人民幸福终极目标

唱响中国梦凝聚农工情奋力作贡献——2014年农工党开展坚持和发展中国特色社会主义学习实践活动纪实

<正>"筑我中国梦,风好正扬帆"。2014年,是农工党开展坚持和发展中国特色社会主义学习实践活动的开局谋篇之年,农工党把开展坚持和发展中国特色社会主义学习实践活动作为一项

期刊

学习实践活动农工党中国特色社会主义坚持和发展

氧化铝基耐火材料冲蚀磨损的试验研究及其有限元模拟

冲蚀磨损特别是高温冲蚀磨损严重地降低耐火材料的使用寿命，影响工业生产并造成较大的经济损失。本文以三种应用广泛的氧化铝基耐火材料I等高铝砖、III等高铝砖和硅莫砖为靶材

学位

氧化铝基耐火材料冲蚀磨损有限元模拟冲蚀磨损机制

基于个性化新闻推荐模型及算法的研究

与本文相关的学术论文