基于关键词与混合特征的新闻协同推荐研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:songzilang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的发展与竞争愈来愈激烈,不少主流网站纷纷将个性化推荐作为争夺用户和吸引眼球的前沿阵地。相比于百花齐放蓬勃发展的电子商务,新闻作为传统的互联网信息服务,其个性化服务上的发展却不尽如人意,新闻的个性化推荐水平与其他行业相比仍存在较大差距。如果能够更好挖掘出用户的潜在阅读兴趣,提供相应的个性化新闻推荐服务,就能够吸引更多的用户,产生更大的经济价值。  本文着眼于个性化的新闻推荐服务,首先介绍了个性化新闻推荐的相关背景与研究现状,对新闻推荐领域现有的各种技术和模型做了具体深入的探讨与综述,并对各种方法的优缺点进行了总结和对比。  同时,由于新闻资讯一般都会比较集中报道一些社会性的事件,往往几个关键词就能让人们了解新闻的主要内容是什么。为新闻提炼出关键词不仅能满足人们快速检索新闻的需求,也能让人们更加有效率地阅读新闻,解决碎片化阅读的难题。传统的中文文本关键词提取算法,大多基于统计学方法,没有考虑词与词之间的语义关系,也比较容易受切词结果的影响。针对传统的文本关键词提取技术的不足,本文提出了一种结合词向量与复杂网络的关键词抽取算法,能够更好的建模词语之间的语义关系和局部共现关系,实验结果证明我们的方法提取出来的关键词能够更好地表达文章主题。  最后,我们将该算法运用到新闻推荐领域中,在传统协同过滤方法的基础上提出了一种基于关键词和混合特征的新闻协同推荐模型,不仅考虑了用户的行为特征和新闻的内容特征,也综合了协同过滤与content-base模型,在新闻推荐的公开数据集上取得了比传统协同过滤方法和content-base方法更好的效果,证明了我们模型的可行有效。
其他文献
当今互联网正面临一个严重的问题:开放性和安全性。隐私或者敏感数据,例如信用卡信息、登录账号和密码等,很容易在没有经过授权的情况下被网络黑客盗窃。本文提出一种新型的
本文在广泛调研现有自动抄表系统(AMRS)的基础上,结合某小区的抄表自动化需求实现了抄表无人化、信息传输无线化、计费自动化的自动抄表系统。 主要做了以下工作: 1)依据
近十几年来,随着影视动画、虚拟现实、数字娱乐和计算机游戏等领域的不断发展壮大,计算机动画技术在这些产业的推动下也有着巨大进步,而且随着时代的发展,这一技术将会越来越
在虚拟机环境下如何有效的管理各类硬件资源,满足用户按需构建和动态配置的要求,当前还是一个新的研究热点。目前主要的资源配置方式主要有两种:虚拟机资源池和资源静态配置
近年来,流媒体逐渐成为互联网应用的主流。传统的流媒体服务主要采用“客户端-服务器”模式,服务器以单播的方式和每个客户建立连接,而由于流媒体服务处理的是多媒体数据,具
领域工程是实现系统软件复用的关键技术,它为特定领域建立可复用的软件资产,并提供了复用这些软件资产的机制和方法。构件技术是对可复用资产进行分析和实现的技术,能够进一
随着互联网络飞速发展,数据量呈现海量增长,单机存储无法满足需求,分布式存储应运而生并且取得了较大的发展。系统中的数据由于自然灾害、异常故障等原因会遭到破坏,因而需要
在操作系统的设计中,有两种内存分配策略,分别是动态内存分配与静态内存分配。与静态内存分配策略相比,动态内存分配策略允许在运行时动态地申请和释放一定大小的内存,这极大地提
随着当今互联网的不断发展,人们可以轻易获取到海量的多媒体数据。由于具有低存储消耗和快速查询的特征,哈希学习方法已被广泛地应用在多媒体数据的相似搜索中。尤其是多模态
随着汽车行业的迅速发展和汽车用户的逐年增加,交通安全问题已经越来越受到人们的重视。近年来,一种用于监控汽车行进方向范围内行人安全性的车载行人检测系统成为了交通安全领