基于时间因素的个性化新闻混合推荐研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:gz200009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展带动了网络信息量的急剧增长,人类社会早已由信息匮乏阶段转变为信息过载阶段,人们现如今已经可以通过各种渠道获取大量的数据信息,这也间接导致了互联网用户每天接触到的信息质量参差不齐。如果筛选有效信息的工作完全交由用户自己来做,将会浪费用户太多的时间和精力,严重影响用户的阅读体验。同时用户也不再满足于只查看满足大众阅读风格的信息,而是更希望能够浏览到符合自己阅读兴趣的定制信息。个性化推荐系统可以帮助用户从海量数据中筛选出符合用户阅读兴趣的信息内容,帮助用户节省了大量的阅读成本。选取符合实际业务场景的推荐算法为用户提供更为合理的定制服务,可以挖掘出用户自己尚未发现的潜在阅读兴趣,拓展用户阅读信息的多样性。但是传统的个性化推荐并不能高效合理地为用户提供推荐服务,还需要在算法实现的各个过程中,通过分析用户的历史行为数据,挖掘出更多的用户特征行为,研究用户行为的规律性,发现用户潜在的阅读兴趣,设计更契合实际应用场景的推荐算法,从而更为合理地预测用户未来阅读兴趣,生成更符合用户阅读兴趣的内容。通过大数据分析用户的日常阅读行为可以发现,用户每天的作息有一定规律性,且每天的新闻阅读时长变化幅度不大,多数阅读行为集中在几个时间段内,可以研究用户的新闻阅读兴趣变化与日常阅读时间分布的潜在关联性,生成更为符合阅读场景的用户兴趣模型,因此本文提出基于时间因素的混合推荐算法,该算法的主要内容有:1)收集用户历史阅读数据,研究其在不同时段的阅读兴趣变化,分析得出用户在不同时段的阅读需求,提供更加符合用户阅读规律的推荐内容。2)提出了一个新的混合推荐算法,将用户的阅读行为分为主动阅读和被动阅读,结合用户的长期、短期阅读兴趣,依据应用场景的不同采用更合理的推荐算法生成最终的推荐列表。3)为了保证带时间因素的用户兴趣模型的聚类效果,降低噪点行为数据对聚类结果的影响,本文选用DBSCAN聚类算法。同时,为了降低DBSCAN算法中参数Eps和minPts对最终结果的影响,参考了一种改进算法I-DBSCAN。4)为了更好的生成文本的向量空间模型,采用TF-IDF算法权衡各关键词在待推荐新闻内容的重要性,筛选掉与文中主题关联性不大的常用词汇,然后使用LDA算法,求出文本的概率主题,降低计算维度,提高算法的实用性。
其他文献
<正> 只要你细心观察,就不难发现,你周围总有这么两种人:论能力,不分高下;论工作方法,也几乎相同。但是,他们在同样的时间内从事同样内容的工作或学习,其结果却是大相径庭。
期刊
随着少子老龄化问题的加剧,日本面临着人力资源长期不足,供应缺口较大的严峻挑战。日本要想解决人才缺口,就应该充分地利用外国人才,除了政府和企业的努力外,整个社会意识观念的转
"兄弟失和"可谓是鲁迅人生经历中最为伤痛的一次情感事件。然而为什么"兄弟失和"给鲁迅造成了严重的身心伤害,以及鲁迅又是如何治疗这一伤痛的?这成了众多读者心中的一个谜。
<正>1.引言LED是一种能够将电能转换为可见光的半导体,LED的特点是寿命长、光效高、无辐射与低功耗。普通白炽灯的光效12Lm/W,寿命小于2000小时,节能灯的光效为60 Lm/W,寿命8
会议
领导干部廉洁从业是由我党的性质和宗旨以及社会、人民未来的发展所决定的。党的十八大以来,中国特色社会主义建设进程突破旧貌,进入一个全新的阶段。当前局势对领导干部而言
<正> 宗教,不仅是一种奇幻的观念、信仰(包括仪式)的体系,它又是由为之献身和苦心孤诣的人群、完善严整的组织机构、富于神性的庄严肃穆的庙宇以及千姿百态、栩栩如生的神像
一般来说,与客户接触的机会或频率以及对客户信息控制的可能性高的员工,在为客户创造让渡价值过程中所起作用大的员工,因故跳离企业时,可能会导致企业的客户资源流失。因此,
采用JSM-5600LV型扫描电镜和FEI-Sirion200场发射扫描电子显微镜分析高铁锰矿矿石性质结构,并对高铁锰矿直接还原进行研究。实验结果表明:赤铁矿和少量褐铁矿呈粒状(1~2μm)
广播电台总是以其实效性、参与性以及亲和性等特点,深受广大电视听众们的热烈欢迎。作为广播电台直播的重要内容,广播直播节目的不可或缺的,因此在广播电台现场直播过程中做
<正> 一、病历摘要患者 楊树琴 (住院号580320)女性29岁江苏省徐州人家庭主妇住院日期 1958年10月30日病史:患者于1953年初发现头晕,全身无力,胃纳欠佳,月经闭止,时有恶心,呕