基于统计学的个性化推荐算法探究

被引量 : 0次 | 上传用户：haru

【摘要】

：

随着互联网的高速发展,信息呈爆炸式地增长,大数据在飞速的发展中,数据挖掘是一个充满活力的研究领域,商业利益的强大驱动力将会不断地促进它的发展,个性化推荐就属于大数据

【作者】

：

黄秋婷

【发表日期】

：

2014年期

【关键词】

：

统计学大数据协同过滤奇异值分析聚类个性化推荐

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的高速发展,信息呈爆炸式地增长,大数据在飞速的发展中,数据挖掘是一个充满活力的研究领域,商业利益的强大驱动力将会不断地促进它的发展,个性化推荐就属于大数据时代数据挖掘应用在互联网方面的重要技术。面对海量数据,推荐系统的产生能实现信息消费者和生产者的双赢。协同过滤算法是个性化推荐中最成功和应用最广泛的算法之一,但它依赖于用户的历史评分数据,所以存在冷启动,数据的稀疏性等问题。大数据新形势下,包括个性化推荐在内的各种数据挖掘算法给统计学带来了机遇和挑战,一方面,数据挖掘的各种算法很多思想都来自于统计学；另一方面,数据挖掘面对统计学表现出了强大的生机。据此,本文探究在数据量比较大的情况下,将统计分析应用到个性化推荐算法中的效果,同时也应用数据挖掘的其他模型,如关联法则,聚类等方法改进模型。本文提出了基于统计学的个性化推荐,主要是利用MATLAB, SAS进行辅助编程,分别实现了描述性统计、多维关联法则、协同过滤的算法进行推荐。对协同过滤模型存在的缺点的改进,针对模型的数据稀缺性和冷启动问题,结合用户的评分和特征信息,提出用一维和二维的统计量改进数据的稀疏度问题,然后利用SQL SERVER2005和EXCEL数据挖掘外接模块对用户建立聚类模型,基于各类的统计分析改进模型,聚类模型不仅能解决数据的稀缺性,而且能克服冷启动问题；最后通过奇异值分解方法改进算法,并由平均绝对误差来衡量各种改进效果。通过对比本文得出结论：根据用户的评分和特征进行统计分析,用分析结果改进协同过滤算法有比较好的效果,结合统计学,数据挖掘的模型对于冷启动问题有较大的改善。本文的实验可以说明统计学的思想在各种复杂的模型中都能得到体现,在未来大数据发展的路上,统计学既要保持其最基础的生命力,同时要加强在其他学科的应用,推进统计方法制度改革,扩展统计学研究具体科学的深度和广度。

其他文献

个体工商户简易帐的核算

<正> 五、简易帐报表 (一)会计报表的作用及种类简易帐的会计报表是个体工商户在一定期间的主要财务状况和经营成果的反映。由于简易帐只反映经济业务活动的部分内容,所以只

期刊

个体工商户利润表所得税率应交增值税累计数

论张艺谋封建家庭题材电影中女性形象的视觉塑造

当今社会，电影在文化传播的过程中扮演着重要的角色，张艺谋打开了中国原有电影格局中的一扇窗户，向西方世界展示了一个和以往印象不同的中国景象，吸引了西方对中国文化的注意力。

学位

张艺谋电影视觉塑造女性形象《菊豆》《大红灯笼高高挂》

欠发达地区农村基础教育发展研究

近几年来，我国政府和社会对农村基础教育逐渐重视，并且加大了资金投入，实行了许多优惠政策，我国农村基础教育特别是欠发达地区农村基础教育取得了很大的发展，但就目前我国欠发达地

学位

农村教育现状问题对策

环渤海经济区科技人才竞争力的评价研究

当今世界，现代科学技术已成为先进生产力的主要标志，并最终决定经济和社会的发展。现代经济竞争的本质就是科技人才的竞争。作为我国经济增长第三引擎的环渤海经济区正面临着经

学位

科技人才竞争力评价指标体系实证分析

文化的全球化和本土化与商标翻译

商标翻译质量的好坏会直接影响到跨国营销活动的成败 ,而文化的差异增加了商标翻译的难度。本文介绍了中西方文化差异在商标中的反映 ,分析了文化的全球化及文化的本土化特点

期刊

文化差异全球化本土化商标翻译异化归化

心脏型脂肪酸结合蛋白和心肌肌钙蛋白Ⅰ在急诊胸痛患者对心肌梗死的诊断价值

目的：比较心脏型脂肪酸结合蛋白和心肌肌钙蛋白Ⅰ对心肌梗死的诊断价值。方法：回顾性分析2015年7月—2016年7月在南通大学附属医院急诊抢救室因胸痛或胸闷不适并检测该指标的留

期刊

心肌梗死急诊胸痛心肌肌钙蛋白Ⅰ心脏型脂肪酸结合蛋白敏感性特异性

复合天然保鲜剂对冷鲜鸡肉的保鲜效果

采用茶多酚、溶菌酶、ε-聚赖氨酸3种天然防腐剂处理冷鲜鸡肉,应用3因素3水平的Box-Behnken响应面分析法,以挥发性盐基氮值(TVB-N)为评价指标,考察3种复合天然防腐剂对冷鲜鸡

期刊

冷鲜鸡肉天然防腐剂保鲜挥发性盐基氮(TVB-N)

基于大数据和客户事件的全触点实时营销管理

使用传统媒体或短信批量下发开展的撒网式营销,客户感知差,企业效益低。实施基于大数据和客户事件的全触点实时营销管理,从企业大数据中挖掘客户价值提升信息,在与客户接触的

期刊

精细化营销大数据存量经营触点营销事件营销

高中生英语阅读动机研究

对323名高中生的问卷调查发现,高中生英语阅读动机由表现型目标、阅读效价、阅读兴趣、阅读回避、阅读材料难度、自我效能、阅读参与、阅读成绩、阅读材料趣味性9个因子组成

期刊

高中生英语阅读动机因子分析

语块理论及其在英语教学中的运用

语块,即语言中成串的语言结构,在语言中大量存在。语块理论以语块为研究对象,具有六大基本观点。语块教学贯穿于语言教学的始终,对于语言的学习具有极其重要的作用。英语教师

期刊

英语教学语块理论教学优势教学实践

基于统计学的个性化推荐算法探究

与本文相关的学术论文