基于统计学的个性化推荐算法探究

被引量 : 0次 | 上传用户:haru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,信息呈爆炸式地增长,大数据在飞速的发展中,数据挖掘是一个充满活力的研究领域,商业利益的强大驱动力将会不断地促进它的发展,个性化推荐就属于大数据时代数据挖掘应用在互联网方面的重要技术。面对海量数据,推荐系统的产生能实现信息消费者和生产者的双赢。协同过滤算法是个性化推荐中最成功和应用最广泛的算法之一,但它依赖于用户的历史评分数据,所以存在冷启动,数据的稀疏性等问题。大数据新形势下,包括个性化推荐在内的各种数据挖掘算法给统计学带来了机遇和挑战,一方面,数据挖掘的各种算法很多思想都来自于统计学;另一方面,数据挖掘面对统计学表现出了强大的生机。据此,本文探究在数据量比较大的情况下,将统计分析应用到个性化推荐算法中的效果,同时也应用数据挖掘的其他模型,如关联法则,聚类等方法改进模型。本文提出了基于统计学的个性化推荐,主要是利用MATLAB, SAS进行辅助编程,分别实现了描述性统计、多维关联法则、协同过滤的算法进行推荐。对协同过滤模型存在的缺点的改进,针对模型的数据稀缺性和冷启动问题,结合用户的评分和特征信息,提出用一维和二维的统计量改进数据的稀疏度问题,然后利用SQL SERVER2005和EXCEL数据挖掘外接模块对用户建立聚类模型,基于各类的统计分析改进模型,聚类模型不仅能解决数据的稀缺性,而且能克服冷启动问题;最后通过奇异值分解方法改进算法,并由平均绝对误差来衡量各种改进效果。通过对比本文得出结论:根据用户的评分和特征进行统计分析,用分析结果改进协同过滤算法有比较好的效果,结合统计学,数据挖掘的模型对于冷启动问题有较大的改善。本文的实验可以说明统计学的思想在各种复杂的模型中都能得到体现,在未来大数据发展的路上,统计学既要保持其最基础的生命力,同时要加强在其他学科的应用,推进统计方法制度改革,扩展统计学研究具体科学的深度和广度。
其他文献
<正> 五、简易帐报表 (一)会计报表的作用及种类 简易帐的会计报表是个体工商户在一定期间的主要财务状况和经营成果的反映。由于简易帐只反映经济业务活动的部分内容,所以只
当今社会,电影在文化传播的过程中扮演着重要的角色,张艺谋打开了中国原有电影格局中的一扇窗户,向西方世界展示了一个和以往印象不同的中国景象,吸引了西方对中国文化的注意力。
近几年来,我国政府和社会对农村基础教育逐渐重视,并且加大了资金投入,实行了许多优惠政策,我国农村基础教育特别是欠发达地区农村基础教育取得了很大的发展,但就目前我国欠发达地
当今世界,现代科学技术已成为先进生产力的主要标志,并最终决定经济和社会的发展。现代经济竞争的本质就是科技人才的竞争。作为我国经济增长第三引擎的环渤海经济区正面临着经
商标翻译质量的好坏会直接影响到跨国营销活动的成败 ,而文化的差异增加了商标翻译的难度。本文介绍了中西方文化差异在商标中的反映 ,分析了文化的全球化及文化的本土化特点
目的:比较心脏型脂肪酸结合蛋白和心肌肌钙蛋白Ⅰ对心肌梗死的诊断价值。方法:回顾性分析2015年7月—2016年7月在南通大学附属医院急诊抢救室因胸痛或胸闷不适并检测该指标的留
采用茶多酚、溶菌酶、ε-聚赖氨酸3种天然防腐剂处理冷鲜鸡肉,应用3因素3水平的Box-Behnken响应面分析法,以挥发性盐基氮值(TVB-N)为评价指标,考察3种复合天然防腐剂对冷鲜鸡
使用传统媒体或短信批量下发开展的撒网式营销,客户感知差,企业效益低。实施基于大数据和客户事件的全触点实时营销管理,从企业大数据中挖掘客户价值提升信息,在与客户接触的
对323名高中生的问卷调查发现,高中生英语阅读动机由表现型目标、阅读效价、阅读兴趣、阅读回避、阅读材料难度、自我效能、阅读参与、阅读成绩、阅读材料趣味性9个因子组成
语块,即语言中成串的语言结构,在语言中大量存在。语块理论以语块为研究对象,具有六大基本观点。语块教学贯穿于语言教学的始终,对于语言的学习具有极其重要的作用。英语教师