大数据背景下基于Web日志的用户访问模式挖掘研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:LinChu41
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络用户规模不断扩大,网络用户比例不断增加,网络用户行为也变得越来越复杂。尽管许多学者对Web挖掘技术和用户行为挖掘进行了深入研究,但仍存在一些问题。传统的数据挖掘算法在大数据处理效率方面并不令人满意。与此同时,对于电子商务领域,随着网购越来越流行,网民的不断增加以及新的商品出现,大量的商品和用户没有发生交互数据,系统更倾向于给用户推荐热门商品,导致大多数电子商务平台中都存在重复推荐的情况,无法提供更精准的个性化服务,以及长尾物品的发现和物品的权重调整。同时大量的中小型企业想完成数据驱动服务的升级,包括用户行为挖掘、个性化推荐等。这些问题迫切需要解决。因此,本文选择电子商务领域,基于电子商务后台日志的数据特征,重点分析和研究电子商务用户行为,构建用户行为挖掘的基本模式。本文研究内容主要包括以下几点:首先,在深入了解Web用户行为理论的基础上,基于交互的内容对用户的行为进行分类,同时基于大数据背景,在介绍了传统的一些数据挖掘算法的基础上,做了进一步的优化,以符合现实的商业化需求,对于Web日志来说,在大数据环境以及多样的用户行为的影响下,其采集方法与处理方法变得更加的复杂,本文在此基础上深入研究和理解Web用户的行为特征以及Web日志的数据表示并总结出了互联网用户行为所具有的特征。其次,基于上述研究成果,针对大数据时代的应用场景,在对传统算法改进的基础上进行并行化处理,大幅提高算法的运行效率,同时采用分布式的文件存储结构,提高了系统数据处理的容错性。同时,深入研究了协同过滤推荐算法的优缺点。协同过滤当前有着非常广泛的应用,在不改变协同过滤算法的基础上,引入迁移学习,提出了基于标签共享和用户兴趣的跨域迁移的推荐。实验结果表明,与现有的协同过滤推荐算法相比,基于迁移学习的推荐模型的准确率有一定程度的提高,也有助于解决数据稀疏性引起的冷启动问题。同时对原来系统中已存在的推荐算法,对其算法本身的侵入性非常的小。最后,基于上述研究内容和结果,本文构建的Web用户行为挖掘系统,可进行多维度高效率的挖掘。它通过精准的营销和准确的建议,帮助电子商务商家、内容提供商等了解他们的用户并实现更好的商业价值,完成数据驱动服务的升级。
其他文献
如果说,围绕着2012年俄罗斯总统大选,人们已经隐约看到一个与以往不同的俄罗斯正在渐露真容,那么,在普京的政策构想当中,又准备以何种方式来迎接这样一个新俄罗斯的诞生呢?不妨通过
报纸
针对近10年5本核心期刊中远程教育研究方面的文章,通过对文章中关键词进行数据分析,采用社会网络分析软件——Gephi进行可视化处理,并进一步运用社会网络分析方法对数据进行
当代的主流法律哲学明显地分成三个学派.即研究法律价值的自然法学、研究法律规范的分析法学和研究社会的社会法学.三个法学派别分别从不同角度对法律这一现象进行研究,各有
在日常决策中,人们通常需要对发生在不同时间点的选项进行权衡进而做出选择,这就是跨期决策。关于跨期决策的行为研究已经证实了时间折扣现象和符号效应的存在。时间折扣是指
分析荔枝柔性球形果受载下的力学作用,应用球接触理论,推导荔枝小变形弹性模量测试方程,应用自行设计的农业物料测试平台,动态测试荔枝小变形时的作用力,得出的荔枝的弹性模
介绍了C5烯烃醚化、烷基化的工艺技术和发展,以及TAME、C5烷基化油在汽油调和中的作用。包括从FCC汽油中切割C5馏分、C5馏分的选择性加氢、TAME工艺、C5烷基化和醚化与烷基化联合工艺的灵活性及经济
目的掌握静脉留置针的正确使用方法,采取有效地护理干预措施,提升穿刺的成功率,减少由于反复穿刺给患者造成的痛苦,避免和减少并发症的发生。方法通过对120名使用静脉留置针输液
阐述了信管专业课程现状和课程群概念,分析了社会对ERP人才的需求层次和每个层次需掌握的知识、技能与就业去向;结合信管专业的培养目标,确定ERP人才培养方向,构建出ERP人才需求
<正> 医疗卫生体制改革、社会医疗保险制度改革、药品生产流通体制改革三项改革同步推进,是国务院关于城镇医疗卫生体制改革的重要指导思想。应具体落实,同步实施。但近年来,
会议
目的:研究三种低氧训练模式对大鼠血液运氧能力的影响。方法:70只雄性SD大鼠,经过适应性训练和力竭实验筛选出40只,平均分成4组,保证每组大鼠体重、力竭时间、力竭后血乳酸基