论文部分内容阅读
对于像新浪、搜狐,腾迅,电信互联星空以及114门户类网站,聚集了很大的人气,可以说其生存的来源是大量的用户对网站进行访问,这样,网站不仅产生了很大的用户群体,带来了很大的影响力,把目标用户发展为客户,而且带来很大的流量,对于这些丰富的流量,可以进行各种经营。可以说把网站当成流量来经营,是互联网在中国发展到后来形成的一种惯性思维,由这种思维推导出的经营思路便是影响力,有影响力提升盈利能力。那么如何提升目标网站的流量呢,除了做好本身网站内容满足用户需求这个内功之外,还需从网站访问数据信息分析和经营,以及网站的结构优化,web个性化服务在线推荐外功做起。
首先介绍了目前互联网流量的发展模式和状况,比较了各种不同类型的网站的互联网流量模式,并提出了互联网流量产品的需求和用户群,在此基础上提出了提升流量的必要性,提出了流量经营各种方法和思想,在此基础上提出了本文重点研究的内容:个性化推荐服务。接着介绍了web数据挖掘和可拓学理论,从可拓学基本概念,可拓学数据基础方面阐述了可拓学基本理论,并浓重介绍了本文借鉴的可拓分类思想的优度评价方法。然后重点阐述可拓兴趣分类算法和在线推荐算法模型,给出可拓分类个性化服务思想流程,阐述了从用户访问事务信息采集,用户识别,构建用户可拓分类算法方面介绍了可拓用户兴趣分类模型,并介绍在可拓用户兴趣分类模型基础上建立用户兴趣度模型,存储在线推荐页面集合和两种在线推荐算法思想和步骤。最后本文从实验环境,系统业务功能,架构软件体系,实验数据采集和分析以及可拓分类算法与在线推荐算法实现这几个方面详细的阐述了可拓个性化服务和在线推荐的实验思想和过程。
本文的创新之处在于从满足系统分类多级层次性角度出发,提出了可拓分类算法的思想进行用户分类,从存储和推荐页面的的高效的角度出发,分别以树型结构存储在线推荐页面和XML文档格式存储用户兴趣度模型,从而快速而清晰的进行用户分类匹配。