基于模糊聚类的网站用户分析

被引量 : 0次 | 上传用户:guchenbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web使用记录的挖掘已经成为当前数据挖掘领域中的一个热点。Web使用记录挖掘是应用数据挖掘技术从Web使用记录数据或Web日志数掘中发现Web使用模式的过程。Web使用记录挖掘分为Web数据预处理(Web Data Preprocessing)、模式发现(Pattern Discovery)和模式分析(Pattern Analysis)三个阶段。 本文对Web使用记录挖掘和聚类的定义、相关技术以及国内外研究现状进行了认真的归纳总结,并提出了基于Web使用记录挖掘的网站用户分析方案。 基于Web使用记录挖掘的网站用户分析的基本思路是:分析Web日志数掘,利用数据挖掘方法发现用户的使用模式,从而为网站决策提供可以借鉴的用户行为分类。为了适应Web用户划分不确切性的实际情况,我们采用了模糊K均值聚类算法;为了克服K均值方法对初始聚类中心点的依赖性,我们通过层次聚类先求出k个聚类中心点,在相当程度上减少了这种依赖性。我们还探讨了增量聚类技术,在数据不断增长的情况下,增量式聚类技术能够利用前期聚类的计算结果,充分提高聚类分析的效率。实验表明,新算法有效地提高了模糊K均值聚类算法的收敛速度。
其他文献
肺炎支原体肺炎(Mycoplasma Pneumoniae Pneumonia,MPP)是由肺炎支原体(Mycoplasma Pneumoniae,MP)感染引起的,主要经呼吸道飞沫传播,目前MP已成为小儿呼吸道感染的重要病原
近年来,国际原油价格频繁变动,国内成品油价格也调整不断,由此而引起国内出租车运营成本不断变化。城市出租车业承担着城市部分公共交通的职能,需要一个相对稳定的运营价格。在此
我国第三方物流经过十多年的发展已经初具规模,发展前景广阔。但是总体来看,我国第三方物流企业仍存在营销理念滞后、服务水平较低、市场需求不足等问题。因此,针对我国第三
化学活动教学具有独特的培养学生科学探究能力的功能,其效果是化学课堂教学所不能替代的。学生科学探究能力的提高又可以反作用于化学活动教学本身,可以保证“在活动中探究”这
本文针对目前高中生英语学习现状,应用自主学习理论完善高中生英语自主学习的教学理念和学习方法,分析了网络及多媒体环境下英语自主性学习教师与学生的角色与定位,提出了网
在现代社会里,药用玻璃瓶的生产从生产规模、生产速度到产品质量都有了很大的提高。这种生产要求的提高已经给传统的人工检测方法带来挑战,人工检测方法已经无法胜任。另一方面
财务机器人时代已到来,人工智能的发展对传统会计人员造成了一定冲击。针对面对财务机器人的挑战,传统会计人员该如何应对这一问题,首先对财务机器人的原理进行阐述,其次分析
从1666年牛顿通过三棱镜将太阳光分解为七色光开始,光谱仪器的发展已经走过了数百年的时间,在这期间,光谱仪器的技术一步步走向成熟。如今,光谱仪器已经成为了以光为中心,集
近年来,药品价格的攀升和医疗费用的过快增长给患者及医疗保险制度带来了沉重的负担,成为广大群众关心的一个热点问题,同时也是我国各级政府一直努力解决的重大问题。 药品是
本文以大庆油田测试分公司管理人员为研究对象,对管理人员的业绩考核体系进行设计与实施。测试分公司是大庆油田有限责任公司下属单位,由于成立较晚,在诸多方面和国内外几大