基于Markov模型的Web个性化技术研究

被引量 : 0次 | 上传用户:feicuisenlinviolet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,Web站点上的页面数量和内容与日俱增,然而越来越多的Web用户迷失在Web信息的海洋中。人们迫切需要从Web用户浏览的记录中发现某些有用的信息。通过对Web用户的访问信息进行有效的数据挖掘,可以获得有关Web用户访问行为的知识。这些知识可以服务于Web站点的服务提供者和访问者,进而改进Web站点结构设计、方便用户使用、提高Web服务器的性能和增加个性化服务等,这正是Web个性化技术研究的内容和目的所在。目前,Web个性化研究已经成为国际上一个新兴的重要研究领域,其研究工作具有非常重要的现实意义。而建立有效的Web用户浏览行为模型,是Web个性化研究的关键技术。Markov模型是一种经典的Web浏览预测模型。本文首先对基于Markov模型的Web个性化技术进行了系统、全面地归纳与分析,并对当前国内外的相关研究进行了分析与总结。然后在此基础上,对Web个性化技术进行了研究,主要研究成果如下:(1)基于Markov模型的混合浏览预测模型的构思状态克隆提高HPG模型浏览预测的准确率,但只考虑Web日志中用户浏览次数的统计信息。NG模型中,用Pagerank算法计算页面间的相对重要性,但其预测准确率较低。本文提出一种思路:把这两种模型的思想结合起来,构建混合模型,即先用PageRank算法来计算网页间的相对重要性,再利用状态克隆思想来提高模型的准确率。(2)提出一种近似计算多阶Markov链浏览预测模型—流Markov模型本文提出一种新的近似计算多阶Markov链的浏览预测模型FMM,即利用一阶的Markov链模型近似计算出多阶的Markov链模型,并针对Web个性化推荐模型提出了两个新的推荐原则。从实验结果表明,FMM大大降低了预测系统的存储复杂性,并且在预测命中率与覆盖率优于传统的模型。(3)对流Markov模型的改进流Markov模型仅仅利用Web日志的统计信息,对站点的网页的结构没有进一步分析,难免过于简单化。因此本文对其进行了改进,在其基础上提出了一种改进模型,新的模型考虑了站点中网页可能存在的重要性以及Web用户浏览行为的独特性问题,能够获得更为客观的预测解释,在不增加空间复杂性的条件下,预测命中率有所提高。最后,对所做工作进行归纳与总结,并探讨了将来进一步的研究方向。
其他文献
群众观点是马克思主义的根本观点,群众路线是马克思主义政党必须坚持的执政路线。是否坚持这一唯物主义历史观,认真贯彻“从群众中来,到群众中去”的群众路线,这关系到我党作为执
自从2001年国务院成立行政审批制度改革领导小组以来,从中央到地方进行了多次全面而深入的改革,并取得了一定的成果。但是由于改革未能触及我国部门横向分割的许可权配置,使得审
根据EHA4120双面复合板椭圆封头的冲压实际经验,分析探讨了此种封头在压制过程中外表面复合层产生裂纹的原因,通过改进压制工艺,成功地完成了封头的压制任务。
论文以徐州石灰岩山地上的侧柏、侧柏×黄栌、侧柏×女贞、侧柏×梧桐、侧柏×栾树、侧柏×枫香等6种不同植被恢复模式作为研究对象,采用线性分析、层次分析等方法,分析探讨不
我国西南民族地区听觉文化既蕴涵着浓郁的民族性因素,又具有强烈的地域性特征.自成风格与体系,是现代诠释学美学研究的一个理想对象。现代哲学应该运用诠释学美学的手段,在音乐文
在我国北方,每年都会有大量的苹果树遭受腐烂病的侵蚀,导致产量大大降低,果农经济损失巨大。苹果腐烂病现已成为果农经济损失和苹果产量降低的最大因素。因此,对腐烂病的防治
近年来,快速复电成为供电企业所关注的一项重要课题。快速复电的实现直接关系着提高供电可靠性和客户满意度水平。快速复电的实现关键是如何实现快速故障定位、快速隔离故障
<正>调查的数据样本来自2013年国家农业部设在黑龙江省的农村固定观察点办公室调查数据。固定观察点统计是长期不间断统计,调查对象分布面广,代表性强。根据各地区农村经济发
随着国际化和全球一体化的发展,英语在中国越来越受到重视,越来越多的人加入英语学习的行列。然而,经过多年的英语学习,很多中国学生的英语仍然不地道纯正,带有相当浓重的中
“十五”以来,我国路桥施工行业外部环境急剧变化,企业竞争愈演愈烈;“十一五”以来,国家加大了基础建设投资力度,特别是2008年底,受金融危机影响,国家加大了对交通基础建设的投入力