Web日志中会话识别方法研究与改进

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:toneygao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的不断发展,越来越多的组织、企业、机构通过网络与用户交流或交易。为了留住已有用户,争取潜在客户,必须提高用户体验,使自己的网站更加实用,更加有吸引力。为了实现这个目标,必须知道用户兴趣所在,根据用户的访问特点来优化网站结构,发展个性化服务。通过对用户的访问记录,即Web日志进行分析可以发现潜在的用户访问模式,从而来改善网站结构,发展个性化服务,提升用户体验。Web日志挖掘是Web数据挖掘的一个重要子领域,从Web日志数据里挖掘潜在的、有用的知识或模式。会话识别是Web日志挖掘中的重要步骤。本文针对目前各种会话识别方法,提出了一种优化的会话识别方法,即基于页面兴趣度动态阀值会话识别方法。该方法通过把页面兴趣度和页面的动态平均停留时间相结合生成基于页面兴趣度动态阀值来识别会话。本文主要工作有:1)本文首先系统地介绍了数据挖掘、Web挖掘的概念和分类,然后对Web日志挖掘相关概念、技术和过程进行了详细的阐述,重点研究了Web日志挖掘的数据预处理过程。2)为了生成个性化的动态阀值来识别会话,本文提出了页面兴趣度,即用户对页面感兴趣程度,根据页面的性质和用户相对浏览速度对页面兴趣度进行量化。3)针对目前会话识别方法存在的问题,提出动态阀值会话识别方法,通过把页面兴趣度和页面的动态平均停留时间相结合,产生基于页面兴趣度动态阀值,弥补了传统时间阀值会话识别方法不能根据不同用户、不同网站动态调整阀值的不足。实验结果表明,相对于目前会话识别使用的单一固定阀值进行会话识别,本文提出的方法能更好地利用用户和页面的特点,更为合理有效。
其他文献
<正>槲皮素是自然界广泛存在的多醇羟基黄酮类化合物,其化学名为3,3’,4’,5,7-五羟基黄酮。槲皮素存在于多种植物的花、叶与果实中,具有抗癌,抗氧化,抗炎,抗血栓,抗病毒,心
这是一篇旧文的重写,关于《梦溪笔谈》中"回回"一词的解读,从清乾嘉至今,一直争讼不断。虽然目前回族史界主流意见已采用王日蔚先生"回回即回鹘之音转"的结论,但此说除了"音
落实城市化战略,加快城市化进程,提升城市品位,是振兴国家历史文化名城的必由之路。以下,笔者就加快建水城市建设,推动县域经济社会跨越式发展作一些思考。
信用中介机构在社会信用体系中占有重要地位,其健康、有序的发展对促进宏观信用管理体系的建设(国家层面),以及微观信用管理(企业层面)都具有非常重要的意义.本文从我国信用
12月12日是日本的“汉字之日”。因最能象征2008年风格,“变”字当选为今年年度汉字。图为清水寺住持森清范挥毫写出一个大大的“变”字。
面对突发灾害事件时的物资调配是运输调度系统中的一个重要部分,为了更好地解决受灾点的救援问题,本文将免疫优化算法用于物流配送中心选址问题中,建立了应急物资中心选址-调
重建山地聚落人口变化的时空过程对认识历史时期人口发展有重要意义。本文以西南山地聚落沿河村为例,以田野调查资料为主,辅以历史文献和档案,利用估算户数和户均口数的方法
农业产业化是促进农村经济发展,增加农民收入的重要途径。属于西部民族地区的丽江市古城区,由于历史发展和自然条件的制约,农业产业化发展相对滞后,农业生产难以形成产业化,农产品
日前,五部委的“资管新规”发布,尽管是一个征求意见稿,但仍引发诸多关注。其中,关于打破刚性兑付的规定,各方也有不同解读。记者日前采访了中国政法大学副教授赵廉慧和北京大学法
报纸