论文部分内容阅读
关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法。统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阈值,再用页面访问时间阈值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成的会话集进行进一步地优化。通过实验结果表明,该方法所得到的会话集更具有真实性。