基于Web日志的频繁浏览路径挖掘技术研究

被引量 : 0次 | 上传用户:ZNZXCTH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁浏览路径的挖掘是Web使用挖掘中的一个重要研究领域,它对于电子商务网站的商业决策、改善网站建设等都有现实的指导意义。通过对大量文献的研究,本文提出了两种基于Web日志的频繁路径的挖掘算法。一、提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。首先,综合考虑影响用户浏览兴趣的Web日志中的浏览次数、浏览时间和浏览接收字节数等因素,采用算术法求解兴趣度;其次以浏览兴趣度为基本元素,以“三矩阵”为数据结构实现挖掘算法,这种“三矩阵”的数据结构避免了多次频繁浏览数据库,提高了算法的效率。以存储矩阵为基础建立会话矩阵和路径矩阵后,再在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。本文采用的计算页面距离的公式,解决了Humming距离的不足之处,全面考虑了Web日志中多种因素对页面距离产生的影响,得到的相关页面集更精确,相似度更高,进而提高了算法的准确性;最后利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。二、提出了一种基于Web日志的用户连续频繁路径的挖掘算法。采用多元线性回归的方式实现了兴趣度的线性求解;其次将浏览兴趣度作为一个属性,根据不同需求生成三种Web浏览树,此浏览树不仅解决了连续可回溯路径的描述问题,而且可以全面反映用户浏览情况,使结果更全面,更实用;以三种浏览树为前提,生成倒序单子树序列,在经过整合倒序单子树后的RT树上挖掘出频繁浏览路径。本文提出的两种算法不仅在页面浏览兴趣度的求解方法上提出了创新性的改进,而且提升了频繁路径的精准性和合理性。实验证明算法结果更真实,更全面。
其他文献
目的探讨在急诊护理中,实施量化管理模式的效果。方法选择2013年6—12月(量化管理模式实施前)和2014年1—6月(实施后)在该院急诊科工作的医生28名和护理人员53名,及留观的患者71
<正>日本的更生保护制度是指通过对犯罪人或者违法青少年在社会中采取适当的处遇,防止其再犯,避免其违法,帮助其自立、更生改善,从而实现保护社会、增进个人和公共福利之目标
目的探讨五味消毒饮对甲氧西林耐药金黄色葡萄球菌(MRSA)临床株生物膜形成及抗菌活性的影响。方法用溴化乙啶吞噬作为细胞膜通透性指示剂评价五味消毒饮对MRSA细菌细胞膜的作
近年来,信息技术得到迅速发展,其在各个领域的应用日益增多。在教学领域,应用信息技术促进教学模式由辅助教学向引领教学转变,在一定程度上促进了公共英语课堂教学效率,达到
胰十二指肠切除术后早期肠内营养已被证明是安全可靠的,但术后早期肠内营养开始的具体时机尚不明确,采用的途径、肠内营养液的选择也需要探究。本文围绕胰十二指肠切除术后早期
为进一步明确川西北地区中二叠统沉积相带的发育特征、展布规律及控制因素,基于野外地质认识、前人研究成果以及最新的钻井资料,对各类沉积相标志展开了详细分析。结果表明:川
目的:探究高糖环境下小鼠肾小球足细胞及炎症因子TNFR1的改变,期望为糖尿病肾病(DN)的防治提供新的思路。方法:将离体培养的小鼠肾小球足细胞分别设为正常对照组(D-葡萄糖5.5
目的:观察博利康尼与普米克令舒联合雾化吸入治疗婴幼儿支气管肺炎的临床疗效.方法:选取我院住院患儿 105例,均符合临床诊断婴幼儿支气管肺炎标准.年龄最小为 45天,最大为 3
红色旅游是中国近年来兴起的一种专项旅游活动形式,是以中国共产党领导人民在革命战争时期形成的纪念地、标志物为载体,以其所承载的革命历史、事迹和精神为内涵,组织游客开