论文部分内容阅读
随着计算机技术特别是网络技术的快速发展,人们的生活条件和社会环境发生了巨大的改变。无线网络因为其速度快、可靠性高、不必依赖电信运营商而产生流量费用的特点,在国民生活的各个方面迅速扩展开来,使用者的数量不断增多。与此同时,由于各类网站的数量越来越多,内容越来越复杂,导致用户一方面难以快捷方便地找到真正感兴趣并且真正需要的信息,另一方面又会因产生大量的访问流量而增加互联网的使用成本,“数据丰富但知识贫乏没有针对性”的问题非常严重。针对当前存在的问题,根据用户网络行为分析的信息推送服务应运而生,它为用户提供了一种全新的服务模式,有效的从海量的用户上网行为记录数据中,提取分析出潜在的有价值的信息,用于解决“信息过载”的问题。本文通过对WiFi使用情况、现有推送服务、用户需求的研究,将WiFi技术与信息推荐系统结合,建立一个以局域网特征和用户上网行为分析共同主导的信息推送模型。首先,通过对系统关注点的分离,将系统分为WiFi网关和服务器两大部分,网关部分主要为用户提供一个可以享受免费WiFi的公共区域并负责对用户在WiFi范围内上网操作的控制,而服务器部分的功能是对用户网络访问数据进行抓取、对用户访问数据和资源信息进行管理以及推荐算法的实现。然后,进行基于协同过滤推荐算法的推荐引擎建模,因为时间遗忘曲线和用户兴趣随时间变化情况相似,故将时间遗忘曲线应用到隐式评分的计算过程中,从而在传统信息推荐算法的基础上考虑到了用户兴趣爱好随时间变化的情况。在信息量较少的情况下,使用“固定缺省值”和“众数法”解决推荐模型的稀疏矩阵和冷启动问题。在查找最近邻居集的过程中,改进余弦相似性算法,从而提升了推送结果的准确性。最后,使用TcpDump抓包工具对用户网络行为数据进行抓取,对数据包进行协议解析,建立推荐系统的“用户——项目”评分矩阵,构建用户模型,对推荐算法编码实现,得到最终的推荐结果。运用所构建的基于WiFi用户网络访问的信息推送系统进行预测训练,并对实验结果进行分析,表明改进后的协同过滤推荐算法相比传统的推荐算法具有更加良好的预测效果。