论文部分内容阅读
在移动互联网时代,大量的网络流量数据为我们研究用户行为提供了便利条件。研究移动互联网中用户行为有助于实时网络服务调配,基础设施规划,内容传输优化,网络资源优化。同时,用户行为研究也是人类行为分析,动力学研究的一部分,其研究成果可用于解决城市规划、人口变化、疾病传播等与人的生活和发展息息相关的问题。用户的App使用行为,在很大程度上体现了用户网络行为。用户的App使用行为是复杂多样的,研究用户的App使用行为,预测出用户在未来的某一时间,某一地理位置将使用哪种App,一方面可以有助于网络服务商提供给用户的服务更具个性化,例如,基于个人地理位置的服务,类似,精准广告投放,行程建议,基于情境的提醒。另一方面,可用于预加载,预启动或弹出想要的App到手机主屏幕上来提升用户手机使用体验并节能。很多先前的研究表明用户移动性对用户App使用行为有显著影响。本文研究主要包含3方面内容:广告流量研究,用户移动性分析,用户App使用行为预测。其中,广告流量的研究可以识别出与用户行为无关的广告流量,用户的移动性研究是用户App使用行为预测的基础。本文的创新点如下:(1)使用Adblock Plus公布的广告黑名单,白名单作为识别广告的规则,将这些规则解析为模式,通过文本匹配的方法识别互联网流量中的广告流量。为提高匹配效率,设计并实现了基于二重索引的快速匹配算法。(2)为了减少噪声干扰,在非广告流量中研究用户移动性和App使用行为预测。为了揭示了移动属性与用户App使用行为的内在影响机制,本文从群体和个体2个维度,计算用户移动性指标(包含移动距离,回转半径,连接基站数目),结合用户时间,地理位置等信息作为特征,基于机器学习的方法预测App使用行为,并取得了较高的预测准确率(群体达91.8%,个体平均达90.3%)。