论文部分内容阅读
用户的基础属性信息(例如性别、年龄、收入状况、文化程度、宗教信仰等)在个性化服务中具有重要的意义,比如定向广告投递、智能推荐系统以及其他方面。然而,这些信息对于用户来说都被认为属于隐私信息,许多用户存在个人信息保护方面的考虑,拒绝将这些隐私信息分享给服务提供商。针对上述问题,本文提出了一种新颖的方法——利用智能手机的流量与传感器数据对用户基础属性进行研究。首先,智能手机作为一种随身携带的移动终端,相比于电脑终端与用户一对多的对应关系,智能手机终端与用户基本保持在一一对应的状态,所以基于智能手机终端对用户的基础属性信息预测成为了新的研究方向。其次,随着智能手机在大众中的普及,目前已基本覆盖每一个人,并且APP(Application)的开发者,即服务提供商,能够通过智能手机操作系统提供的API(Application Programming Interface)获取到大量能够反应智能手机使用情况的数据,例如APP的使用情况、流量的使用情况、传感器返回的数据。所以基于上述两个特点,保证了从智能手机获取的数据与用户基础属性之间的强烈关联特性。在实验过程中,我们通过对收集到的智能手机数据进行数据分析与处理,发现不同基础属性的用户,其数据的分布与构成存在不同的特性,所以我们对流量与传感器数据定义了相应的特征,并对收集到的数据提取对应的特征数据,使用特征数据构成特征矩阵R与用户相关联,将特征矩阵R作为分类器的输入,通过分类算法对用户的基础属性进行预测。最后,我们设计了用户基础属性研究的系统模型,Android客户端收集用户数据,服务器端通过用户数据对用户基础属性进行预测,并且在用户基础属性信息预测的基础上,为Android客户端提供个性化的服务。本文收集真实世界用户数据,并对研究方案进行验证,实验结果表明通过本文提出的研究方案,基于流量数据在用户性别基础属性的预测中准确率(Acc)为86.50%,Macro F1值为86.43%;基于加速度数据的准确率(Acc)和Macro F1值均为84.64%。