手机用户行为动力学及其复杂性

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:fattingmore
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据带给我们研究复杂系统的一个新的机遇。特别地,手机通讯作为现代社会的一种最为广泛使用的通讯方式,其记录的大量数据提供给我们一个十分有价值的途径来认识社会网络中人类通讯行为特征。本文主要是基于千万数量级移动用户的实际通讯记录数据进行分析研究。  第2章中,我们对手机三大业务进行统计性分析。手机业务使用情况存在很显著的周期性。用户使用手机主要是集中在工作日,而双休日和节假日的使用频率相对空闲。由此可见用户使用手机主要目的是为了工作。手机三种业务中,语音和短信的业务量比数据业务大且它们的有效用户数量随时间增长趋势较为明显。这是由于运营商推崇语音和短信两业务的营销机制导致。然而,数据业务与语音和短信业务相比,它的增长趋势更为显著且有效用户数量基本保持不变。这说明平均每个用户使用数据业务量是上升的而平均的语音和短信业务量是在下降的,即数据业务更具潜在的发展能力。进一步从用户角度来看,多数用户使用手机不频繁且用户数量随着业务使用次数增加而快速减少。其中,网内的用户更偏好于主动进行通话,发送短信字数比接受的少。另一方面,我们也基于用户的业务使用状况和用户的活跃习惯,对样本用户进行了分类。如果有相应用户的前端数据做依托,可以基于用户不同的类别对用户做出个性化的服务,这对于发展客户,开拓市场来说是一个极为有效的手段。  第3章中,我们通过过滤手机数据中的信息来找出其潜在的真实社会关系。因为数据中可能存在假信息,这是由于记录错误或是与社会网络不相关的特殊行为所导致的,如市场营销活动。因此,从原始通讯数据构造的网络不能很好的代表实际的社会关系网络。本章节我们采用一种基于多重假设检验修正的统计验证方法,来对手机通话网络中的数据进行过滤,并且构造相应的检验后通话网络,即偏好性通话网络(Bonferroni network)。我们分析了两个大规模的手机通话记录,一个是来自欧洲,另一个来自中国。对于两个数据,我们比较了相应的原始网络和偏好性通话网络,并且找出它们之间在结构和网络特征上显著的不同之处。我们发现偏好性通话网络比原始网络更能代表真实的社会关系网络。通过使用过滤后的网络,我们分析了网络中3元模体的统计性质和随时间演化的特征。结果表明闭合的3元模体的形成时间尺度是十分快的,通常是在一天之内。我们也发现非闭合的3元模体倾向于演变成其他的非闭合3元模体。这些结果在两个数据中都可以观察到。  第4章中,我们使用上海9百多万手机用户的通话记录构造四个通话网络(原始有向通话网络、原始双向通话网络以及对应的两个偏好性通话网络)并对它们的统计性质作比较分析。我们发现这些网络之间存在很多共同结构特征的,同时也存在各自独有的性质。这些实证结果使我们更清楚地认识大规模的社会网络,并且对构建大规模社会网络模型有很大帮助。  第5章中,我们对上海数据的原始有向通话网络及其偏好性通话网络中团的结构特征进行了对比分析。两个通话网络中团的性质在定性上是相似的,但也显示了在定量上不同的特征。我们发现在大团中的用户之间在空间上的距离十分接近。基于手机用户之间的团度数特征,两个通话网络中的最活跃用户可以分成几个不同通话特征的类别。不同类别的用户具有不同的通话特征。这些结果表明了彼此紧密相连的手机用户之间存在反映其特殊社会关系的通话行为特征。  第6章中,我们针对上海通讯运营商的前10万个最活跃通话手机用户,研究他们之间每天相邻两个呼出通话之间的时间间隔。我们发现这些通话时间间隔具有群体上的指数截断幂律分布特征,而在个体上具有不同的特征。通过统计检验发现,只有3.46%用户的通话时间间隔具有幂率分布特征,对应于具有异常、极端的通话特征的用户,通常为机器人通话、电信欺诈、电话推销;而73.34%用户的通话时间间隔具有韦伯分布特征,对应于一般的通话用户。进一步,我们对这10万用户中具有韦伯分布特征主题用户研究其记忆性特征,发现个人通话行为的非记忆性特征是由爆发性时段和非爆发性时间段内事件的指数分布特征得到。考虑到爆发性时段和爆发性时段内部的通话事件分布的指数特征,我们假设个人通话行为是由两个独立的泊松过程来驱动。我们提出一个简单模型,使用马尔可夫链来模拟两个泊松过程。模拟结果与实证结果十分吻合。这些结果也阐明了其他人类行为中爆发性特征的来源。
其他文献
学位
在本论文中,作为Ⅱ1型因子的性质Γ的延拓,我们对般的Ⅱ1型von Neumann代数给出了性质Γ的定义。我们首先从具备可分前对偶和性质Γ的Ⅱ1型von Neumann代数入手。不失一般性,我
近年来,国内外无损检测混凝土质量的一些方法给予了很大注意。根据俄罗斯国标ГОСТ-22690-88无损检测混凝土强度的计算进行无损检测。从20世纪90年代开始,积极研制和生产
该文主要研究多变量贝叶斯动态线性模型的递推算法.文中首先对多变量贝叶斯动态线性模型的定义,递推修正,模型叠加等内容进行简单回顾,同时给出了传统多元回归模型和多元ARMA
Stripe rust, caused by Puccinia striiformis Westend. f. sp. tritici (Pst), is a severe foliar disease of common wheat (Triticum aestivum L.) in the world. Resis
本文通过定义一类广义斐波那契数列{Gn}满足Gn-1=aGn-Gn-1,G0=0,G1=1,其中a≥2且a∈Z.我们给出了([)(∞∑k=n1/Gk)-1」,([)(∞∑k=n1/G2k)-1」和式子([)(∞∑k=n1/G3k)-1」,([)(∞∑k=
该文引进两个概念"夹角"和"(近似)锐角性"来刻划组成向量和范数点,得到了范数点两个方面的定性性质.