论文部分内容阅读
电子邮件作为当今人们交流信息的重要工具之一,比较全面的映射了人们之间的交流活动。研究电子邮件网络的拓扑结构,能够为网络病毒的传播,人类活动模型的建立提供理论基础。本文从复杂网络理论的角度详细的对上海交通大学电子邮件网络进行了分析。本文从邮件日志中提取了有效的数据。考虑了垃圾邮件、群发邮件、用户隐私等因素,对数据进行了预处理,构建了原始网络和交互网络两种网络。两者都具有小世界现象,用户增长趋势比较平缓,从网络流量的规律可以推断交大电子邮件主要用于工作交流。原始网络和交互网络的累积度分布都服从延拓指数分布,而不是以往研究指出的幂律或指数分布。原始网络具有轻微的异配特性而交互网络则具有轻微的同配特性,因此交互网络结构更符合现实社会网络的特性。通过分析网络的节点中心性,本文发现如果要通过一定比例的节点快速的将信息传递到整个网络,那么在原始网络中随机选取节点和优先选取大度节点所需要的传播时间大致相等。而交互网络中选取大度节点则更能节省时间。两个网络的度和介数表现出了很强的正相关性。本文分析了交互网络的动态拓扑性质,发现同国外高校的电子邮件网络相比,交大的电子邮件网络用户的平均度偏低,更多用于工作上的交流,网络中的小团体现象更明显。考虑到权重,本文分析了加权交互网络的拓扑结构,发现同以往研究类似,节点的权重和度值的相关系数高达0.84。网络中的大度节点之间不存在富人俱乐部现象,但高权重的节点之间则存在该现象。用加权适应度算法分析了网络的社团,发现社团大小的累积分布服从幂律分布,幂律分布的无标度性说明交大社团没有特征大小。通过删除部分节点和边的方法分析了网络的容错性,网络中的大度节点对网络的连通性起到了至关重要的作用,小权重的边更能破坏网络的连通性。