论文部分内容阅读
大学生社交关系一般源于校园交往行为,它的形成过程是大学生在校园活动场所的交往行为从量变到质变的过程。良好的交往行为是建立良好社交关系的基础,良好的社交关系又引导交往行为并促进良好学习生活氛围的形成。然而,如何得到大学生的社交关系并进行定量评价一直是教育界研究的课题之一。目前,大规模地实时获取大学生社交关系是研究的热点问题之一。在国家《大数据产业发展规划(2016-2020年)》推动下,智慧校园建设得到普遍的重视。智慧校园系统所产生的海量校园行为数据是对大学生学习、生活状态的一种全面反映,对这些数据的分析是帮助我们洞察学生行为规律的有效途径之一,也使大规模实时获取大学生社交关系变得切实可行。校园一卡通是智慧校园的重要组成部分,利用校园一卡通系统产生的海量学生消费行为数据,挖掘出隐藏的学生校园社交关系网络,对研究大学生社交规律具有重要意义。校园一卡通数据具有独特的性质:(1)在空间维度,学生活动范围较小且集中;在时间维度,存在时间分布极不均衡现象。(2)受班级、宿舍等固有组织管理因素影响,学生交往行为中同质性现象明显。本文提出了一种基于多重假设检验的大学生社交关系挖掘方法,进一步提出了亲密度分层模型和分层相遇模型来改进挖掘方法,提升大学生社交关系挖掘的有效性。基于挖掘的校园社交关系网络,分析了校园社交关系网络的演化过程。本文主要的研究内容和创新工作包括:1.提出一种基于多重假设检验的大学生社交关系挖掘方法。在相同时刻(较短的时间间隔)访问相同地点被定义为学生的共现,共现是形成社交关系的潜在因素,基于共现的统计,提出一种基于多重假设检验的社交关系挖掘方法(MSVC)。首先,证明共现次数服从泊松分布;其次,基于共现建立学生之间的连边;然后,构建检验统计量,提出共现为随机因素所致的零假设,并使用该零假设分别对每条连边进行验证。如果验证结果服从该假设,则该共现为随机因素所致,相反,则该共现为社交关系所驱动;最后,构建校园社交关系网络。2.提出一种亲密度分层模型,消除时空集聚性对大学生社交关系挖掘的影响。受自由活动时间相对集中以及校园活动场所较少所限,大学生的校园行为主要集中在早中晚三个时间段以及少数几个受欢迎的活动场所,因此其活动轨迹在时间和空间维度均有明显的分布集聚性。为了消除这种影响,从物理学和统计学角度出发,提出一种消除时空集聚性影响的社交关系挖掘方法。首先,采用基于高斯混合模型的自适应时隙方法对签到时间点进行聚类,解决最优时隙选择问题;然后,根据时空因素对社交关系形成的贡献程度得到贡献因子,引入基于信息熵的地点权重和分组权重;最后,提出一种亲密度分层模型(ESIHM),并运用该模型挖掘大学生社交关系以及亲密度。通过与问卷结果对比,挖掘的社交关系与真实社交关系有很好的吻合。3.提出一种基于类关联分析的分层相遇模型,消除同质性对大学生社交关系挖掘的影响。同群(相同专业或年级)学生之间的接触时间或接触机会均比异群学生高很多。大学生交往行为的这种同质性现象带来同群社交关系极易被高估,异群社交关系则面临难以被挖掘的问题。针对这一问题,提出一种消除同质性影响的大学生社交关系挖掘方法—基于类关联分析的分层相遇模型。首先,采用滑动时隙的方法获取共现次数;然后,采用自适应阈值的方式解决传统关联分析中阈值难以设定的问题;最后,构建基于类关联分析的分层相遇模型,并分别挖掘同群和异群学生的社交关系。结果表明,该方法消除了同质性对社交关系挖掘的影响,提升了对异群学生社交关系的挖掘性能。4.分析校园社交关系网络演化过程。在消除时空集聚性和同质性影响的基础上,构建以学年为时间窗的四个校园社交关系网络。采用复杂网络指标从全局和局部层面对社交关系演化过程进行分析。首先,小世界现象的形成表明,任一学生只需较短路径即可与其它所有学生建立间接社交关系;其次,分析学生社交关系数量在不同属性上的分布发现,女生交友意愿由强于男生逐渐转变为弱于男生;再次,巨型社团逐渐分化成相对稳固的小型社团,这一现象揭示了社交关系由脆弱到稳固或由脆弱到消亡的两极分化过程;然后,分析学生的交往偏好发现,学生交往始终具有强烈的学院同质性和较强的性别同质性,但不同性别的同性社交关系的演化趋势截然不同;最后,通过分析三元模体的演化发现,双向社交关系的形成与否是控制三元模体从非闭合三角关系向闭合三角关系的动力学演变成功与否的一个关键过渡阶段。