论文部分内容阅读
移动互联网的快速发展将人们的社交途径从传统社交网站带入了移动领域,形成了具有及时性、移动性和可定制性特点的移动社交网络。其中短信和微博作为当前移动社交网络的最主要应用,覆盖了最广泛的用户群体,具有很好的代表性。因此,针对短信和微博所构成的移动社交网络的研究,将有助于发现虚拟社会及其代表的真实社会的许多特性,而这些特性不仅有助于进一步指导同一网络中不同关系属性的研究,而且有助于指导不同网络中同一身份识别的研究。另一方面,移动社交网络的快速发展加速了当前已经存在的信息爆炸问题,大量的信息爆发出来,给信息的自由化发展带来了机遇的同时,也带来了大量的垃圾信息,若放任这些垃圾信息的存在将不仅使得用户遭受较大的损失,也严重阻碍了蓬勃发展的移动互联网产业。基于此,本文将首先研究移动社交网络的结构和行为特征,并利用这些特征进行网络中多关系属性的预测以及多层网络中用户身份的同一性识别,最后将其与信息处理技术相结合,建立移动社交网络中的垃圾信息过滤框架。具体研究内容如下:1)研究了以短信和微博为媒介的移动社交网络的结构和用户行为特征,从多方面多角度分析移动社交网络和传统社交网络以及国内网络和国外网络的相同和不同之处;2)研究了短信网络中的亲属关系结构和行为特征,并进一步提取显著特征建立亲属关系模型,再据此模型进行网络中有交互关系的两个用户之间亲属关系的存在性预测(即预测是否具有亲属关系),以及亲属关系类别预测(即预测具体属于何种亲属关系,如父子、夫妻关系等);3)针对同一用户存在于多个移动社交网络中而无法进行用户全局信息分析的问题,提出一种多层网络中的身份识别方法,通过构建基于伊辛模型的能量值最低模型来刻画多层网络中的用户能量,并依此实现不同层网络中的用户身份对应关系预测和重建;4)针对传统垃圾信息过滤过程中存在的概念漂移问题,即数据流中隐含的概念会随着时间或环境的变化而改变,而原有的过滤系统无法自动适应这种变化,同时针对当前海量信息条件下过滤速度和过滤准确率不能兼顾的问题,提出了一种自反馈垃圾信息综合过滤框架以及流量过滤算法,实现了移动社交网络信息过滤的实时化和智能化。