面向图的群体多特征提取与修正技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zw244942568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,复杂网络理论的发展为人类了解各种类型的真实网络提供了理论模型和研究方法。电信行业每天都产生海量的电信数据,电信通信数据已经成为复杂网络研究的主要载体之一。了解网络的群体特征有助于人们更深入地认识网络中群体的结构和特点,而特征修正是保障正确群体特征描述的必要步骤。因此,对复杂网络的特征提取和修正是当今一个非常有前景并且具有挑战性的研究领域。与此同时,研究人员面临的另一个挑战是如何在超大规模网络中进行数据挖掘,工业界和学术界已经使用分布式计算模型,如MapReduce和BSP等,取得了一些有效的成果。   本文基于大规模电信通信数据,分别从拓扑结构,性别和年龄三个维度深入研究了电信群体的多种特征,并给出了特征提取的并行算法。比较多个关系分类器在电信网络上的效果,利用电信用户的属性信息改进了传统联合推断算法的预测效果,使得准确率大幅提升,并给出了联合推断的并行算法。本文主要工作如下。   结合目前研究现状,在介绍了不同类型的群体特征的主要内容和研究成果之后,给出了网络群体划分方法,提出并建立了由模块度、节点度分布、聚集系数、平均最短路径组成的网络群体特征体系。提出了多种群体特征提取方法的并行实现,并针对不同的群体特征采用不同的并行计算模型。   提出了以节点为中心的特征修正框架,给出了4种不同的关系分类器和3种不同的联合推断算法。综合分析了各个算法的特点,并给出了适合于并行化的松弛标记联合推断算法的MapReduce并行化版本,用于对大规模电信数据的联合推断。   在电信通信数据集上对电信用户的拓扑特征和属性特征进行了分析研究,如邻居、年龄、性别、通话短信次数、通话时长等,从静态和动态两方面对人类通话和短信行为进行了刻画。并分析了电信用户通信的同质性,即用户更倾向于和自己相似的用户产生通信行为,电信运营商可基于此对目标客户进行精准分类与定位,从而进行精准营销。   在分析了不同关系分类器在电信数据集上的效果之后,选取了准确率最高的邻居加权关系分类器。不同于传统的联合推断,本文不仅利用电信网络的拓扑信息,还利用了不同性别、年龄用户的通话特征,从而深刻揭示了电信用户交往行为的模式和内在特征。本文将松弛标记联合推断算法和决策树规则相结合,改进后的联合推断算法预测用户性别的准确率为93.17%,预测用户年龄的准确率为90.13%。
其他文献
水下传感器网络(Underwater Sensor Networks,UWSN)是一种以数据为中心的自组织网络,其主要任务是水下数据感知与收集。目前水下传感器网络通常采用多种类型传感器,对水下环境进
该文通过对工业现场环境下可燃气体探测报警技术及产品应用现状的评述和光谱学技术在气体分析计量领域的应用分析,提出了线型红外可燃气体探测报警系统的研究目标,确定了研究
卫星移动通信具有覆盖面广、频谱利用率高,不受地理条件限制等特点,在抢险救灾、应急指挥、海洋渔业等领域发挥重要作用。随着GMR卫星通信系统在我国的不断发展,对整个产业链也
行人计数作为智能视频监控的重要功能之一,可广泛应用于商场大楼、人行道和地铁出入口等人流密集场景的监控中,具有重要的研究与实用价值。传统的行人计数主要使用普通彩色摄
基于位置的服务(Location Based Service, LBS)是移动互联网服务中很重要的一部分,有着巨大的市场规模和良好的利益前景,同时也存在很大的提升空间。手机服务提供商和手机设
在移动通信网络的发展历程中,第二代移动通信网络(GSM)因为其具有完善的技术规范,采用国际化标准化的通用信令系统,所以发展迅速、应用广泛。随着网络复杂度和用户需求的增加
近几年随着多媒体技术的发展以及web3.0的兴起,网络流量出现了爆发式增长。浩瀚的信息充斥着人们每天的生活,对Internet的服务品质和访问速度要求越来越高,高效的从网络上获
SaaS,软件即服务,是近些年来发展起来的一项新的软件开发和部署方式。和传统软件不同,SaaS本身具有对于市场的敏捷反应,开发周期短,运营成本低等特点,并且可以同时给很多企业
DTS软件是一款基于软件缺陷模式的静态测试工具,采用非域敏感的函数摘要技术进行全局分析,且只约束单变量,这会导致一些误报和漏报。为此,本文改进了DTS软件的约束信息。首先
近年来随着互联网技术的日益普及,网络技术对人们的日常生活也在产生着越来越深远的影响。例如与互联网一起流行起来的VoIP (Voice over IP)技术,该技术充分利用了全球互联网