移动社群挖掘算法及统计特征研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:sgaini1532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动手机用户快速普及,移动社群已经成为人们关注的一个热门话题。移动社群是移动互联网中相对密集的区域,其内部实体间存在着紧密连接,而社群区域之间相互隔离或者联系较少。本课题对移动社群理论技术的推动和移动社群营销技术的发展有重要的学术和应用研究价值。移动通话和短信数据是移动互联网时代中的两种重要和简单的移动通信数据。本文的数据来源于某地区中国移动通信用户的通话话单和短信记录,该样本数据包括移动脱敏用户100万个,总通话记录264万条,字段主要包括用户编号、通信时间、通信时长等。基于真实的通话和短信数据,本文对移动社群的挖掘算法及统计特征方法进行研究,其主要研究内容与创新点如下:移动社群网络的识别和关键用户的判别技术的研究,不仅对移动社群网络的理论发展有重要的研究价值,也对社会网络及社会计算的研究起到推动作用。本文提出了一种基于Potts Spin-glass(PSG)的移动社群识别模型,该模型的Hamiltonian模块度评估函数能够很好的对社群进行分类。在PSG模型的基础上,提出了基于Jaccards系数的关键用户判别模型,该模型对于评估移动关键用户间紧密性提供了一条有效途径。通过实证研究表明,本研究的移动用户数据在某些维度上具有“二八规则”中的普遍规律,例如90%以上的通讯(包括短信、通话)来自于大约10%的移动客户。在真实的移动通话和短信数据的基础上,本文将移动社群的特征分成4个类别,从原始通话和短信数据中提取了的8个移动社群度量指标,利用判别坐标分析方法对高维数据进行降维处理,建立移动社群特征预测模型,给出了移动社群特征预测的一般步骤,提出了移动社群特征分析的新方法。实验结果表明了提出模型的可行性和有效性,其预测准确率达到95%。
其他文献
本论文基于语料库和辞典,以《大辞林》里收集到的57个“V上がる”复合动词和107个“V上げる”复合动词为研究对象,对复合动词的语义用法和自他性,与本动词“上がる、上げる”
采用平板对峙结合生长速率法测定分析了红树内生细菌AmS2菌株及其甲醇粗提液对香蕉炭疽病菌的抑制活性.并对其甲醇粗提液的防病效果进行了研究。结果表明,红树内生细菌AmS2菌株
我国交通运输压力随着我国经济水平的不断提升而变得不断提高,人们越来越关注道路安全。路基在公路建设中的基础,因此公路的安全运行和使用寿命与公路路基的排水设计之间是密
以技术创新为主导的科技型创业在国民经济中发挥的作用日益重要,成为当今国家竞争力的重要指标。国内对科技型创业的研究尚处于概念发展的起始阶段:以“科技型创业”为主题词,选
科技信息资源共享服务平台由资源汇交系统、资源加工处理系统、资源目录服务系统和日志系统4个子系统构成。该平台体系的建设采用混合式的P2P体系结构。这种体系结构是用一台
技术标准与专利结合,使得专利技术标准化趋势出现。这既有专利权主体受利益驱动的主观原因,也是客观因素使然。专利技术标准化对技术创新有积极影响,但亦可能造成技术创新惰性和
在知名电商平台开设网店,可以在第一时间将农产品的产品信息、供需状况、价格和市场行情等最新情况通过网络向公众发布,加速了农产品的信息传播,克服了传统农产品的销售模式