社交网络用户行为关联分析的关键技术的研究

来源 :电子科技大学 | 被引量 : 9次 | 上传用户:huanghoubin101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络在社会生活中扮演着越来越重要的角色,不仅满足了用户的社交需求,同时体现出了巨大的经济价值和社会效益。此外,由于社交网络本身的复杂性,近年来受到了广泛的研究,如研究社交网络的信息传播模型、用户增长模型、链接预测模型以及舆论演进过程等。本文对社交网络中用户行为的关联性进行研究,本文研究的用户行为是基于社交网站用户生成内容的,而不是传统的用户行为,如用户点击习惯、页面停留时间等。在研究过程中,提取出了3个关键的研究点进行深入研究,分别是:(1)用户关注的主题,即本文所关注的用户行为;(2)用户之间存在的社团结构;(3)用户行为之间的关联性。基于上述3个研究点抽象出了本文要研究的3个关键技术:主题提取、社团划分及关联规则挖掘。本文的主要工作如下:1.研究了主流的主题提取算法,提出了一种基于期望最大化算法的主题提取算法。该算法的核心是一个主题概率模型,首先,对文本进行预处理;然后进行建模,为各个候选主题定义主题概率模型;然后采用期望最大化算法对主题概率模型的参数进行估计,并得到候选主题的概率密度函数,根据概率密度函数提取得到文本的主题。实验结果表明,该算法对文本的主题提取效果较好。2.研究了经典的社团发现算法,提出了一种基于节点相似度的社团发现算法,还提出了模块相似度的概念来评价社团划分的质量。该算法借鉴了层次聚类的思想,不仅适用于复杂网络中社团划分,还可发现具有相似特征的节点构成的社团。首先,计算网络中的节点之间的相似度,并将各个节点初始化为一个社团;然后选择使模块相似度增量最大的社团进行合并,重新计算社团之间的相似度并选择社团进行合并,直到只有一个社团为止。实验表明,本算法的社团划分效果较好。3.研究了经典的关联规则挖掘算法,对于同一数据集,在相同参数的条件下,各种关联规则挖掘算法挖掘到的关联规则集合是相同的,区别在于算法的时间复杂度和空间复杂度。本文在研究挖掘社交网络用户行为之间的关联规则时,提出了一种基于社团划分的关联规则挖掘方法,该方法可以有效减少关联规则挖掘算法处理的数据规模。实验表明,该方法可以有效减少关联规则挖掘的时间消耗。
其他文献
第八章指数分析(一)指数的一般概念了解:简单现象总体和复杂现象总体的含义、指数的两种理解.理解:指数的作用、指数的种类(按对象范围分、按指标性质分、按编制任务分)、总
“泉流滚滚岂无源,三堰由来出七门。灌溉千畴资厚利,涵濡百世沐深恩。”七门,就是今杭埠河,一座商贾云集的重镇——安徽省舒城县沿河而立的杭埠镇。2019年11月25日,平地一声
企业涉税风险是企业主要财务风险之一,最大限度地规避企业涉税风险是现代化企业健康稳定发展的必要条件。税务师行业是知识技术密集、高智能且极具专业性服务的行业,税务师在
从区域分布来看,排名TOP10城市为我国5G发展第一梯队,主要包括北京、深圳、上海、广州、南京、武汉等一线和新一线城市;重庆、天津、济南、青岛等城市处于第二梯队。TOP20城
事业单位涉税风险,是事业单位内控的重要组成部分。在事业单位分类改制,部分事业单位行政事业性收费取消,被推向市场的背景下,在金税工程特别是三期工程上线、税务管理力度不
目的:通过检测EZH2、P53蛋白在正常结直肠组织和结直肠癌组织中的表达与肿瘤各临床病理参数之间的关系及两种蛋白表达的相关性,进一步探讨正常结直肠组织向结直肠癌转变的分子
随着全球化竞争日益激烈,留住企业竞争力的来源和根本——人才资源成了企业生存和发展的关键。与此同时,现代企业已经从单纯追逐最大化的利润向坚持以人为本,坚持可持续发展
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技