面向泛社交网络的隐私保护和垃圾信息过滤技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qukangmin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能移动终端的广泛普及,各种社交应用软件迅速发展,为用户提供了方便快捷的通讯与分享体验,但同时因为用户规模的不断扩张,社交网络的泛社交化现象愈发明显,给用户的分享和浏览带来不利影响。当用户在分享状态时,由于好友列表中存在越来越多不熟悉的“好友”,导致个人信息的传播范围在无意中扩大,给用户带来隐私泄露的风险。另外,由于网络中的数据鱼龙混杂,用户在浏览信息时也不断受到广告、传销等垃圾信息的侵扰,严重影响了正常的用户体验。针对上述问题,本文面向发送端提出了一种基于社团划分和亲密度量化的隐私控制框架,面向接收端设计了一种具有更新能力的垃圾信息过滤系统。具体而言,本文的主要工作和贡献如下:1.提出了一种基于同质性游走的模糊社团检测方案。该方案的核心思想是对网络中节点的向量表示学习,再根据节点间的相似度进行聚类从而得到社团划分。当用户在发布动态信息时,通过该方案对好友列表进行社团划分,动态内容可以选择性地推送给相关组别内的好友,达到控制隐私信息传播范围的目标。具体地,首先引入同质化游走的概念,使随机游走的过程倾向于挖掘网络结构中的同质性,使社交网络中连接关系紧密的节点在向量空间中距离更近;然后使用模糊聚类算法,通过隶属度矩阵计算节点对各个组别的隶属程度,再设置阈值使一个节点可以同时隶属于多个社区,解决了传统方案不能用于重叠社区检测的缺点;最后在具有真实背景的社交网络中进行验证,证明该方案相比于现有方案发掘到的社团在内部模块度和外部准确率上都有明显的效果提升。2.提出了一种基于亲密度的隐私权限设置方案。为了解决社交平台中好友关系二元化定义不能准确度量好友亲密度、灵活性差等缺点,本方案利用数据挖掘技术,结合好友的属性信息、行为数据、环境因素,提出了细粒度的亲密度量化方法,并依据关系量化值设置相应的访问权限级别,进一步控制隐私信息的传播范围。具体地,本文首先分析了好友间亲密度的影响因素,在离线状态下训练关系量化模型,然后与线上社交平台结合,通过获取实时的特征数据进行亲密度的在线计算,最后基于计算得到的关系值设置不同的隐私权限开放级别。本文通过实验验证了本方案的有效性,证明其具有实际应用能力。3.设计了一种具有更新能力的垃圾信息过滤系统。首先使用Word2vec模型从爬取到的社交网络文本数据中生成词嵌入矩阵;设计了LSTM-CNN分类算法,通过结合长短期记忆网络处理时序信息的特性和卷积神经网络特征提取的能力来提升分类效果;设计更新系统,通过对模糊样本的重新标记,使分类器能够不断适应文本特征的变化。通过实验与传统的分类算法进行对比,证明本文提出的过滤方案可以在准确率上取得更好的效果。
其他文献
针对已研制的天然气水合物孔底冷冻取样器,为进一步提高取样器干冰冷源的保冷效果,提出干冰冷源双层保冷方法。通过试验研究,证明干冰冷源双层保冷方法可大幅度提高干冰在井内的
塔城地区哈萨克语探析黄中祥塔城地区六县一市的哈萨克语基本一致,只是在语音上,乌苏县和沙湾县哈萨克语元音的发音部位略靠前,元音i的发音部位略靠后。在语法上,乌苏县和沙湾县哈
【正】 谚语是一种特殊的习语。与成语不同的是,谚语不仅表达完整的思想,而且大多数有完整的句子结构。谚语也有别于格言,格言多出自名家之手,而谚语则是人民大众的口头创作,
建立了固相萃取-超高效液相色谱-串联质谱(UPLC-MS/MS)同时检测畜禽粪便中四环素类、磺胺类、氟喹诺酮类和大环内酯类16种抗生素的分析方法。针对目标物化学性质和样品杂质情况
作为人文素质课,数学文化课的目的就是要通过提高学生的数学素养来提升学生的人文素养.因此,课程不应以讲数学知识或介绍新方向为主,也不宜单纯地普及数学史知识,而是应该充
针对低碳、 环保生活领域对无线充电的应用, 提出基于 SMT32F103C8T6 单片机实时系统智能水杯的设计方法.在此基础上, 采用了原装 TI芯片 BQ51013B, 有充电芯片 TP4056对水杯
1 植物名称彩叶草(Coleus blumei var. Verschaffeltii).2 材料类别茎段(shoots).3 培养条件培养基:(1)MS;(2)1/4MS+6-BA 0.3 mg*L-1(单位下同);(3)1/4MS+NAA 0.05+6-BA l.0;
他这么年轻谢冕  谢有顺呼唤并恪守的是普遍的人性和写作的尊严。他的文学批评是以人对世界和个人的生存状态的追问为出发点的。文学总是与人、与人的内心有关,因此,我认为他
目的探讨盐酸曲唑酮治疗酒依赖稽延性戒断症状的有效性和安全性。方法采用随机、双盲、安慰剂对照的方法把100例符合纳入和排除标准的患者分成盐酸曲唑酮组和安慰剂组。每个
目的探讨右房分流技术在Stanford A型主动脉夹层手术治疗中的临床经验及优势。方法回顾性连续纳入2016年1月至2018年4月于新疆维吾尔自治区人民医院心外科手术治疗的204例Sta