社交网络中基于文本信息的人格识别与人格隐私保护研究

被引量 : 0次 | 上传用户:zpbaqq1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人格是对人类个体特征的高度概括,也是区分人与人之间差别的一种科学的量化标准。人格不但与人类在现实世界中的行为密切相关,而且与虚拟世界中的社交网络行为具有高度相关性。目前国内外对社交网络中用户人格分析识别技术进行了大量的研究工作,基于大数据分析方法和机器学习方法的用户人格分析识别模型是目前较为有效且准确的方法。同时,人格是人类个体稳定且重要的心理特征,已经被广泛应用于安全领域的研究中,也是社会工程学攻击的重要利用因素。目前社会工程学中的人格研究面临两大方面的挑战:第一,由于人格数据集特殊性的限制,现有的人格分析识别方法在数据处理与模型创新方面仍存在缺陷,不能很好地提取更深层次、更完整的特征信息,基于人工智能方法的人格分析识别准确率较低;第二,人格作为用户个体隐私的一部分需要对其进行有效保护,但人格隐私保护的研究几乎处于空白状态,缺乏人格隐私保护方法的研究,缺少一套较为完整的人格在社会工程学中的分析、识别与保护体系框架。本文综合利用用户文本数据相关特征属性和人工智能学习方法,对人格识别与人格隐私保护的一系列关键技术进行研究,形成了一套完整的人格识别与保护方法,主要研究成果如下:1.人格识别问题是推荐系统、政治预测、心理学研究以及社会工程学安全防护等实际应用的重要基础。本文研究基于数据特征工程的人格识别问题,为了提高人格识别的准确度,提出了一种基于PSO-SMOTETomek技术的人格识别方法。针对数据分布严重不平衡的问题,本文首先提出了对数据进行过采样与欠采样结合的方法,实现数据平衡;然后,在特征提取上,针对已有人格特征提取不完整的问题,本文新增了心理词汇TF-IDF值和文本风格特征两大类特征,并对所有特征进行降维优化;最后利用浅层机器学习算法对其进行人格分类。实验结果表明,相较于最新的人格识别模型,人格识别的准确率在两个公开且权威的数据集上分别提升了 3-10个百分点和4-8个百分点,达到提高人格识别准确率的目的。2.基于浅层机器学习算法的人格识别方法需要手工提取大量特征,人力与时间消耗极大;同时,使用五组独立的特征对五个人格进行分类,无法考虑到用户人格特质之间的相关性。本研究旨在使用基于深度学习的框架,构建端到端的人格识别模型。为了解决上述问题,本文提出了一种基于图卷积神经网络的人格识别模型。本文首先基于用户、文档、单词之间的关系与词共现对整个人格语料库构建一个大型异构人格信息图;然后在具有已知用户和文档类别标签监督学习下,联合学习图中三类节点的嵌入,实现特征的自动学习提取;最后,通过共享一组人格特征,基于神经网络中的全连接层对人格进行多分类任务,将五种人格特质之间的相关性融入人格识别中,完善人格识别模型,实现自动识别人格的同时提高人格识别准确率。在两个公共且权威的基准数据集上的实验结果表明,提出的人格识别模型优于最新的人格识别方法,人格识别平均准确率提高了 2.75-3.17个百分点,平均F1-score提高了 2.4-9.2个百分点。3.社会工程学中人格隐私保护问题是网络空间安全、社会工程学安全、以及日后的认知域安全等领域安全防护研究的重要基础。然而针对人格隐私保护的研究几乎处于空白状态,为了初步实现人格隐私保护,本文提出了一种基于对抗文本生成的人格隐私保护框架。本研究主要基于梯度下降的对抗方法和余弦相似度计算生成对抗文本,提出了一套集BERT算法、快速梯度投影方法和余弦相似度计算的人格隐私保护框架,使得人格识别模型不能准确识别人格特质。在两个基准数据集上进行的仿真实验结果表明,模型的人格识别准确度分别下降了 25个百分点和56百分点,可以达到人格隐私保护的目的。
其他文献
随着互联网技术的高速发展,传统纸质投票逐渐被电子投票所取代。电子评分作为一种特殊的电子投票方式,也得到越来越多的应用。电子评分很好地降低评分活动成本,但在数据存储、数据处理方面也存在较多不足,例如:评分隐私(包含评分者信息和评分结果)被恶意截取、篡改,评分结果准确性有待验证等。区块链技术具备不可篡改、去中心化两大特性,可以在电子评分中很好地规避数据被篡改现象,但所有数据都会被公开,存在评分隐私泄露
学位
随着以数字资产和智能合约为特征的区块链应用的发展,智能合约应用的开发正迅速增长,拓宽了智能合约和区块链的应用领域。但基于EVM(Ethereum Virtual Machine)的传统智能合约语言存在着Gas开销限制、可读性差和严格的语法限制等问题。而目前传统智能合约语言需要迫切解决的问题是其语言难以完成复杂计算任务。因此,区块链平台尝试通过开发多语言SDK接口,以满足智能合约开发者开发复杂智能合
学位
随着中国市场的竞争日益激烈,企业间的销售活动也愈发频繁,应收账款积压问题也因此产生。这些应收账款的持有者主要是处于供应链前端的中小微企业,由于这些企业应收账款数额较大,导致其正常的现金流被挤占。因此,政府正在大力推动金融实体为经济发展做贡献,为中小微企业融资提供便利,促使更多企业可以利用应收账款进行融资,以激发这些企业的资本潜力。近年来,金融技术的进步使得应收账款融资问题有了新的解决方案。利用区块
学位
随着多链生态的发展,各种公链,联盟链不断出现,并且累积了庞大的交易流量。但区块链本身的设计逻辑较为封闭,大多数的区块链都像是一个信息孤岛,无法建立一个统一的通信标准来进行跨链信息沟通,导致公链间的信息交互几乎没有。同时,跨链协议的安全性一直是不断被讨论的话题。特别是基于中继链方案的跨链协议,其安全性需要完全依赖节点及共识算法的安全性,如何选用合适的共识算法来突破区块链安全性,可扩展性,去中心化这个
学位
应用题是小学数学中的重要组成部分之一,是“难教、难懂、难学、难应用”的题型代表,在平时的练习、考试乃至实际应用中占有非常重要的地位,所以应用题的教与学一直是教师与学生心目中的重点与难点。小学六年级学生在应用题的学习及解题过程中,常常遇到各种困难疑惑,不可避免地会产生各种各样的解题错误,而解题错误又是学生学习及教师教学中宝贵的资源,因此总结应用题解题时产生的错误类型,分析解题错误产生的原因,并研究减
学位
近年来,随着中国经济的迅猛发展和“TA经济”的崛起,国内美妆市场份额不断扩大,涌现出一大批国产新锐美妆品牌,在激烈竞争的美妆市场中,如何利用好市场营销的优势,更新企业营销策略,从而提升市场竞争力成为企业持续发展的重要问题。近年来国产美妆发展过快,存在产品质量参差不齐、营销过度等问题。WM作为近两年来国产美妆品牌翘楚,存在的营销问题具有行业代表性,深入研究WM美妆品牌市场营销策略优化问题具有重要的理
学位
随着互联网与电子信息技术的快速发展,人们的生产方式及生活方式发生了翻天覆地的变化。在电子商务业务快速兴起的新形势下,各种类型的快递物流公司纷纷加入电商市场的抢夺中来,市场竞争激烈。与此同时,智慧物流概念日趋成熟,仓配一体化模式也应运而生。如何将二者有机结合、发挥效用,也是快递物流企业在未来的市场竞争中夺得先机的制胜法宝。因此,本文尝试将智慧物流引入沈阳邮政公司仓配一体化的改进中,以期提高市场竞争力
学位
出口退税通过在出口环节退还国内生产和流转过程中的已缴税款,提高出口商品的竞争力,对出口贸易的稳定增长、经济秩序健康平稳运行具有重要意义,是畅通国际贸易必不可少的纽带。当前,国家倡导优化营商环境,税务机关为加快出口退税的审批流程出台了各项优惠政策。但是,在这种现实情境下,不法分子出口骗税活动日益猖獗,利用这些税收优惠政策进行出口骗税,导致国家税收流失,扰乱公平市场环境,破坏国际收支平衡。数字化时代的
学位
本文主要探讨边缘计算在智能家居场景中的应用,提出了能耗和计算资源成本联合优化和低延迟优化两种方案。仿真对比结果分析了两种方案的有效性。这两种方案的提出对于边缘计算在智能家居中的应用具有重要意义。首先,避免了数据传输的时间消耗,提高了智能家居系统的响应速度。再者,将计算能力集中在设备端,使用户数据更加安全可靠,避免潜在的网络安全风险。最后,通过设备端的计算能力,智能家居可以实时响应用户需求,提供更定
学位
我国农村居民长期养成的消费观念和所处的农村社会环境对网络购买意愿的形成具有重要影响。本文基于686份农户调查样本,以网络购买价值感知作为中介变量,探讨农村居民消费观念和社会影响对网络购买意愿的影响。研究发现,消费观念中的实用性消费观念和面子消费观念能够促进网络购买意愿的发生,谨慎性消费观念制约网络购买意愿的形成;社会影响中的信息性社会影响显著促进网络购买意愿的发生,规范性社会影响的作用机制尚未形成
期刊