【摘 要】
:
伴随互联网技术的成熟,社交网络在社会、政治和经济等层面体现出重要价值和作用,面向社交网络实体的认知算法成为计算机科学领域研究热点。现有研究成果在网络服务、线上营销和公共安全方面发挥着重要作用,但仍存在诸多技术难题尚未攻克,因此本文研究工作具备较高的学术价值和应用价值。围绕社交网络实体认知,本文聚焦于四个具体关键研究点,包括:(1)话题流行时间预测;(2)用户意见预测;(3)基于影响关系的关键用户发
论文部分内容阅读
伴随互联网技术的成熟,社交网络在社会、政治和经济等层面体现出重要价值和作用,面向社交网络实体的认知算法成为计算机科学领域研究热点。现有研究成果在网络服务、线上营销和公共安全方面发挥着重要作用,但仍存在诸多技术难题尚未攻克,因此本文研究工作具备较高的学术价值和应用价值。围绕社交网络实体认知,本文聚焦于四个具体关键研究点,包括:(1)话题流行时间预测;(2)用户意见预测;(3)基于影响关系的关键用户发现;(4)基于关键用户发现的意见引导。具体研究内容如下:(1)基于文本增强的话题流行时间预测。以提升预测精度为目标,主要解决多类话题相关信息难以利用、话题流行时间复杂变化模式难以学习的问题。提出文本增强深度生存模型,该模型包括前置的文本增强模块和后置的深度生存模块。针对多类话题相关信息利用难题,前置的文本增强模块将繁杂的文本信息浓缩为话题关键特征,有效融合话题相关文本和流行度信息,实现关键的多类话题相关信息有效利用。针对话题流行时间复杂变化模式学习难题,后置的深度生存模块使用生存模型理论框架,通过其深度循环神经网络结构充分挖掘输入信息的时间相关性,并设计损失函数,有效学习话题流行时间复杂变化模式。基于真实社交网络数据集进行实验验证,所提模型预测精度优于对比模型,实现话题流行时间的准确预测。(2)基于多信息融合的用户意见预测。以提升预测精度为目标,主要解决多类用户相关信息难以利用、复杂多样用户偏好难以学习的问题。提出多信息解离化用户表征模型,基于表征相似度进行意见预测,该模型采用多信息对抗融合方法和解离化变分自编码器。针对多类用户相关信息利用难题,设计基于对抗学习的融合方法,有效融合用户群组内话题相关性、用户历史意见和用户关系结构信息,实现关键的用户相关多类信息有效利用。针对用户偏好学习难题,设计解离化变分自编码器,对决定用户偏好但相互纠缠的潜在因素进行解离,实现复杂多样用户偏好的有效学习。基于真实社交网络数据集进行实验验证,所提模型预测精度优于对比模型,实现用户意见的准确预测。(3)基于二阶影响关系的关键用户发现。以提升关键用户发现准确度为目标,主要解决用户复杂影响关系导致的用户影响力难以准确估计的问题。首先定义二阶影响关系,其次提出综合考虑一阶和二阶影响关系的二阶独立级联模型。针对用户影响力估计难题,设计二阶影响传播规则应用于该模型,克服现有模型因未考虑二阶影响关系而导致影响力估计存在偏差的缺点,实现影响力的准确估计。考虑二阶影响关系会增加影响力估计的时间复杂度,对此基于逆影响采样方法,针对性地设计二阶关键用户发现算法及其并行加速算法。算法既准确发现关键用户,也适用于规模普遍较大的真实社交网络。基于真实社交网络数据集进行实验验证,所提模型优于使用广泛的一阶独立级联模型,所提算法有效性和效率较高,实现关键用户的准确发现。(4)基于关键用户发现的意见引导。以提升关键用户发现准确度为目标,主要解决目标问题高复杂度导致的高准确度算法难以设计的问题。针对算法设计难题,首先基于现有研究提出改进的贪心算法,设计用户心理特征最优取值策略用于该算法,通过准确发现关键用户,有效实现群体意见引导。其次针对真实社交网络规模普遍较大的实际情况,提出基于社区特性的加速算法,在牺牲极少算法有效性的前提下,有效提升算法效率。并且基于近似次模性,理论论证所提算法所求解的近似比。基于真实社交网络数据集进行实验验证,所提算法优于对比算法,既准确发现关键用户,也适用于规模普遍较大的真实社交网络。本文基于公共实验数据集对所提各方法进行验证测试。实验结果充分证明所提各方法有效解决了相应关键性技术难题,所提各方法是面向社交网络实体的认知任务的有效解决技术。
其他文献
瑞利散射型分布式光纤传感由于其响应速度快、灵敏度高、传感距离长等优点成为了近年来的研究热点,已经初步应用到地震波监测、地质勘探、智能交通、大型结构健康监测等领域。常见的瑞利散射型分布式光纤传感有:适用于动态应变传感的相位敏感型光时域反射计(phase-sensitive optical time domain reflectometry,Φ-OTDR)、可用于动静态温度和应变传感的相干光时域反射计
作为数据挖掘领域的热门问题之一,离群点检测(也称为离群点挖掘)是从原始数据集分布中发现显示异常行为的对象,它可用于人群异常行为检测,信用欺诈,入侵检测,医疗保健和物联网(IoT)大数据离群点检测等。关于离群点检测,两个主要挑战是数据的维度和规模。使用集中式的检测方法,必然面对数据的“维度诅咒”,另外随着数据尺度的增加,单一节点的计算在运行时间上也是难以忍受的。本文研究的重点也立足于解决离群点检测中
随着近年来量子计算领域的飞速发展,量子计算技术已经深刻地改变了传统的计算模式与信息处理的方式。量子计算利用量子物理特有的量子纠缠、量子叠加等性质能够有效地提升信息处理的效率与能力,并且提供了新型的数据计算与信息处理方式。机器学习利用现有的计算资源对大数据进行分析学习得到规律以对未知数据进行预测,在众多领域有着广泛的应用。量子计算技术应用于机器学习中产生了量子机器学习这一研究方向。量子机器学习一方面
合成孔径雷达(SAR)由于其全天时、全天候的工作特性,已被广泛应用于侦察探测、地质勘探、灾害检测和公共区域安检等领域。作为SAR图像分析和解译的基础问题,SAR目标分类与检测问题的研究具有重要意义。鉴于深度学习方法在计算机视觉领域取得了巨大成功,本文开展基于深度学习的SAR目标分类与检测方法的研究。近年来,基于监督学习的深度网络在SAR目标分类与检测任务中被广泛应用并取得了突出的效果。本文围绕SA
区块链(Blockchain)技术近年来已成为学术界和工业界的研究热点。目前区块链的应用场景也已经扩展到金融、医疗、政府、文化、艺术、物联网、软件工程等领域,因而区块链也常被称为下一代互联网。但是,区块链还存在一系列问题,如共识算法机制、系统性能与运行效率、存储方法、匿名与可信的矛盾以及监管问题等,安全威胁也始终相随相伴。目前针对区块链系统、合约和应用的安全事件频频发生,给个人、企业乃至国家造成了
随着移动互联网通讯和物联网技术的飞速发展,包含众多传感元件的可穿戴设备将成为物联网的重要入口与应用终端,并通过软件支持以及数据云端交互实现众多功能,这将对我们未来的生活、感知带来巨大的改变。可穿戴柔性触觉传感器通过测量人体生理参数、感知周边环境指标,能够及时且低成本地提供人体健康状况的相关重要信息,对人类医疗保健、运动健康具有积极的影响。随着可穿戴设备逐渐呈现出巨大的市场潜力,柔性电子器件特别是柔
数据访问控制技术是网络与信息安全领域用于实现只有授权用户才有权访问共享数据的关键技术之一。以对称加密和传统公钥加密技术为主要手段的访问控制,虽然在一定程度上实现了对数据的授权访问,然而由于其缺乏灵活性和可扩展性,无法实现一对多细粒度访问控制,使其无法真正广泛应用于各种现实场景中。随着对访问控制研究的不断深入,不同的一对多访问控制机制,如身份基广播加密的访问控制机制和属性基加密的访问控制机制,相继被
随着无线感知与通信技术的发展,低功耗物联网被广泛地部署以采集或监测环境数据。多样的应用场景和不断增加的物联网终端设备对低功耗物联网的数据传输性能提出了挑战。一方面,越来越多的物联网终端设备被部署到环境中,爆炸式增长的终端设备与有限的无线资源之间冲突越来越明显,并成为影响低功耗物联网性能的主要瓶颈之一。因此,如何通过高效的资源分配机制,支持大量终端设备的可靠数据传输是低功耗物联网领域非常重要的研究问
随着智能设备的普及和存储技术的发展,客户端进行数据存储和处理的能力得到显著提升。对这些数据的分析挖掘能够带来巨大的经济效益和社会价值。随着各行业数字化建设的深入,来自于各领域的大规模数据已难以进行直观分析和观察。层次聚类算法作为大数据分析挖掘中的一种重要工具,通过分析数据之间的关系,能将数据组织成多层次、多分辨率的结构形态,有助于人们挖掘数据中的潜在知识。但传统层次聚类算法的计算复杂度高,可扩展性
点云曲面重建是利用三维散点的几何信息建立相应的数学模型描述和绘制空间曲面,其被应用于产品设计、文物保护、油气勘探等诸多领域。地下地层曲面重建根据地震勘探获得的地层散点信息,构建层位、断层等地下地层曲面,是建立地下层序模型、油藏模型的基础和支撑。地下地层曲面重建涉及大量信息处理技术,地质规律和区域地质知识,是信息处理领域和油气勘探领域共同关注的前沿问题之一。用于地下地层曲面重建的点云数据具有稀疏性、