【摘 要】
:
社交网络在人们交流和分享的过程中充当着中间媒介的作用,不仅可以为用户提供优质的服务,而且社交网络平台可以收集用户生成的文本、图像和视频等不同媒体的数据。虽然社交网
论文部分内容阅读
社交网络在人们交流和分享的过程中充当着中间媒介的作用,不仅可以为用户提供优质的服务,而且社交网络平台可以收集用户生成的文本、图像和视频等不同媒体的数据。虽然社交网络跨媒体大数据对于信息流企业具有极大地变现价值,用户编辑的数据往往存在着语义稀疏、噪声多和多义性等缺点。本文基于深度学习、预训练、聚类算法、对抗生成学习等知识和技术,利用社交网络大数据语义扩充算法对社交网络大数据进行特征提取,通过对抗生成网络和参数共享机制将社交网络跨媒体大数据特征映射到统一的公共语义空间,引入社交网络跨媒体大数据之间的关联关系对社交网络跨媒体大数据的搜索进行辅助加速,实现了社交网络跨媒体大数据演进挖掘、搜索与可视化系统。本文完成的主要工作如下:(1)针对社交网络大数据存在的语义稀疏、多义性和噪声多等缺点,提出了社交网络短文本语义扩充算法(BBLA)和社交网络图像语义扩充算法(VMA)。在社交网络短文本语义扩充方面,设计了适用于社交网络短文本数据的深度神经网络,通过结合预训练模型Bert、长短时循环网络和注意力机制,获取了具有上下文语义信息的文本语义扩充向量,利用有监督的方式对文本数据进行训练和学习,实现了社交网络短文本的语义扩充;在社交网络图像语义扩充方面,利用VGG-16模型对社交网络图像数据特征进行获取,通过在提取图像特征的过程中引入多头注意力机制,获取了具有丰富语义的图像语义扩充向量,实现了社交网络图像的语义扩充。(2)为了加速社交网络跨媒体大数据搜索效率,提出了基于时间和转发关系的社交网络跨媒体大数据关联关系发现算法(ADSTR)。通过对社交网络跨媒体大数据进行聚类分析和关联规则发现,获取了社交网络大数据之间的关联关系,构建出媒体内和媒体间数据的关联矩阵,实现了社交网络跨媒体大数据之间的关联关系发现。对于社交网络跨媒体大数据演进规律挖掘方面,利用基于时间和转发关系的社交网络跨媒体大数据关联关系发现算法对社交网络跨媒体大数据进行分时间片的关联关系发现,获取了每个话题在演变过程中的变化规律,实现了社交网络跨媒体大数据演进规律的挖掘。(3)针对以微博为代表的社交网络存在的语义鸿沟和搜索效率低的问题,提出了基于公共表示与关联关系的社交网络跨媒体大数据搜索算法(CPRT-IR),利用对抗生成网络将社交网络文本特征与对应的图像特征映射到公共语义空间,根据公共语义空间中各媒体的表示生成重构的文本与图像特征,将跨媒体大数据的重构特征与原始特征的差异和对媒体间数据的判别损失作为网络损失的组成部分,通过生成模型与判别模型的相互博弈,获取了社交网络跨媒体大数据公共特征表示,解决了社交网络跨媒体大数据之间语义鸿沟的问题。为了进一步加快搜索的效率,通过结合社交网络跨媒体大数据的公共表示和社交网络跨媒体大数据之间的关联关系,实现了社交网络跨媒体大数据的高效搜索。通过降维和聚类分析的方法,分别对社交网络跨媒体大数据公共表示和搜索结果进行可视化,实验结果进一步验证了基于公共表示与关联关系的社交网络跨媒体大数据搜索算法的有效性。(4)实现了社交网络跨媒体大数据演进挖掘、搜索与可视化系统。系统由语义扩充模块、关联关系发现与演进挖掘模块和搜索与可视化模块三个模块组成。实现了各项功能完备,操作友好的系统。
其他文献
水环境污染是世界范围内各国各地区的重要的环境和经济问题之一,现在水环境中的重金属污染对人和其他生物的影响不容忽视已经被广泛的关注。在1995年欧共体修改后的EU饮用水指令(Drinking Water Directive)中就有对Cu(Ⅱ)和Pb(Ⅱ)等重金属离子在饮用水中允许的极限值的规定。在金属电镀行业所在区域以及有色金属矿采场所在地,重金属污染尤其突出。当下常用的用于处理已经形成的重金属污染
噪声污染在日常生活中无处不在,却容易被人们忽视。噪声中的低频成分具有波长长、频率低的特点不易被人发觉,却会使人产生眩晕、呕吐等临床反应,同时,低频噪声的振动激励会使生产设备的精度下降,使产品的质量难以保证。传统的降噪方法是在噪声传播过程中使用吸声材料建立屏障来隔绝噪声,但这种方法对低频噪声收效甚微。采用有源噪声控制(Active Noise Control,ANC)可以弥补传统方法的缺点,它是一种
目的:通过原代培养大鼠骨髓源内皮祖细胞(Endothelial Progenitor Cells,EPCs),血管紧张素Ⅱ(AngiotensinⅡ,AngⅡ)诱导EPCs衰老,研究血府逐瘀汤对大鼠骨髓源EPCs的衰老、迁
农村集体产权制度改革,是解决当前农村集体资产产权权责不明确、归属不清晰、管理不严格、处置不规范等突出问题,构建新型农村集体经济组织,发展壮大农村集体经济,促进农村社会和谐稳定的一项重大举措。2017年,山东省S县坚持试点先行、以点带面,开始推行农村集体产权制度改革,利用三年的时间街基本完成了清产合资、股权划分、成立集体经济组织以及建章立制等各项改革任务。通过改革,S县基本理清了资产资源权属及收益分
CNMARC作为中文书目数据的主要格式,长期以来,不仅实现了机读目录格式结构标准化,同时也促进了书目资源的交流与共享。但在网络化时代但随着互联网的爆炸式发展以及计算机技
含氟有机化合物是目前应用较广的一类物质,由于氟原子具有较强的氧化性和较大的密度,在传统的CHON类含能化合物中引入氟原子,可使含能化合物具有更高的晶体密度和氧平衡,因此
顺层岩质滑坡在我国广泛分布,且每年都会造成巨大的人员伤亡以及经济财产损失,属于危害较大的一类地质灾害。国内外学者对此类滑坡的成因机理虽然有了比较系统、深入的认识,但顺层岩质滑坡具有突发性强、破坏性强的特点,如何建立有效的滑坡预警判据和预警模型,提升顺层岩质滑坡监测预警的可靠性,从而减轻灾害损失,还有待进一步研究。本文以贵州兴义2.17滑坡灾害为研究对象,通过现场调查以及相关资料研究,分析了滑坡的坡
本文以戊二烯酮和查耳酮为先导化合物,利用活性拼接原理,将噻吩磺酸酯引入戊二烯酮和查耳酮结构中,合成了22个含噻吩磺酸酯的戊二烯酮衍生物Ⅰ1-Ⅰ22和22个含噻吩磺酸酯的查耳酮衍生物Ⅱ1-Ⅱ22,并对它们进行了抑菌(Xac、Xoo和Rs)和抗病毒(TMV)活性测试。所有化合物通过1H NMR、13C NMR和HRMS进行结构表征。本论文主要研究结果如下:在质量浓度为100和50μg/mL的情况下,选
校史馆相比于其他展示类空间更具有特殊意义。它不仅是学校历史、文化、传统、荣誉的综合展示平台,也是学校对学生进行德育教育和人文教育的实践基地。然而目前人们对于校史馆的理解往往还停留在对其收藏功能、档案管理以及建筑本身的价值层面,缺少对其文化内涵的理解和研究。因此现代校史馆的设计亟待需要融入一种文化底蕴,一种时代精神来涵养当代师生。本文首先就海派文化为切入点,从海派文化的起源、历史背景、经济基础、存在
网络访问控制语句通常部署在防火墙、路由器和入侵检测系统等网络安全设备中,访问控制的语义决定了网络安全设备的行为。网络访问控制语句之间的语义出现重叠现象,本文称此现