基于CNN的多模态深度融合特征的社交媒体流行度预测

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:fangrong87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的迅猛发展,社交媒体数据日趋多样化,其中包括视频、图像、文本、时间、地理信息等,从而使得利用多模态数据来预测社交媒体流行度成为现实。传统的社交媒体流行度预测方法需要通过先验知识人工提取特征,难以将特征提取器与回归器相结合,过程复杂且难以适应如今的大数据特征处理。对于越来越多因素影响下的社交媒体流行度预测问题,传统方法的泛化能力不足。在实际的实验中,发现不同模态的数据对社交媒体流行度预测的影响存在较大差异,而且不同模态数据相互组合而成的多模态数据对预测结果的影响并不是线性叠加的。大规模的多模态数据无法充分有效地用来预测社交媒体流行度。另外,社交媒体数据存在的严重的样本不均衡问题也约束了流行度预测。本文以多模态数据特征为基础,主要研究和贡献如下:(1)针对时间和地理等单尺度数据,根据每一类数据的特点,分别采用时间尺变换和地理信息转换的方法将这些数据尽量多地转化为多尺度特征。针对文本数据,采用Doc2vec算法将其转化为语义相关的向量。(2)为了获得更多图像模态特征,本文采用预训练的深度学习模型Inception_v4和Place2-365-CNN分别获得图片的类别特征和场景特征,并采用主色调提取算法获得图片的主色调特征。(3)为了探索和利用多模态数据联合预测社交媒体流行度,本文提出使用深度卷积神经网络叠加全连接层来提取并融合多模态特征,最后用XGB oost来预测流行度。(4)分析本文获得的多模态深度融合特征的有效成分,检验本文提出的CNN-XGBoost算法的有效性,分析CNN结构对预测结果的影响。实验表明,本文提出基于CNN的多模态深度融合特征的社交媒体流行度预测算法有效的提取并融合了多模态特征,其在SMHP数据集是获得较好的性能,其中MSE达到0.9187,MAE达到0.5592,SPR达到0.9175。
其他文献
目的比较采用改良Stoppa入路与髂腹股沟入路切开复位内固定治疗髋臼骨折的效果。方法回顾性分析自2011-01—2016-06行切开复位内固定治疗的32例髋臼骨折,16例采用改良Stoppa
对沥青砼摊铺机螺旋分料器的输送机理进行了分析,从摊铺机自身结构出发,对螺旋分料器工作参数及结构设计提出了改进方法,探讨了改进的螺旋分料器对抗离析的作用;从路面密实度、温
本文基于政策损失函数设计了一个新的模型框架,建立了一个不包含预期通货膨胀的反映产出缺口和通胀缺口之间关系的模型,并使用可变参数模型分析产出缺口与通胀缺口的动态关联性
随着科学技术的进步和建筑行业的发展,混凝土的集中搅拌是建筑工程生产管理的一项重大改革.混凝土的生产从传统的施工体系中分离出来,实现商品化也是现代混凝土技术成熟的标
互联网产业的深度发展已经为整个社会带来了全方位、深层次的影响,不断更新着人们接收信息的途径和速度。如何在全社会范围内树立宪法法律至上、法律面前人人平等的法治理念;
一牧场位于新疆南部,策勒县境内,地处昆仑山北麓,北临塔克拉玛干大沙漠,距乌鲁木齐市1800km,距和田市120km。东西长110km。南北宽45km。一牧场三面环山,分农牧两个区域,海拔高度在21
社火作为中国古代流传至今的祭祀活动,其装饰艺术的原生性保持的较为完整。从社火中跑旱船为例,其华丽璀璨的装饰艺术体现,源自流传的神话故事,诠释着民俗文化的巧夺天工的装
简述了混凝土冬季施工的一般原理,介绍了目前经常采用的4种施工方法,指出在实际工程中,要根据施工时的气温情况、工程结构状况、工期紧迫程度、热源的条件等来选择合理的施工方
每年高考作文题都是社会的焦点,今年也不例外。对高考作文题的评述,站在不同的立场会有不同的体会。本期刊登几篇来自一线教师对其所在省区高考作文题的评析,让大家听听别人
随着我国大学生人数不断增加,就业压力越来越大。因此,很多高校提倡大学生进行创业。但是在是创业过程中,会受到多方面因素的影响,导致大学生创业成功率偏低,影响到大学生创