基于深度学习的多模态营销新闻识别方法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:taylorgil7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻是人类文化生活的一个组成部分,以前新闻主要是讲述生活当中息息相关的事件,但是近年来随着电商的爆炸式增加,营销类新闻愈演愈烈,干扰到人们正常观看新闻的需求,如何有效准确的识别出营销意图的新闻是各大新闻网站的重点研究内容。随着自然语言处理技术的发展,将深度学习技术应用到分类识别类问题已成为近年来的研究热点之一。传统的机器学习算法大部分采用手动方式提取特征,因此在文本分类问题上存在一定的局限性,而深度神经网络经过多层次结构的变换,能更好的表达出数据本质的特征。本文在深度学习技术的基础上对模型进行融合,并结合新闻配图进行多模态分类识别,主要研究内容如下:(1)根据新闻文本数据量大且长短不同的特点,并通过实验分析了文本分类技术当中的卷积神经网络和长短时记忆神经网络,针对这两类方法中存在的问题,采用将字符级表示向量与单词嵌入向量连接起来的方式,提出了一种CNN+LSTMAttention网络模型结构,卷积神经网络可以将单词进行字符级表示,长短时记忆神经网络可以更好的解决文本序列化问题,注意力机制可以在模型输出前,给予权重的分配,这样有利于提高深度学习模型的可解释性。通过对比实验结果分析,本文提出的CNN+LSTMAttention模型提高了营销新闻分类识别的准确率。(2)在新闻文本分类识别的过程中,单条新闻的文字内容过少或者文本信息的营销性含糊不清都会对识别的准确率造成影响,因此本文提出了新闻文本结合新闻配图的多模态营销新闻识别方法。其实现方法通过对新闻配图使用本文提出的OCR技术过程,包括采用CTPN进行配图文字区域定位,同时设计Dense Net结合CTC技术进行文字识别,提取出新闻配图上包含的文字信息来补充文本分类识别信息,从而达到多模态效果。通过与仅使用新闻文本的对比实验结果表明,本文采用的多模态营销新闻识别方法的准确率更高,分类效果更好。
其他文献
人脸作为一个人的重要特征信息,且具有唯一性和自然性,因此人脸识别被广泛应用于身份认证领域。深度学习有着类似于人脑机制的特征提取和特征识别等特点并且近年来随着计算机
改革开放以来,中国积极融入到西方发达国家主导的全球产业链分工贸易中,对外贸易一度发展迅猛,但是目前中国在全球产业链分工体系中总体仍处于中低端,国际分工地位较低。中国制造业作为国民经济支柱产业,正在转型发展的关键时期,现有国家政策将制造业服务化作为制造业发展的一个方向。出口内涵服务价值是衡量制造业服务化的指标之一,本文考察出口内涵服务价值对中国制造业国际分工地位的影响。本文利用WIOD数据库中200
目前前沿的深度学习人脸识别系统对于硬件要求比较高,不适用低配的嵌入式设备。而嵌入式技术的应用,算法的改进研究,有利于嵌入式人脸识别系统的高效和灵活的利用。本文主要
电磁传感器是把被测物理量转换为感应电动势的一种传感器,灵敏度高、测量范围大,同时不需要特别维护,在自动化系统中应用广泛。本文以电磁流量传感器和平面电磁传感器为研究
电阻抗成像技术是一种新型的生物医学成像技术,具有无创、简便、廉价等特点。它通过对置于物体表面的电极施加电流激励,采用图像重构算法在计算机上重构出被测生物体内部的电
学位
学位
在经济较发达的湿热地区,城市人口庞大,住区人口密集,室外气温状况与居民的生活息息相关,改善居住区热环境,不仅可以有效地缓解住区室外热岛强度,同时也会增加居民舒适度。南宁地区夏天比冬天时间长,室外温度高等问题凸显,不同区域的住区室外气温有一定的差异性。本文以城市居住区中已建成的绿色住区为主要对象,利用CTTC修正公式参数化数值模拟方法,对建立的住区犀牛模型进行参数化模拟来找到室外热环境主要影响因素,
背景和目的:大量研究表明高甘油三酯血症(hypertriglyceridemia,HTG)相关性急性胰腺炎(acute pancreatitis,AP)较正常血脂AP更趋向于病情重症化和炎性反应扩大化,但其确切机
WTO争端解决机构(DSB)建立了一个高效的争端解决机制,正是由于这个机制,才使得DSB所作出的裁决和建议能够得到充分有效的执行。如何计算报复水平往往是WTO争端尤其是贸易争端