【摘 要】
:
近年来,各种多模态内容社区伴随着移动互联网的发展和通讯技术的变革应运而生并且正在逐渐成为人们主流的社交工具,而评论是这些内容社区中最常见的组成部分之一,它对于鼓励用户创作、增加用户的浏览兴趣以及传播作者的观点都有着不可忽视的作用,但是一般来说,用户发表的评论质量往往良莠不齐,而且有大量发表作品的用户缺乏评论互动,这非常不利于内容社区的建设。因此,构建一个良好的自动评论系统已经成为一种需求。随着近几
论文部分内容阅读
近年来,各种多模态内容社区伴随着移动互联网的发展和通讯技术的变革应运而生并且正在逐渐成为人们主流的社交工具,而评论是这些内容社区中最常见的组成部分之一,它对于鼓励用户创作、增加用户的浏览兴趣以及传播作者的观点都有着不可忽视的作用,但是一般来说,用户发表的评论质量往往良莠不齐,而且有大量发表作品的用户缺乏评论互动,这非常不利于内容社区的建设。因此,构建一个良好的自动评论系统已经成为一种需求。随着近几年机器学习和深度学习技术的发展,研究者们在评论排序、评论生成等方面都取得了巨大的进步,然而,很少有工作能够着眼于多模态的角度,同时利用文字、图像或视频的信息与评论进行关联。因此,本文的主要工作是对多模态内容社区的自动评论系统进行定制,这个系统旨在解决跨模态的语义关联问题,当评论区存在适量评论时,系统可以对评论集合进行内容相关性排序,当评论区缺乏评论时,系统可以根据作者发表的内容生成高质量的评论。本文在相关工作的基础上,将自动评论系统的构建主要分为三个部分。首先,在多模态内容社区中,一条高质量的评论往往和作者所发布内容中的图像或者文字相关,也就是用户提供的文本和图像存在语义一致性的特点,因此,本系统针对此思路进行设计,通过对分类模型构建的传统标签体系进行标签扩展,构建了细致、灵活、具备一定语义扩展能力的图像标签化模块,用于解决跨模态的语义关联问题;其次,着眼于评论的内容相关性排序,通过对评论信息量、评论与作者所发布内容中的文字信息的相关性以及评论与图像标签的相关性这三部分进行评估,构建了评论排序模块,用于对用户评论进行筛选;最后,为了使得系统能够为缺乏评论的作者生成合适的评论,本文基于第一部分得到的图像标签以及微软发布的UNILM模型,构建了口语化特征明显、具有丰富多样性的评论生成模块。本文还对图像标签化、评论排序、评论生成等模块分别进行了评测和应用效果展示,进一步论证本系统的有效性和实用性。总而言之,本文实现了面向多模态内容社区的自动评论的系统,该系统通过构建图像富文本语义标签模块,能够较好的解决跨模态的语义关联问题,进而灵活地为评论排序功能和评论生成功能提供指导。
其他文献
目的:观察儿童抽动障碍复发的相关因素;探讨中医药治疗对复发的影响,为临床减少复发提供初步策略。方法:采用回顾性研究的方法,收集就诊于天津中医药大学第一附属医院儿科抽动症专病门诊病例共388例,其中经治疗后控制未复发的病例213例,复发病例175例,出现复发者全部纳入研究,未复发者随机选取175例纳入研究。观察患儿的性别、年龄、胎产情况、出生时健康情况、家族史、情绪、所处环境变化、心理因素、呼吸道感
病媒蚊中的雌蚊通过刺吸人类的血液传播疾病,对人类健康构成威胁。目前世界上病媒蚊传播的病毒已知的种类有40余种[1]。蚊虫对世界的公共卫生有着巨大的危害性,在2015年寨卡病毒通过蚊虫传播造成南美洲约200万人感染[2]。现阶段控制病媒蚊的手段还是以植物源杀虫剂(例:除虫菊酯)、微生物源农药(例:苏云金杆菌和球形芽孢杆菌)、昆虫调节剂(例:避蚊胺)为主[3],大量使用药剂会使蚊虫产生耐药性;传统的除
近些年来,空气质量恶化已成为全球问题。许多研究表明小粒径污染颗粒由于其有机化学物质含量高和氧化能力强的性质,对心血管的危害更大。因此雾霾中的超细颗粒是需要关注的重要成分之一。射血分数保留型心力衰竭(Heart failure with preserved ejection fraction,HFp EF)的发病率和死亡率正在上升。受污染空气中存在的超细颗粒更容易从人们的呼吸道直接进入血液,对血管内
尼泊尔是夹在中国和印度两个大国之间的内陆小国,但印度对尼泊尔的地缘影响力远远大于中国,尼泊尔经济上依赖印度,文化上与印度相似,在印度的南亚霸权威胁下,尼泊尔一直选择追随印度。而近年来,随着尼泊尔左翼政党上台以及中国提出“一带一路”倡议,尼泊尔外交逐渐从追随转向了平衡,对华友好,与中国开展政治、经贸和文化领域的深度合作,以此平衡印度的传统影响力。同时尼泊尔坚持在平等的前提下,与中国和印度两个大国都保
为提升聚光太阳能热发电在可再生能源电力中的成本竞争力,进而促进全球范围内的碳达峰和碳中和目标早日实现,第三代聚光太阳能热发电技术(CSP Gen3)的概念应运而生。CSP Gen3主要有两个技术特点,超临界CO_2动力模块和高温储热模块。根据储热介质的不同,CSP Gen3存在三种技术路径,高温熔融盐式、颗粒式和气相式。本文的研究对象便是颗粒式CSP Gen3两种设计思路中的关键部件和关键行为。关
19世纪末期,俄国为了维护国家安全和远东地区的利益,在中东铁路、旅顺口、大连港获得了特权,严重侵犯了中国主权,中国东北问题就此产生。1945年,苏联与国民政府签订《中苏友好同盟条约》,苏联在中东铁路、旅顺口、大连港的特权被确定下来。新中国成立前夕,中共领导人开始考虑同苏联结盟。1949-1950年,中苏双方就结盟进行了三次关键性会面,分别是米高扬访问西柏坡、刘少奇访问莫斯科、毛泽东访问莫斯科。东北
随着经济全球化区域化推进,世界上出现以都市圈为核心带动区域发展的经济模式,我国也加快对都市圈经济模式的建设和发展,2019年2月,发改委发布《国家发展改革委关于培育发展现代化都市圈的指导意见》,强调要强化城市间产业分工协作,推进公共服务共建共享,实现城乡融合发展,构建都市圈一体化发展机制。但在都市圈建设中存在产业同构、产品同质,跨区域协调障碍,科技创新动能不足,产品附加值低,影响都市圈建设进程和区
深度学习模型的可解释性一直是人工智能领域不可忽略的重要问题,自预训练模型问世以来,该问题更是引起了广泛的关注。目前该领域的发展还处于初级阶段,多数已有的方法只专注于分析模型的预训练过程而忽略了预训练模型的微调过程。而作为将预训练模式应用于具体任务的关键步骤,微调过程具有重要的研究价值。研究能够用于分析预训练模型微调过程的分析方法,能够通过分析预训练模型微调前后的差别了解模型的内部机制和原理。进一步
随着在线教育行业智能化和信息化的发展,学习预警技术成为近年来在线教育研究和应用的一个热点领域。本文针对学习预警领域中的两个热点问题分数预警和退课预警进行研究,其中分数预警存在预警颗粒度较大,退课预警存在预警精度不高等问题。本文设计基于机器学习的学习预警系统,可以根据用户的相关行为数据,通过数据挖掘的方法建立分数预警模型和退课预警模型,依照模型的预警效果,对学生和教师发送相关预警结果,有助于提升教学
神经网络由于其出众的效果,被越来越多的应用到各种领域,其中甚至包括安全敏感的领域,例如自动驾驶、身份验证(人脸识别)、恶意代码检测等领域。但近几年,学者们发现神经网络非常容易被欺骗。例如一个微小的扰动,就可以使图像分类器发生错误。这种安全问题如果被恶意攻击者利用将会产生十分严重的安全事故。而研究强力的对抗样本攻击,是促进神经网络安全性的发展必不可少的组成部分。为了设计更加强力的对抗样本攻击方法,本