【摘 要】
:
随着互联网技术飞速发展,网络视频中用户规模爆发式增长,观看视频内容并对视频进行交流评论成为用户日常生活中的重要部分。在用户对于视频互动方式中,呈现出一种新的交互模式:视频同步评论(弹幕)。视频同步评论呈现方式类似滚动字幕,悬浮在视频画面上,这种互动方式能够极大增强用户的共享观看体验,也为内容提供商和其他决策者(如广告商、投资者、零售商、教育者等)了解即时视频内容和观众的反馈提供了良好的数据支撑。然
论文部分内容阅读
随着互联网技术飞速发展,网络视频中用户规模爆发式增长,观看视频内容并对视频进行交流评论成为用户日常生活中的重要部分。在用户对于视频互动方式中,呈现出一种新的交互模式:视频同步评论(弹幕)。视频同步评论呈现方式类似滚动字幕,悬浮在视频画面上,这种互动方式能够极大增强用户的共享观看体验,也为内容提供商和其他决策者(如广告商、投资者、零售商、教育者等)了解即时视频内容和观众的反馈提供了良好的数据支撑。然而,视频同步评论出现的时间较短,相关的探索依然存在许多空白。目前国内外相关研究通常把该文本作为一种普通文本进行分析,没有充分考虑其特性,同时与现实场景结合不够紧密。事实上,视频同步评论文本作为视频内容的补充,包含了对应视频内容中用户的情感观点和理解,能够有效的缓解大规模的图像和视频建模的复杂度,辅助与视频内容相关的分析。此外,视频同步评论具有特有的时间同步属性和语言特性,现有的文本处理技术很难直接应用。因此,借助于视频同步评论的特殊属性进行结构化建模,对于视频内容理解具有重要的研究意义。本文将针对面向视频同步评论文本的结构化算法展开研究,基于视频同步评论的特性设计相应的结构化算法,并进行视频内容理解的应用探索。具体而言,本文将从两方面的内容进行深入研究:(1)基于视频同步评论的内容主题结构化表示。对视频同步评论进行时序建模,探究时序主题结构化方法和时序划分的评论与剧情概要对齐模型。(2)基于视频同步评论的视频角色结构化表示。根据视频同步评论的语言特性进行建模,探究视频同步评论的实体情感和知识抽取算法。本文的工作简要总结如下:(1)视频同步评论主题抽取:针对视频同步评论数据中存在噪声数据干扰、时间依赖性强、主题变化迅速等挑战,提出一种挖掘隐含的主题和关键帧信息算法。实验结果表明,该算法模型在能够在时间维度上提取更加连贯主题,极大提高了主题抽取的质量,在真实场景中具有很大的优越性。深入分析视频同步评论独特的数据形态(如时间特性、情感特性、匿名特性、内容相关性),使得视频同步评论的研究具有实际的应用价值,为视频同步评论相关的结构化分析提供有力支持。(2)视频同步评论与剧情概要的语义对齐:针对视频中剧情的描述片段与评论语义相关度较低造成的剧情分割建模困难的情况,提出一种联合视频同步评论和剧情概要的对齐模型。模型将视频同步评论和剧情概要分别映射到隐空间并对其计算匹配损失,使模型更容易学习对齐关系。同时,为了防止时间线的错误累计,设计应用动态规划来寻找全局最优输出。实验证明了模型能够极大提升语义结构化对齐的效果,进一步辅助视频同步评论的主题发现语义分割等下游任务。(3)视频同步评论的实体级情感分析:针对视频同步评论中存在的实体情感分布不均衡现象,提出一种实体级别情感结构化方法。为了避免过拟合和减轻偏差,利用预训练模型在语义表征中的先进特性,提出了去偏差模型来建模弹幕文本。通过真实环境构建的大规模实体级弹幕语料库验证了方法的有效性。(4)视频同步评论的知识抽取:针对视频同步评论关系难以限定、存在错误用词以及歧义表达的问题,提出建立开放关系抽取和特定关系抽取的联合抽取框架,增强了内部交互。在视频同步评论知识抽取的过程中,一方面利用句法规则抽取出开放关系;另一方面,设计影视关系类别约束进行融合抽取特征,提出一种针对视频同步评论的影视特定关系抽取方案。模型对弹幕评论文本的句子进行的高维度信息嵌入,利用先进的BERT预训练模型,对视频同步评论标签和实体之间的关系建模,从而辅助建立更广泛的关系集合。在大规模视频同步评论数据上验证了本文方法的有效性。
其他文献
扫描电化学显微镜(SECM)自问世以来,已被应用于多种多样的生物分析问题。在分析生物样品中,包括活细胞和固定化的生物大分子,例如酶,抗体和DNA片段方面,SECM都已经取得了相当大的进展。与其他扫描探针技术相比,SECM不仅可以观察到生物的形貌,而且更重要的是可以高空间分辨率地收集到生物表面的化学信息。SECM作为一种成像技术,对提高SECM扫描成像分辨率一直是SECM研究工作者追求的目标之一。因
Warburg效应(又称有氧糖酵解)作为一种细胞特殊的能量代谢模式,首先被发现存在于所有肿瘤细胞之中。其特点是细胞大量摄入葡萄糖并通过糖酵解途径代谢为乳酸,并利用这一过程中所产生的ATP为细胞的生命活动提供能量,而即使细胞的生存环境并不缺氧,细胞线粒体中的氧化磷酸化反应也依然受到抑制。在过去的研究中已经发现了有氧糖酵解在粒细胞、巨噬细胞、树突细胞以及T细胞的免疫功能中发挥重要作用,但关于有氧糖酵解
随着电子储能设备需求的不断增长,比传统二次可充电电池具有更长循环寿命和更高功率密度的超级电容器而受到关注。但是超级电容器较低的能量密度阻碍了它们的实际应用。根据公式EA=1/2CV2(EA:能量密度;C:电容;V:工作电压窗口),超级电容器的能量密度可以通过提高电极材料的电容和/或扩大器件的工作电压窗口实现提升。采用高性能过渡金属基材料作为电极材料,组装非对称型超级电容器被认为是提高输出能量密度的
在台风数值模拟中,高分辨率全球数值模式相对于区域数值模式可以更好地捕获大尺度环流,避免侧边界效应,是对精细尺度台风动力学研究的有力支撑。基于SCVT网格的MPAS全球模式,既避免了区域模式边界处物理量的突变,又能在关键模拟区域加密网格,还节省了计算资源,是台风研究方面具有潜力的数值模式。为了将MPAS模式更有效地应用于西北太平洋的台风模拟,本文首先参考GFS模式,评估了MPAS模式对于大气环境场的
城市功能区是城市在发展过程中逐渐形成的居住用地、商业用地、工业用地、公共管理与公共服务设施用地等不同功能区。对城市功能区进行统一协调和合理布局,有助于提高城市土地利用效率,优化资源配置,实现城市全面均衡化发展,整体改善城市的综合实力。识别不同类型的功能区并研究其空间分布特征和相互作用规律,对于把握城市空间结构,制定科学合理的城市规划具有十分重要的意义。传统的城市功能区提取与分析研究主要是使用土地利
浮游植物粒级结构是海洋生态和生物地球化学过程中重要的生理参数,掌握其组成分布有助于理解海洋关键过程中浮游植物的功能和作用。一直以来,浮游植物粒级的研究依靠传统的现场原位调查测量,受制于相对有限的采样区域和环境,而海洋水色遥感具有高时空分辨率和高重访周期的特点和优势,日渐成为观测的重要技术手段,促使浮游植物粒级结构遥感反演在近年间成为海洋生态和地球观测领域的研究热点。在水色组分相对简单的大洋水体中,
河口三角洲是陆海相互作用的关键地带,人口分布稠密,物种多样性丰富,具有重要的社会经济价值和生态价值。同时河口三角洲也是极其敏感的动态地貌单元,其动力地貌格局在外部环境变化下易发生显著转换。尤其在近年来人类活动的高度干预下,入海泥沙通量锐减,河口水沙输运和泥沙源汇过程受到强烈影响,三角洲普遍面临蚀退危机。以高淤积速率闻名的黄河三角洲,在近年来由于入海水沙情势的改变已成为侵蚀速率最快的三角洲之一。黄河
细胞的力学性质是指细胞在力学刺激下所展现出的变形特性,细胞力生物学性质则是指在机械力刺激下细胞的生物学响应特性。在众多研究中,细胞的力学性质和力生物学性质已被视为简单、直接的生物标志,用以指示各类疾病的发生和细胞状态的改变。单细胞通过狭窄微流控通道的变形过程及其诱发的细胞钙响应过程蕴含了丰富的细胞力学性质和细胞力生物学性质等方面的信息。近年来的诸多研究指出,机械力刺激下异常的细胞内钙响应,对特定疾
近几十年来,人类活动导致活性氮排放不断加剧,使环境中活性氮浓度激增,并引发了一系列生态环境问题。作为海陆过渡的关键地带,河口地区氮污染问题尤为突出。微生物脱氮过程(反硝化和厌氧氨氧化)是缓解河口区域活性氮负荷的重要途径。因此,开展河口滨岸环境脱氮过程研究是当今国际上的热点和学术前沿。根据反应基质来源不同,脱氮过程分为非耦合脱氮(NO3-/NO2-直接源于上覆水)与耦合硝化脱氮(NO3-/NO2-源
全球变暖和海平面上升增加了海岸带风暴潮、水涝灾害和海水入侵的风险。杭州湾沿岸是我国遭受风暴潮灾害的典型区域,同时人口和经济高度密集,因此亟需掌握该区极端风暴事件的发生特征。作为我国新石器文化的重要分布区和稻作农业的发祥地之一,该区域文明的发展受到气候、海平面变化等环境因素的限制,例如,举世瞩目的良渚文明在距今约4400 cal yr BP突然发生衰变。在杭州湾滨海平原已发掘的新石器文化遗址中,普遍