【摘 要】
:
随着5G技术和社交媒体的发展,网络视频已成为信息传播的主要载体之一。当用户通过信息检索了解某话题时,往往会返回大量杂乱无章的视频,使得用户只能在有限时间内观看较少的内容,降低了信息的获取速率。同时,嘈杂的视频可能导致用户易造成对某一话题或事件的片面认知。因此,基于网络视频的事件挖掘相关研究对于热点话题事件梳理及舆情导向具有重大意义。网络视频一般包含视觉信息和文本信息。对于视觉信息,视觉检测方法如以
论文部分内容阅读
随着5G技术和社交媒体的发展,网络视频已成为信息传播的主要载体之一。当用户通过信息检索了解某话题时,往往会返回大量杂乱无章的视频,使得用户只能在有限时间内观看较少的内容,降低了信息的获取速率。同时,嘈杂的视频可能导致用户易造成对某一话题或事件的片面认知。因此,基于网络视频的事件挖掘相关研究对于热点话题事件梳理及舆情导向具有重大意义。网络视频一般包含视觉信息和文本信息。对于视觉信息,视觉检测方法如以视觉近似关键帧检测为代表的算法易受视频编辑、拍摄角度等因素的影响,导致检测结果不准确。对于文本信息,其已被证明是建立跨媒体信息关联的有效方式,可在一定程度上补充视觉信息。然而,网络视频的标题和标签等文本通常由普通用户上传,多数视频仅有十几个嘈杂的单词描述,信息少、文本特征不稳定。此外,由于文化背景和用语习惯的不同,即使是同一个视频、同一种含义的表达也可能会被用完全不同的单词描述,这进一步加剧了文本和视觉信息之间语义关联的稀疏性。因此,仅使用二者之间现存的交互信息不足以有效挖掘其潜在特征,使得基于跨媒体关联的网络视频事件挖掘面临巨大的难题。为了解决这个问题,本文提出了一种新的基于多语义路径嵌入的跨媒体网络视频事件挖掘研究方法。经过数据预处理之后,本文构建了一个异构信息网络来建立视觉近似关键帧(Near Duplicate Keyframes,NDK)、文本和视频之间的关联。然后,本文设计了一种语义路径行走策略,生成有意义的语义节点序列进行嵌入,语义在网络中路径上的传递性可帮助捕捉到更多有意义的关联。其次,提出了一种嵌入融合方法来预测NDKs中每个单词的分布特征。最后,利用多重对应分析对网络视频事件进行挖掘。基于大量实验表明本方法具有普适性和有效性,在一定程度上提高了网络视频事件挖掘的效果。本文主要工作和贡献如下:(1)本文提出了一种新的基于跨媒体多语义路径关联丰富的视频事件挖掘框架,通过多种语义路径的联合嵌入来丰富NDKs与文本之间的语义信息。根据所知,本文首先尝试了通过从多个语义角度捕捉跨媒体关联来缓解视频中文本信息的稀疏性问题,并进一步提高网络视频事件挖掘的有效性。(2)本文设计了一种新的多语义路径行走策略以捕获NDKs、文本和视频之间的语义关联,此行走策略生成多个语义节点序列用于嵌入,其可关注有语义意义的关联,避开噪声路径。从而找到视频与文本之间更多的直接和间接关联,捕捉NDK可能丢失的语义信息。(3)本文提出了一种新的嵌入融合方法来预测NDKs中单词的分布值。该方法将多个语义路径上的不同嵌入集成到一个联合嵌入中,可以灵活地学习复杂的映射机制进行预测,从而降低了包含海量跨媒体数据的网络维度。
其他文献
高质量发展是“新时代”的重要主题。城市是国民经济和社会发展的主阵地之一,近年来出现了经济增长动力不足、城区盲目扩张、城乡发展失衡等问题。建筑业作为国民经济的支柱产业,其发展水平一定程度上也反映着城市建设水平。当前部分城市建筑业发展速度也明显减缓甚至出现负增长状态。上述情形表明,城市与建筑业以数量增量为目标的传统发展模式已出现内生动力不足的端倪。本文从高质量和耦合协调视角出发,以系统理论、协调发展理
随着社会经济的飞速发展我国环境问题频发,其中土壤污染存在程度不一、类型复杂、面积分散等现象,是土壤可持续利用的桎梏。为保证土壤资源的有序开发,原环境保护部在2009年提出土壤环境功能区划概念,随后在2011年出台意见要求建立土壤环境功能区划指标体系及完成区划工作,区划问题已成为环境管理领域的关注重点,亟需相关政策引导完善。我国的大气、水、生态区划已完成,而土壤环境功能区划才刚起步,现有研究大多从土
随着大气污染治理政策的相继颁布以及排放管控措施的持续收紧,我国在大气污染治理上成效显著,PM2.5污染浓度整体水平持续下降,但是仍有许多城市PM2.5浓度未达标,同时O3污染日益显现,成为仅次于PM2.5的污染物。O3作为二次污染物,与PM2.5的二次组分具有相同的前体物。因此,研究选择将十四五生态环境规划重要议题——“PM2.5与O3的复合污染”作为研究对象,以探究城市大气污染的高效管控对策。大
一个地区经济的发展与营商环境息息相关,而政策制度环境是营商环境的重要基石。近年来,我国中央及各地方政府均高度重视营商环境建设,以政策为载体,营商环境相关各领域内开展了多项改革。对我国营商环境政策文本进行分析并最终对此进行量化评价,能促进我国完善营商环境政策,从而推动营商环境的建设与优化。在此背景下,本文对我国2003年-2020年以来发布的营商环境政策文本进行了3个研究:(1)从文档级对我国三大经
短文本匹配旨在通过提取两个短文本的特征以预测它们之间的关系。短文本匹配作为自然语言处理领域的基础性研究,其效果的好坏直接影响了如文本蕴含识别、问答系统、信息检索等下游任务的性能。因此,短文本匹配任务作为自然语言处理的一项关键技术受到广泛的关注。目前的短文本匹配研究多聚焦于采用深度神经网络和注意力机制提取两个短文本的语义和交互特征,并通过设计不同的网络结构和交互方式构建短文本匹配模型。尽管现有的研究
中国是矿山灾害多发国之一,矿山开采过程中的采动灾害不仅严重影响开采的正常进行,而且会造成生命财产的重大损失。针对矿山采动灾害进行实时监测定位,对灾害防控有着重要的意义。但现有研究存在着不足,已有矿山监测系统大多基于GPS对时间进行同步,该方式会导致各监测节点时间同步性差。在灾害定位方面,存在着硬件监测和定位方法研究的割裂,使得相关研究在实际应用中受限。此外,矿山开采会形成大量的采空区和地质断层,影
预测和识别具体的国际贸易关系及其演化,可以帮助各个国家和地区知晓当前的贸易形势和明确未来的贸易发展趋势,使各国各地区在提升自身贸易水平的同时降低贸易风险。尤其是在贸易摩擦、新冠肺炎疫情等不稳定因素存在的背景下,整体把握国际贸易关系及其变化情况,有助于实现贸易的高质量和可持续发展,有助于促进本国的经济发展,有助于全球经济的整体复苏。当前,国际贸易网络的相关研究中很少对具体的贸易关系进行预测,且没有考
随着司法体制的深化改革在国家政策层面铺展开来,运用机器学习、人工智能技术的司法判决预测(Legal Judgment Prediction,LJP)逐渐成为实现司法智能化的重要环节。从全国司法系统来看,各地纷纷出现的自助判案系统与云法官系统等智慧司法技术慢慢的被纳入司法审判活动中,先进技术与司法实践活动的紧密结合,不仅对智能技术的迭代更新、发展引领具有推动作用,而且将大大减轻司法实践活动中案件数量
以股指期货为代表的金融衍生产品的出现推动了中国资本市场的繁荣发展,经历了2015年股指期货市场异常波动后,股指期货波动率预测与风险管理研究尤为重要。如何提高股指期货波动率的预测精度,建立有效的风险管理策略,对国家资本市场的发展、监管部门管控金融风险以及个人投资者制定投资策略都具有重要意义。近年来,大量学者利用高频数据研究股票价格等金融数据,应用到股指期货波动率的较少。在波动率预测方面,除了较为传统
金融衍生品交易策略研究是建立在自身的定价基础上的,二者密不可分。期权作为金融市场中重要的衍生产品,也是较为活跃的一类合约,学者们一直对期权定价的问题重点关注。因此关于如何对期权进行有效的定价,提高期权价格预测的精准度,从而制定相关的交易策略都显得至关重要。合理的定价和预测对投资者规避风险、套期保值,对维持市场的平稳运行,进一步提高市场效率都具有重要的参考意义。随着期权定价理论的不断发展,衍生出了许