基于事件图谱的新闻事件演化分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:gongxintao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络媒体及其技术的蓬勃发展,网络新闻已成为互联网内容大数据的重要组成部分。与此同时,由于新闻报道的时效性、片面性等特点,网络新闻的碎片化问题不断凸显,人们难以从纷繁复杂的新闻信息流中掌握事件发展的来龙去脉。利用事件演化分析技术挖掘新闻事件间演化关系并跟踪新闻事件的演化过程,有助于解决新闻碎片化问题。然而,现有事件演化分析方法还存在以下不足:第一,现有事件特征建模技术忽视了对事件元素间关系的建模和利用;第二,传统演化图谱构建方法生成的结构复杂度高,并且没有建模事件间多话题演化关系;第三,现有方法通常假设事件只属于单话题而非多话题,这可能导致生成的演化过程不完整和不连贯,进而影响新话题的检测与跟踪。针对上述问题,本文提出一种基于事件图谱的新闻事件演化分析方法,主要研究工作如下:(1)为丰富新闻事件特征表示,提出一种基于语义和句法信息的新闻事件表示学习方法。首先基于句法规则从新闻文本中抽取句子级事件三元组,并提取新闻关键词作为事件核心词;接着训练事件核心词预测和子事件的缺失元素预测模型,获得捕获语义和句法信息的事件嵌入特征。(2)为降低演化图谱的复杂度并建模多话题演化关系,提出一种多话题新闻事件演化图谱(Multi-Topic News Event Evolution Graph,MTNEEG)构建方法。该方法不预先进行话题聚类,而是直接计算目标事件及其相关旧事件间的演化强度,以保留多话题演化关系;进一步地,基于演化模式的合理性约束条件构建非冗余的演化关系,以精简演化图谱的结构。(3)为有效检测和跟踪多话题新闻事件的演化过程,提出一种基于MTNEEG的演化过程检测与跟踪算法。该算法将检测与跟踪任务转化为MTNEEG中边界事件识别问题,并利用多话题演化关系和连惯性度量机制来提高演化过程的完整性和连贯性,最终将MTNEEG划分为多个交叠的演化过程。(4)原型系统实现与实验分析。首先在双结构网络下设计并实现了基于事件图谱的新闻事件演化分析原型系统,然后对所提出方法进行了实验分析。实验表明,所提出的新闻事件表示学习方法能够有效提升下游任务的性能;演化图谱构建方法能够有效降低演化图谱的复杂度并建模多话题演化关系;基于MTNEEG的演化过程检测与跟踪算法显著优于基线方法。
其他文献
传统组织卖淫犯罪行为可以用《刑法》第六章中卖淫类法条进行规制,以达到刑法一般预防与特殊预防的目的。然而,随着社会风气逐渐开放,信息传播技术逐渐提升,立法漏洞的完善,执法打击的深入,组织卖淫的行为人为了逃脱法律制裁,人为改变了传统组织卖淫行为,使其行为方式、组织形式、组织对象都有了新的变化,呈现出一种更加隐蔽、更加便捷、更加不同寻常的态势,给执法和司法均带来新的挑战。组织卖淫罪作为传统、历史悠久的性
现代城市在增量发展背景下快速蔓延与扩张,加速了城乡之间的发展矛盾,与新发展理念相违背,亟需控制与转型。新型城镇化的深入推进,为城市的高质量发展提供了有效路径,也为城乡关系的变迁指明了方向。而城市边缘区作为城乡要素彼此渗透的区域,在人口与用地、产业与经济、组织与管理等方面呈现出城乡二元特性,已成为当前城镇化进程最活跃、城乡问题较为突出、城市管理较为忽视的重点区域,同时也是推进新型城镇化和乡村振兴实践
建设项目中,机会主义行为对承包商而言是极具诱惑力且可行的,使得建设项目成为机会主义行为的雷场。承包商的机会主义行为是项目成功的障碍,及建筑业低效率和低绩效的根源之一。相对于合同而言,关系在降低承包商机会主义行为方面具有交易成本低、灵活、自发等优势。特别在我国的商业活动中,中国式关系扮演着不可或缺的角色。然而,目前对中国式关系的运用却褒贬不一。一方面,中国式关系被认为是合作中的“润滑剂”,能够有效的
为了实现档案的自动盘点和定位,提高档案查阅工作、盘库的效率,本文对档案机器人的一些关键技术展开研究,设计并实现了在全库范围内智能盘点档案,提高了档案实体管理的准确性和系统性。首先,为定位档案盒以及盘点盒内档案文件,提出将条码识别和RFID技术相结合并设计盘点仪器。利用条码识别器识读以实现盒定位,并设计可盘点高密集标签的RFID识别系统。针对高密集标签识别困难、漏读标签等问题,分析ISO 18000
开发区、产业园和工业园等园区的开发都必然会伴随着周边的土地征用、原住民的拆迁安置,随之就会产生一系列的社会影响。对园区开发产生的社会影响不应该仅仅关注开发初期的影响,更应该考察在较长的时间内对作为社会影响载体的社区及其居民产生的累积性社会影响。目前,人们对累积性社会影响的研究尚少,对其社会影响累积过程及其复杂的因果机制尚缺乏认知。本文以大型园区开发所形成的安置社区作为研究对象,从时间维度探讨园区开
从国务院2017年发布的《关于加快发展冷链物流保障食品安全促进消费升级意见》中可知,为了统筹规划好冷链物流的基础设施建设,建立好覆盖全国各地的基础设施网络、促进行业科学发展、保障人民群众的食品安全,补齐“最后一公里”短板是行业健康发展不得不面对的一个问题。在这样的背景下,论文首先从“最后一公里”出发,大量梳理文献后发现,前人的研究大多集中在确定性因素上,对不确定因素,尤其是时间窗的研究还非常不足,
配送中心是我国物流业重要的一环,对于我国物流整体效益的提升有着重要意义。近年来,各级政府、行业陆续出台了许多发展配送中心的相关政策,使得配送中心的发展日益蓬勃,为我国物流效益的提升助力。然而在快速发展的进程中,由于建前缺少科学理论指导和整体合理规划,大多配送中心在建成后出现业务流程衔接不顺畅、作业效率低、物流动线交叉、设备设施配备不合理等问题。因此,研究配送中心布局规划对于提高配送中心整体能力具有
改革开放以来,城市居民生活水平不断提升,人们越来越重视健康的饮食,使得城市居民对生鲜产品的需求不断增加。在此契机下,生鲜产品的同城配送行业随之迅猛发展起来,越来越多的企业意识到了其巨大的市场潜力,开始投资布局此行业。而随着我国城市化进程的推进,尤其是在我国土地与住房制度改革之后,城市居民的生鲜需求空间分异现象随着城市居民社会分层以及居住空间分异的情况而加深,呈现出了以社区为单位的空间分异新现象。城
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术被认为是未来无线通信系统极具发展潜力的技术之一,在不增加带宽的情况下极大地提升了系统的吞吐量,因而受到了研究人员的广泛关注。然而在大规模MIMO系统中,传统通信技术理论在大数据处理和超高速通信等方面表现出一些固有的局限性,亟需研究人员寻找更高效的解决方法。近年来深度学习方法作为人工智能(Artifici
工程造价咨询企业在建设项目造价的合理确定、有效控制和管理中,维护建设各方的合法权益等方面发挥着重要作用。由于目前造价咨询市场的行业信息壁垒重、恶性低价竞争、咨询服务质量参差不齐等现象频发,委托人选择工程造价咨询企业时成本高、效率低。另一方面公共资源交易项目涉及国家财政资金、关乎公共工程安全,对工程造价咨询企业的能力、服务质量要求更高。因此,基于公共资源交易平台的工程造价咨询企业选择应加以重视。本文