新闻事件的因果关系抽取

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:sharethesun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言中充满了因果关系(Cause-Effect)的表述,每种现象或事物都有其原因,人们通过因果关系来描述事物运动和发展的规律。当前互联网上存在海量新闻数据,涉及大量事件相关的知识和信息,识别事件之间的因果关系能够帮助挖掘新闻中蕴含的逻辑知识,并刻画事件之间的发展逻辑。因此,本文主要研究对新闻中的事件进行因果关系抽取,并构建相关的事理图谱。针对事件识别任务,以往的研究工作集中在改善模型对文本的建模能力,没有有效利用能够触发相关事件的事件触发词。因此,本文第一个工作提出了一种触发词扩展机制,从语法连贯性和语义相似性两个方面分别对触发词进行扩展和约束,实验结果表明在有限的训练样本下,本章方法能够扩展得到更多该事件的触发词,并且加入扩展触发词信息能够有效提升模型对事件检测任务的性能。在此基础上,为了识别事件之间的因果关系,得到更加泛化的事件表达,本文第二个工作关注因果事件关系抽取,将原因和结果定义为由名词和谓语或状态组成的事件,并抽取含有因果关系的事件以及因果触发词。本文在扩展因果触发词的基础上,使用双指针标注网络并加入负采样机制进行论元的抽取,并提出论元共现模块对不同的论元进行组装,形成结构化的事件。在同花顺因果关系数据集上的相关消融实验结果证明了模型的有效性。基于因果论元抽取模型,本文第三个工作在大规模的新闻数据上进行了因果关系的抽取,在得到大量因果关系对的基础上,加入事件泛化、事件融合等流程,构建了金融领域为主的因果事理图谱。本文聚焦因果事件关系抽取,依次研究了事件的识别、事件之间因果关系的识别,并在大规模新闻数据上进行因果事件的抽取,最终构建金融领域的事理图谱。
其他文献
近年来,软件定义网络发展迅速,与软件定义网络相关的网络测量技术也开始备受关注,涌现了一系列研究成果,但是目前面临的一个问题是大量的算法并没有很好的服务于上层的应用,在灵活性、可扩展性上存在提升空间。为了解决这一问题,本文将联邦学习引入到软件定义网络的测量工作中来,设计了一个基于联邦学习与多维时序sketch的网络测量框架FLSketch,该框架将联邦学习与传统的sketch网络测量方法相结合,提升
张廷玉(1672年--1755年),字衡臣,安徽桐城人,大学士张英次子,清代名臣。张廷玉的家训著作《澄怀园语》,共四卷,约二百五十余条。以随笔札记的形式记录了其做官、训子、理政等方面的心得体会,是后人修身处世,齐家为政的重要经验参考。论文第一部分论述家庭伦理观产生的根源。张廷玉作为清代桐城张氏家族的一份子,其家庭伦理观的产生有着复杂的时代背景,平静安宁的康乾盛世以及统治者对家训的重视;独特的桐城地
随着半导体与移动通信技术的飞速发展,高电子迁移率晶体管(HEMT)因其具有击穿电压高、高频性能优异以及耐高温等优点,被广泛地应用于高性能电机、微波通信和毫米波器件等领域。所以,精确提取HEMT器件的参数并建立准确的非线性模型对上述行业发展有着重要意义。本文主要围绕HEMT器件符号定义器件(SDD)模型建立与直流参数提取方法优化展开了研究。首先,分析了HEMT器件基本工作原理以及二维电子气(2DEG
计算机视觉技术蓬勃发展,在医疗诊断方面,各种计算机辅助诊断的新技术也不断涌现。随着时代技术发展,医学诊疗技术日益提高,从医生单一经验诊断模式,逐步发展成医学成像设备辅助医生诊断的模式,到现如今,各种医学成像技术已是临床诊断中极具价值的手段方法。医学影像分析可以提高医生诊断疾病的效率和准确性,诸如用图像分割与识别技术获取并识别目标位置的轮廓,得到相应的临床参数,为医生提供可靠的参考。而在这一领域,深
环境保护是生态文明建设的重要内容,构建生态文明体制、建设美丽中国需要加大环境保护力度、完善环境治理体系。环境犯罪的刑法治理作为环境治理体系的重要组成部分,应当承担起保护环境法益的重任,更加有效地惩治环境犯罪,但刑法在环境犯罪的治理中却面临着困境,集中体现为单位环境犯罪的刑事追责不力、刑罚惩治不足,这不仅不利于打击、遏制单位环境犯罪,而且难以有效保护生态环境、取得良好的生态治理效果。究其原因,在于现
最高人民法院巡回法庭是未来法院改革的样板,是新时代背景下法院改革的创新之举。大家对这一新生制度饱含期待,期望着巡回法庭能够给司法改革注入活力和动力,推动司法现代化发展。最高人民法院的主要职能在于统一法制、制约权力和形成公共政策,故而不宜将过多的精力花费在定纷止争上。但近几年最高院受理的案件数量不断增加,制约了职能的发挥。为优化最高法院的职能,最高人民法院设立了六大巡回法庭。当前官方文件并没有确切的
信息透明化时代,零售商和消费者之间的信息差变小,消费者的消费意识、消费需求不断升级,消费市场的主导权逐渐转移。从以生产商、服务商、零售商为主导转变为以消费者为主导。新零售作为一种新兴的商业模式,是利用大数据、云计算、物联网等新兴技术提升价值链各环节效率,为消费者提供高效、高体验值服务,实现线上线下和现代物流完美融合的零售。但是,其零售的本质并没有改变,相对传统零售来说是一场商业元素的重构,其核心是
众所周知,现金在资产里的流动性最强,正由于高流动性使其成为公司在经营活动中的重要媒介。无论企业出于何种动机,它都会持有一定数量的现金,尤其在现代经济中,公司现金持有量不仅与公司的日常交易和经营活动有关,还与企业的投资活动、筹资活动、股利政策等密切相关,所以现金对公司具有举足轻重的作用。而进一步地,如何使公司维持在最佳现金持有状态是任何一家公司都必须考虑并且做出的决策。因此,无论是从理论研究角度出发
网络赌博是指使用互联网和现代交易方式进行的具有营利目的且违反相关法律法规的赌博活动。网络高新技术的发展使得许多传统犯罪与网络空间相结合,进而演化出新的犯罪现象,网络赌博犯罪就是这样产生的。近年来的网络赌博呈现出多样化、复杂化、易参与化等趋势,是一个高发性刑事犯罪问题。作为一种利用现代信息技术的犯罪,网络赌博需要刑法加以规制。实践中,网络赌博罪并不是一个刑法罪名,虽然网络赌博和我国刑法第303条在本
刑事证据种类是我国传统刑事证据学理论中的概念和制度。在“证据学”向“证据法学”转型阶段,我国现有刑事证据种类理论与实践“两张皮”现象突出,证据种类限制证据资格的功能形同虚设。对此,学界提出取消证据种类在立法中明文规定的立法体例、借鉴英美法系将“证据三分”或者借鉴大陆法系引入证据方法的概念作为证据种类的划分依据的完善措施。与大多数对策性研究不同,本文虽着眼于“刑事证据种类”,但以小见大,并未局限于刑