基于跨事件的新闻事件因果关系识别方法研究

来源 :昆明理工大学 | 被引量 : 3次 | 上传用户:zhurx180
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息抽取近年来一直受到国内外学者的广泛,国际上专门设立了 ACE评测会议来促进该领域的发展。事件关系是信息抽取中非常有意义的研究内容,主要包括事件时序关系、事件因果关系等。新闻事件因果关系可以帮助人们很好地理解新闻,把握新闻事件演变规律。在信息抽取,特别是自动问答系统有着广泛的应用前景。因此,新闻事件因果关系识别研究也成为一个热门研究点。现有的事件因果关系识别主要利用当前事件对的局部信息进行识别,识别效果不高,对于新闻报道中包含的其他信息没有进行充分运用。本文将引入跨事件方法对新闻事件因果关系进行识别,当局部信息不足以识别因果关系时,积极寻找新闻报道中的其他信息进行辅助识别。语料库是机器学习算法的基础。本文使用ACE2005会议提供的中文评测语料,该语料已经对实体、关系和事件进行了标注。本文针对该语料库进行了详细地分析,特别是与因果关系识别任务相结合的部分。围绕着语料库构建、融合跨事件方法的新闻事件因果关系识别展开了研究,主要完成了以下研究工作:(1)新闻事件因果关系语料库构建。在分析了 ACE2005中文语料库的特点以及新闻事件因果关系识别的实际需要的基础上对语料进行了事件要素抽取,如事件类型、事件极性、事件泛型、事件触发词、事件触发词词性等事件要素属性,并组织人员对语料进行事件因果关系标注。最终将标注的结果进行了存储,构建了新闻事件因果关系语料库。(2)基于跨事件的新闻事件因果关系识别。本文将跨事件方法引入到事件因果关系识别任务中来,选择特征空间构造最大熵分类器,进行句子级别的因果关系识别。设定阈值,对于获得的概率值高于阈值的,直接采用分类的结果;同时构建文档级别的分类器来进一步处理低概率的部分。(3)整合了上述两个的研究成果,设计并实现了新闻事件因果关系识别原型系统。
其他文献
江苏如东县贫河镇兴发村的郭生如发现木粉加工销售市场行情好,就多方筹资,办成南通地区唯一的木粉加工厂。
16年前,地处我国西部云南省的宁蒗彝族自治县和东海之滨的江苏省海安县开始了划时代的合作。宁蒗彝族自治县大胆实践了群体引进海安教师到宁蒗创办示范性新型学校的构想,取得
江苏省武进市前王镇王为发读者来电:3年前,村小组把一块地废地交给我复耕种植,没签协议。最近村里把这块地加高,要搞绿化。请问:我可以得到一定的补偿吗?
1.热应激对肉鸡生产的危害所谓热应激是指环境温度高于机体所承受的温度范围对机体产生的一系列危害和损伤的应激过程。肉鸡背覆羽毛、无汗腺、生长快、体型大、皮厚、皮下及
<正>作业是巩固消化所学知识的有效手段,同时又是培养学生能力,提高学生素养的最佳载体.在课程改革和提倡素质教育的大背景下,高中化学作业设计要与时俱进,才能更好地发挥其
<正>彩绘作为一种古老的建筑装饰艺术,在我国古典建筑中应用较为普遍,但在传统民居建筑的门窗上则很少使用。彩绘广泛流行于新疆天山南北维吾尔族民居大门的装饰之中,虽然历
<正>"题"的本义是"额头",而"目"指眼睛。把文章的题目比作一个人的额头和眼睛,可见题目对于课文的重要意义。"题好一半文",好的文章必有一个"圆润光滑"的额
律师:我承包一处荒山,合同期五十年.合同有效吗?协议规定发包方提供水、电源和道路畅通,但有一当地村民断路不让我走,该怎么办?
随着我国自主设计的北斗卫星导航系统稳步建设,北斗接收机相关技术取得突破,但当前北斗接收机校准体系尚不完善,相关测试方法亟待研究。本文提出卫星导航信号模拟测试法,通过
PCR/SSP(Sequencespecificprimer,序列特异性引物)是一种新的基因多态性分析技术,可用于HLA复合体及其他具有多态性特点的基因分型。我室于1993年建立这种方法,并对正常人、重症肌无力患者、全身性红斑狼疮患者、骨髓移