基于知网语义关系的中文事件信息抽取研究

被引量 : 0次 | 上传用户:xcnyy_007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的不断发展,网上的文本信息数量成指数级增长,大量非结构化信息的激增使得“信息爆炸与知识饥渴”的矛盾日趋激烈,因此如何自动地使非结构化信息结构化是目前重要的研究课题,事件信息抽取研究正是在这种背景下产生的。作为信息抽取研究的一项高级任务,事件抽取的评测还不理想,尤其是中文事件抽取,基础研究和任务要求之间存在较大矛盾。目前还没有成熟的实用系统出现,相关领域还有待进一步研究。本文采用模式匹配和机器学习相结合的方法进行中文事件信息抽取研究,事件信息抽取的基本思路按照模式匹配方法的基本过程展开,在进行事件语义角色标注和事件具体信息槽填充过程中运用统计学方法。本文针对事件信息抽取研究中语义缺失的问题,引入知网语义关系知识资源来识别信息之间的语义关联。中文命名实体识别过程中,利用模式匹配方法结合基于知网的词语相似度计算方法,对事件基本信息(包括事件的时间、地点等)进行了识别,此过程是事件信息抽取的基础工作,在实验评测中取得了较好效果。本文提出利用知网中的事件类概念语义资源对事件进行语义标注,解决了事件信息抽取研究中触发词探测和语义角色标注困难的问题。最后针对具体研究对象——同事件多文本灾难性事件,构建层式框架表示各类信息,进而采用层式有限状态自动机方法进行事件信息的抽取。
其他文献
结合谐波叠加法(Weighted Amplitude Wave Superposition,WAWS)和自回归方法(Auto Regressive,AR)的优点,提出高效高精度新型混合法。在频域上开窗,将计算定义域划分为局部定
目的:观察分析中西医结合治疗胫骨平台骨折的方法及临床疗效。方法:选取中西医结合治疗胫骨平台骨折患者42例为观察组,分析其治疗方法,并选取30例常规西医治疗患者为对照组,
本文主要介绍数据仓库和数据挖掘技术的框架,模型建设,并对商业银行客户关系管理CRM系统介绍分析,重点阐述了商业银行如何通过先进的数据仓库、数据挖掘技术来实现真正分析型
<正> 五四时期是中国近代史上的伟大变革时期,各种解放运动蓬勃兴起,妇女解放运动也一破过去的沉寂局面,以崭新的姿态出现于政治舞台,并显示出与这个时期的社会政治、经济关
目的:观察电针痉挛型脑瘫儿童躯干控制能力的影响,并对其机制进行研究。方法:将2012年3月至2014年5月痉挛型脑瘫患儿60例,按照入院时间的先后顺序随机分成电针康复治疗组、康
影子银行是个舶来品,它变相增加社会融资规模总量,损害宏观调控效果,期限错配导致流动性风险,引发社会问题和市场风险。从政府监管角度而言,为了防范影子银行风险,不能仅仅关
<正>高效率学习是指在科学的学习理论的指导下,依据学习规律和心理发展规律,应用科学的学习策略、方法和技巧,发挥学生学习的主观能动性,从而在单位时间内能更轻松愉快地获得
素质教育的发展和课程改革的推进,要求小学语文教学进行创新,这就要求小学语文教师从多个方面加强对教学的改革。从三年级的语文教学着手,探讨了小学语文教学创新的有效途径
<正>新学期伊始,我怀着激动心情期待语文课的到来,因为我将与新一届学生见面,了解他们的情况,谈谈自己的语文教学改革的设想。这节起始课自己比较满意,学生对我的改革设想提