面向产品需求分析的事件抽取研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ww5118529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会和科技的发展,我们的生活中到处都是电子产品,现代人的办公也是无纸化的。可是面对大量的信息如何获得我们想要的关键内容就是本课题的研究内容。事件抽取是信息抽取中的关键任务,它的目的是将非结构化的文本转换为结构化的文本并呈现出来。要抽取的内容是我们指定的,例如人物、时间、地点等等。利用机器学习方法来研究事件抽取时,需要有较大规模的人工标注的语料库,而目前可以利用的较大规模的人工标注的语料库非常少。利用统计模型进行分类时,怎样选择合适的特征准确地描述数据是分类任务的核心问题。针对这两个问题,本文做了相关的探索工作。首先,本文开发了一个文本标注工具,利用该标注工具构建了面向产品需求分析的事件语料库。构建语料库时,本文先对中文语句从结构上和语法上进行了分析,为后期的事件划分工作和事件标注工作奠定基础。其次,为了研究事件抽取任务,本文分别对事件类别识别和事件元素抽取的研究现状进行了总结,提出了抽象原则、信息增删原则、介词重要性原则以及信息对齐原则等事件抽取任务所遵循的几个原则,根据这几个原则我们提出了句子成分排序方法、介词特征和副词特征,通过对比实验来观察本文中所给出的特征对事件抽取任务的影响,实验数据证明了我们的方法是有效的。最后,本文设计并实现了一个完整的面向产品需求分析的事件抽取系统,在产品信息语料上进行了测试,实验证明该系统可以有效地完成相关的事件抽取任务。
其他文献
明清章回小说中有很多“榜”,“榜”是指小说中罗列了主要人物的清单,它们在每部小说中的名称各不相同,却都按照一定的规范和顺序排列人物,显得形式规整、井然有序。蕴含丰富
从人类社会学视野看,中、西方传统村落共同体内部建制都蕴含着共同良善特质。而随着西方资本主义的兴起,传统村落共同体加速瓦解,原本以血缘、地域、情感为纽带的共同体被人
格式条款的效力问题一直是未保价快递赔偿纠纷中的焦点之一,我国学界对未保价快递格式条款已有实证研究成果,但是大部分实证研究缺乏系统性和综合性。文章基于自建的未保价快
山东平度旧店金矿床位于招平断裂西南,是石英脉和蚀变岩型兼有的受断裂控制的金矿床。主要包括四条主矿脉。矿石中金属硫化物是矿区最主要的载金矿物。利用电子探针分析对矿
目的评价国产格列齐特缓释片治疗2型糖尿病(T2DM)的疗效和安全性。方法234例T2DM患者随机分为两组:对照组117例,口服格列齐特片,每次80 mg,每日2次;试验组117例,口服格列齐特
通过对蚌埠市龙子湖生态公园这一项目的概念设计,对城市生态公园进行了具体的实例规划设计。主要从总体设计的定位与设计理念,总体设计原则,总体功能分区,总体景观布局,植物
随着融媒体时代的到来,高校网络舆情引导工作也面临着严峻的挑战,作为主流意识形态聚集地,高校如何做好网络舆情引导工作是当下需要重点考虑的问题。融媒体是指各种不同媒体
<正>为进一步深化中国梦宣传教育活动,大力弘扬中华民族优秀传统文化,丰富广大人民群众的节日文化生活,2018年春节期间,玉溪市红塔区结合实际,广泛开展"我们的中国梦"文化进
大型高铁站在城市发展中快速建设成为功能复杂而体量庞大的建筑综合体。在高铁不断提速的同时,铁路枢纽的内部空间布局与组织对乘客的出行效率而言也愈发重要。空间句法理论
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield