基于关系抽取的需求文本自动建模方法研究与实现

被引量 : 0次 | 上传用户:lillian0606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件生命周期的概念建模阶段,需求常常是以基于自然语言的文本形式表示的。这些需求文本汇聚了从各个干系人那里收集到的信息,由需求工程师分析并完成概念建模。随着软件系统复杂度的不断增加,需要处理的需求文本量可能会变得非常巨大,为了尽可能缩短分析和建模时间,减轻需求工程师的工作负担,越来越多的研究人员在需求文本自动建模领域做出尝试。其中,如何采用统一的方法完成建模过程,如何充分利用现有的自然语言处理技术(Natural LanguageProcessing, NLP)提取文本信息,如何描述人工建模过程中所使用到的领域相关知识等问题一直是自动建模领域的研究热点。针对上述问题,本文开展了以下研究工作:(1)提出了一个关系信息抽取框架,定义了一个原子的关系三元组,将建模过程转化为从文本中抽取若干原子关系信息的过程。该抽取过程被划分为文本分析、实体抽取和语义模型表示等三个步骤。对于关系实体在语法树上有确定的位置关系,属于短距离依赖的情况,以i*框架中的策略依赖(Strategy Dependency, SD)模型为例,采用基于规则的方法,有序地定义一系列语义规则,提出一个语义自动机匹配算法,获得语义模型表示;而对于关系实体属于长距离依赖的情况,则以新闻文本的事件时序关系建模为例,采用基于机器学习的方法,分层次抽取特征值,采用支持向量机(Support Vector Machine,SVM)算法预测关系类型。(2)框架中构建了三个面向领域的辅助建模资源:领域词典、修正规则库和背景知识库。本文引入基于转换的错误驱动学习方法,自动获取修正规则,形成修正规则库,来修正错误的分词和词性标注。通过处理维基百科的领域相关文档,以统计学的方法计算领域词典中词汇之间的相关度,并以基于规则的方法获得概念之间的能动关系,构成背景知识库。(3)本文设计并实现了基于该方法框架的自动建模系统CREAT3,可以支持策略依赖模型和事件时序模型的自动构建,并且提供丰富的用户交互功能。同时完成了一系列试验,将系统得到的模型和人工抽取结果进行对比,结果显示该系统可以获得相当高的准确率,同时也保证了很高的召回率,证明了方法的实用性和有效性,并且该方法采用统一的方法分解和处理建模问题,并辅助以领域背景知识,较相关工作具有更好的可扩展性。
其他文献
安全是城市发展的基础,而安全的社区是城市有效抵御灾害的基石,城市防灾体系的完善离不开其在社区的落实。社区作为整合各方资源的基层平台,是各部门开展防灾减灾工作的前沿阵地
目的 :探讨树突状细胞(dendritic cells,DC)并细胞因子诱导的杀伤细胞(cytokine induced killers,CIK)联合培养体内回输技术联合奥沙利铂(L-OHP)、吉西他滨(GEM)化疗治疗进展
抢劫罪是一个危害严重而又常见多发的罪种。虽然有关抢劫罪的理论研究颇为成熟,但是,由于社会的发展与科技的进步,抢劫罪的相关争议日趋激烈,故探究抢劫罪的争议问题具有较强的理
国内环艺专业设计类课程外延性教学模式能够实现可操作性改革,主要得益于国外成熟的职业教育教学模式,如德国的"双元制"、日本的"企业自主"式、英国的BTEC式、美国的CBE等模
<正>1925年,法国免疫学家兼兽医Gaston Ramon发现,在疫苗中加入某些与之无关的物质,可以特异地增强机体对白喉和破伤风毒素的抵抗。此后,免疫增强剂在医疗、保健方面的作用引
目前,化学修饰电极越来越受到人们的广泛关注,所以寻找具有特殊功能的化学基团或者材料修饰到电极表面,赋予电极某些特定的性能,从而构建简单、廉价、快速、稳定的不同修饰电极的
<正>2014年12月19日,由国家工商总局反垄断与反不正当竞争执法局主办的直销行业法律法规问题研究座谈会在北京举行,参与课题研究的27家单位出席了本次座谈会。据悉,随着直销
目的:探讨贝那普利联合常规治疗对儿童肾病综合征的疗效。方法:62例儿童肾病综合症患儿随机分为两组。对照组32例采取泼尼松、黄芪冲剂及肾复康等常规治疗,干预组30例在对照
相变存储器(Phase Change Memory, PCM)作为一种新型的非易失性存储介质,具有高存取速度、非易失性、可按字节寻址等特性。PCM利用特殊材料在晶态和非晶态的电阻差异来记录信息,
7月13日,由国家工商总局直销监管局组织的"部分省市工商机关打击网络传销工作座谈会"在重庆召开。《中国直销》杂志作为唯一获邀行业媒体列席会议。本刊记者在全程参与讨论的