基于结构和语义信息的模糊限制信息范围检测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:RichieHDD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊限制语是指一些“有意把事情弄的模模糊糊的词语”。由模糊限制语引导的模糊限制信息表达不确定的、含糊的或推测的观点。生物医学文献中含何许多模糊限制信息。在生物医学信息抽取巾,为防止把模糊限制信息作为真实信息使用,模糊限制信息检测具有重要意义。模糊限制信息检测可分为模糊限制语识别和模糊限制信息范围检测两个任务。模糊限制语识别已经取得较大发展,而模糊限制信息范围检测比较复杂,性能仍有待提高。本文通过深入探索模糊限制信息范围的句法结构和语义信息,研究模糊限制信息范围检测任务,研究工作包括如下内容:研究摹于依存结构的候选边界选择算法。传统的范围检测研究是把模糊限制语及其左(右)侧的词作为范围的左(右)候选边界。这会产生大量负样例,正负样例数量不平衡,误导分类器。相邻的正负样例具有相似的结构和上下文信息,分类器难以区分。本文提出基于依存结构的候选边界选择算法,利用词之间的依存关系选择候选。实验显示,正负样例数量的比值由1:15变为1:3,性能提高2.76%F1值。这表明候选边界选择算法能够大幅度减少负样例数量,提高正负样例的区分度,提高范围检测性能。研究基于结构信息的模糊限制信息范围检测。模糊限制信息范围在结构上是与模糊限制语相关的一个短语或从句,因此范围检测对句法结构具有较强的依赖性。本文利用卷积树核函数,基于依存和短语结构,探索了模糊限制信息范围的结构化表示方法。实验显示,基于依存结构、短语结构以及依存和短语结合的检测性能分别达到64.57%,63.51%和66.67%F1值。这表明依存和短语结构对范围检测都是有效的,依存结构和短语结构具有互补关系,它们的结合能进一步提高系统性能。研究了基于语义信息的模糊限制信息范围检测。模糊限制信息范围在语义上是包含模糊限制语的一段完整连续的语义片断,因此范围检测对语义信息具有较强的依赖性。本文基于LSTM深度学习模型,探索了模糊限制信息范围的语义表示方法。此外,为了综合基于词汇、句法及语义系统的优势,融合三者的检测结果。实验显示,基于语义表示的检测性能达到65.23%F1值,三个系统融合的性能达到70.49%F1值,优于其中任意一个系统的性能。这表明模糊限制语语义信息对范围检测是有效的,三个系统融合能实现词汇、句法和语义之间的优势互补。这些研究有效地提高了范围检测性能,同样这些研究也适用于其它与结构和语义信息相关的任务,如关系抽取任务等。
其他文献
无线传感器网络(Wireless Sensor Network)是一种自组织网络系统,在军事、医疗和公共安全等重要领域已被公认为具有广阔的应用前景。传感器节点被部署在战场等监测区域,实时
随着企业信息化进程的加快,企业的业务流程变得更加复杂化,现有的工作流管理系统技术在实际应用中存在着柔性不足、集成能力有限、互操作性不高等缺点,不能满足现代企业分布式复杂应用的需求。因此,研究分布式工作流管理系统技术对企业信息化具有重要意义。事件驱动的分布式工作流管理系统是指在分布式的、异构的、动态环境中,引入主动数据库中的ECA(Event-Condition-Action)规则来描述工作流中的任
互联网技术的飞速发展给人们的日常生活带来了极大的便利,与此同时巨大的信息量使人们迷失在信息的海洋中,造成人们需要浪费较多的时间找到自己需要的信息。随着Web2.0的迅速
随着网络通讯技术的迅猛发展与多媒体数据数字化的日益普及,使得信息的传递变得非常便捷,但与此同时,数据的安全性问题也逐渐暴露出来。特别是信息隐藏技术的广泛应用及其快
随着互联网技术的飞速发展,全世界各行各业,不同领域的人们无论是在工作、学习、还是生活上的方面面都已经离不开网络。移动网络业务在这个快节奏的时代,格外受世人瞩目,它的
随着互联网规模和重要性的不断增长,在线商品评论的数量和影响日益剧增。在线商品评论通常是消费者做购买产品或服务的决策时十分重要的影响因素,也是确定这些产品或服务民意
Web服务在松散耦合的、与语言和平台无关的应用中被越来越广泛的采用,随着Web服务给人们带来便利的同时,也面临着安全问题的巨大挑战。安全问题不仅是制约Web服务发展的主要瓶
入侵检测(Intrusion Detection,ID)是信息安全不可缺少的技术之一,已成为近年来网络安全技术的新热点。现有ID大多基于规则检测,存在检测速度慢,检测准确率不高,误报、漏报率
网格技术是现在国际前沿性的研究课题,随着网格技术的发展,网格开始应用于各种领域,其中最重要的一种就是面向数据密集型应用而产生的数据网格。数据网格可以对异构的、分布
视频监控是安全防护的重要组成部分,是一种防范能力较强的综合系统。视频监控凭借着直观、准确、及时和丰富的信息内容而广泛的应用于许多场合。该技术广泛地应用于各行各业,