面向医药领域的中文语义解析

来源 :东南大学 | 被引量 : 2次 | 上传用户:wj1982sp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理(Natural Language Processing,NLP)的主要目标之一是构建可以理解自然语言的自动化系统。目前构建理解自然语言的自动化系统仍处于研究摸索阶段。现有的一些系统可以处理某些领域中的子语言,但是这些系统都需要人工干预,而且具有较差的鲁棒性。还有一些性能较好的机器学习系统,这些系统仅能处理相对简单的NLP任务。一个自然语言处理系统,如果没有语义解析的参与,很难获得较好的性能。语义解析是指将自然语言句子转化成便于机器理解和推理的意义形式。英文语义解析的研究已取得较大进展,中文语义解析的研究工作却寥寥无几。医药领域有丰富的数据资源,这些资源都是以文本信息的形式存在,很难被计算机处理。本文提出一种面向医药领域的中文语义解析方法(Chinese Semantic Parsing for Medi-cine Field,CSPMF),此方法将中文句子转化成其相应的意义表示看作是一个机器翻译的过程。首先构造用于中文语义解析的医药数据集,数据集中每条训练数据包括一个中文句子及其正确的意义表示。然后利用词对齐模型来获取由中文自然语言字符串及其相应的意义表示所组成的双语词典。最后通过概率估计来确定最终的语义解析模型。针对中文语言的语法结构特点,本文加入预处理算法,提出了改进的面向医药领域的中文语义解析模型(Improved Chinese Semantic Parsing for Medicine Field,ICSPMF)。实验表明,ICSPMF有较高的准确率和召回率。
其他文献
20世纪80年代,美国著名发展心理学家、哈佛大学教授霍华德加德纳博士提出人类的智能是多元化而非单一的:主要是由语言智能、数学逻辑智能、空间智能、身体运动智能、音乐智能、人际智能、自我认知智能、自然认知智能8项组成。他认为每个人都应该拥有不同的智能优势组合,对学生进行教育时,在让学生优势智能得到发挥的同时,其他智能也能得到相应发展。在教学活动中,他主张教师的教学要关注对学生多元智能的培养,关注对学生
为了解我公司饮食服务人员乙型肝炎病毒(HBV)感染情况,现将1989~1996年监测结果报告如下.
潜用抛弃式有线浮标可作为水下潜艇隐蔽获取水面外部信息的一种特殊手段。本文介绍了潜用抛弃式有线浮标的功能和组成,对设计中的关键技术进行分析,并提出相应的解决思路。
介绍了基于Internet技术的PLC远程在线访问实训室的构建。该实训室采用工业通讯模块,依托Siemens PLC强大的通讯能力,通过Internet进行数据传送,真正实现了远程PLC的在线访问
在经济全球化的今天,各国贸易联系越来越紧密,各种运输方式层出不穷,成本低廉、运量巨大的海上运输方式,在集装箱运输的发展下,更是势头迅猛。海上风险频发,为了更好地应对海上出现的各种自然或人为风险,买卖双方往往会对船货进行投保,这就涉及到双方如何向保险公司求偿的问题,其中保险利益往往是争议的焦点,谁享有保险利益,谁就有权获取保险金。对保险利益的研究也是现在海上货物运输保险中的一大热点,本文将从保险利益
通过对四川省大中型水利工程移民安置验收情况进行统计,结合大中型水利水电工程蓄水阶段移民安置与竣工验收的条件对比分析,对竣工验收存在的难点进行了分析与探讨。旨在与同
目前我国新建电厂基本上采用电除尘除灰方式.针对不同电场粉煤灰的理化特点,通过试验研究,分析了粉煤灰承重墙体砖力学性能和耐久性能形成机理和影响因素,探讨了提高粉煤灰砖
用国产胶体金单克隆吗啡试纸对罂粟壳浸液进行快速检测及对可能的影响因素进行了检测实验。
农业现代化发展的最高程度就是农业信息化,农业信息化可以不断促进农村农业产业和信息技术之间的融合程度,推动农业的转型升级,对于农民来说也有着非常重要的现实意义。想要
一、洪涝渍害对红薯的影响红薯较耐旱怕涝,蒸腾系数稍低于一般旱地作物,田间耗水量的绝对值比一般旱地作物高,生长适宜的土壤水分一般为田间最大含水量的60%~80%,耗水高峰出