基于场景化知识表示的自然语言处理及其在自动文本校对中的应用

被引量 : 0次 | 上传用户:gzhp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理就是用计算机处理自然语言,以理解自然语言中表达的知识和含义,或者将知识用自然语言表达出来。因而综合知识表示的自然语言模型是自然语言处理研究的一个核心问题。然而目前尚缺乏一种从知识的语言表达的角度而设计的自然语言模型。本文从分析人使用语言表达知识的自然过程出发,提出了一种知识语言表达的总体模型,并据此提出了场景化知识表示体系。同时,将该语言模型和知识表示体系应用于基于语义的特殊领域文本校对中,取得了良好的效果。 我们认为,人使用自然语言表达其认知的一个核心步骤是提取认知中的关键信息。这些关键信息同样也是人进行逻辑思考的基础。我们分析了自然语言表达知识时所需要的各类关键信息,并采用场景的形式来组织这些信息,从而形成了场景化知识表示的结构。从知识中提取出关键信息被称为知识的场景化分析。它主要包括三个步骤,即:组成识别、特征识别和场景识别。它们分别提取出知识的组成信息、知识的组成元素的特征信息以及它们在特定场景中的角色信息。 在此基础上,我们研究了基于知识场景结构的形式化推理方法,包括:继承推理、例证推理和否定推理。同时也定义了将场景知识结构转换为一阶谓词逻辑表达式的转换规则,为使用自动推理的方法进行语义判断提供了基础。 以知识的场景化描述为核心,提出了使用语言描述知识的的总体模型。在该模型中,知识的语言描述共包括五种主要的方式:名称描述、指代描述、主类描述、内在结构描述和相关知识描述。其中前三种描述方式统称为词汇化描述,因为它们均直接使用词汇来表达知识。后两种统称为结构化描述。其中,内在结构描述通过对知识的场景化分析,将知识的场景结构通过语言转换模板转换为语言的序列结构。这种描述方式主要产生语言中的句子结构。相关知识描述则使用知识的相关知识对它进行描述。其方式和过程与内在结构描述相同。它主要产生语言中的短语、定语从句、插入语等结构。 在这一模型的基础上,我们还分析了汉语中的各种句型和短语结构,提出了相应的语法场景模板和语言转换模板。通过这些模板,可以实现知识的场景化表示与自然语言之间的双向转换,从而使场景化知识表示成为一种真
其他文献
京秦高速公路潮白河特大桥工程过河施工中,围堰导流的设计是重难点。分析了河道不同时期流量特点,汛前采用土围堰全段围堰法导流,汛期采用钢管桩桩膜围堰的三段两期分段围堰
由于“后现代”现象已成为现代工业设计的重要方面 ,所以文章立足于现代工业设计 ,着重分析和研究后现代主义的产生、发展以及一些设计现象 ,从而使人们对“后现代”概念有深
<正>随着人们生活水平的提高以及生活方式的改变,糖尿病(diabetes mellitus,DM)发病率逐年上升,目前我国约有400万糖尿病患者。糖尿病肾病
北京大学管理案例研究中心于2002年评选出20家中国最受尊敬企业,其中有11家公司在中国沪深股市上市,《经济观察报》认为这11家公司2002年的财务报告符合真实、公允的要求,以
在和平与发展的国际共识下,非传统安全的重要性日益凸显,尤其是自然战略资源安全,已成为全球高度关注的焦点。水资源作为一种特殊的自然资源,不仅对人民的生命和健康以及生态
语文教学不可以没有诗,写作教学也不能缺少诗。学写诗歌要把握三组关系的平衡:在诗歌体裁的选择上,要注意旧体诗与新体诗的平衡,把握好学习的度;在写作要求方面,要做到整体和
社会主义的本质是实现共同富裕,收入分配是实现共同富裕的重要手段,党和国家一直以来都给予高度的关注和重视。在党的十八大报告中,鲜明的提出了“多渠道增加居民财产性收入
农业产业集群发展影响区域经济发展的文献已屡见不鲜。相对于国内农业产业集群发展的研究,水产品养殖产业集群的研究文献十分匮乏。水产养殖业作为农业经济的一个产业,是农业
<正>佤语的“洗”、“砍”是日常用词。“洗”、“砍”在现代汉语中的基本含义分别为:“用水去掉污垢”;“用刀、斧等猛剁、用刀劈”(《新华字典》)。在佤语中根据洗、砍的对象
期刊
目的:探讨瘤内注射vivo-jetPEITM/pEGFP Mfn2复合物对裸鼠移植瘤增殖的影响。方法:质粒pEGFPMfn2的构建及检测,将MCF-7细胞异种移植到裸鼠体内,建立人乳腺癌移植瘤模型,用viv