面向信息处理的介词结构“以+X”的边界识别分析

来源 :上海师范大学 | 被引量 : 0次 | 上传用户：xxzjlei

【摘要】

：

句法自动分析是自然语言理解的核心，是当前计算语言学研究的重点所在。现代汉语句法自动分析的主要内容是对各种短语进行自动标注和研究它们的句法功能。介词结构无论从定量角

【作者】

：

李璇

【机构】

：

上海师范大学

【出处】

：

上海师范大学

【发表日期】

：

2008年期

【关键词】

：

现代汉语汉语语法句法自动分析信息处理介词结构

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

句法自动分析是自然语言理解的核心，是当前计算语言学研究的重点所在。现代汉语句法自动分析的主要内容是对各种短语进行自动标注和研究它们的句法功能。介词结构无论从定量角度，还是从定性角度，都是现代汉语中一种重要的语法结构。介词的个体特点也很明显，所以我们有条件也有必要对每个介词的边界识别进行研究，在个体分析基础上组成一个完整的介词短语边界识别系统。本文我们选择介词“以”作为研究对象。“以”在古汉语中就是仅次于“于”的介词，在现代汉语中也是一个很常用的介词，作为介词的用法有很长的历史，具有介词分析的典型性，而且具体来研究“以+X”的结构，发现它又是一种很富有个性的介词短语，它在句法、语义和组合格式上都很有自己的特点和个性。本文以自动识别为目的对介词结构“以+X”的边界识别进行个案分析。对介词短语“以+X”的内部结构特征进行了细致的描写，通过分析线性序列“W+以+X(A)+(B)Y”，尝试在语法、语义的基础上归纳总结出人工识别规则若干。一方面给汉语语法的本体研究以补充和完善，另一方面，当然也是更为重要的，它是计算语言学所需要的知识积累。我们根据对介词结构“以+X”语法、语义的形式化描写，编写相应识别规则来进行自动识别的算法设计，这部分是本文的重点所在。在4000句语料的基础上，进一步将语料扩大到8000句，经过逐字逐句的人工标注，生成了几个数据表，并初步形成了我们识别的总体思路。本文设计出自介词结构“以+X”的边界自动识别的算法，这个是中文信息处理这个大工程中的一个小细节。一方面可以为这个工程提供我们的研究成果，尤其是可以为其他介词的边界识别以及动词性短语结构的研究提供启示；另一方面我们在研究中所使用的方法和识别的思路，可以为以后的识别研究提供借鉴。在文章最后，我们利用人工分析的方法来检测本文的研究成果，并对疑难问题类型进行了归纳分析。

其他文献

元代戏曲婚恋叙事之“媒妁”与“媒介”

学位

睢宁方言儿童语音习得研究

儿童语音习得研究是语言学研究的一个重要课题，而方言儿童语音习得研究对推动儿童语音习得研究的发展发挥着重要作用。本文以江苏省睢宁地区方言374个常用音节作为考察材料，以

学位

睢宁方言儿童语音习得发音策略语音原则

中国现代文学中的自杀母题研究

20世纪文学史上，众多文学作品通过人物自杀这一审美途径来表达人物内心世界的矛盾情感和与外部世界的冲突。本论文针对中国现代文学中的自杀者形象进行归类、梳理、解读，探索出

学位

中国现代文学自杀母题审美哲学文化语境

试论农村水利现状及农村饮水安全

唐丽萍　　广西元鼎工程技术有限公司广西南宁 530022　　【摘要】我国是一个农业大国，小型水利工程作为农村经济的一个重要组成部分，在改善农民生产生活条件、促进粮食生产方面发挥了重要作用。农村水利是指在农村开展的水利建设、管理及其它有关水问题方面的工作，包括农村水工程、水资源和水环境。本文主要分析农村水利现状，进一步明确当前和今后一个时期农村水利工作的方向，奋力推进农村水利新跨越，为服务“三

期刊

农村水利现状方向饮水安全

浅谈水利水电工程土石方施工技术的发展

唐巾媚　　身份证号码：45273019860107598X　　【摘要】在水利水电工程中，土石方的施工作为一项极其重要的组成部分，自从上个世纪的50年代以来，由于科学技术的不断发展，机械化的施工逐渐被广泛的应用，因此，到了后来的80年代，土石方施工技术以及得到了较快的发展，机械化水平也得到了进一步的提高，其他相关的施工技术也得到了很大的发展，并且被广泛的应用到水利水利工程的施工过程中，有效的解决了

期刊

水利水电工程土石方施工技术发展

婚姻之“痒”实为性爱之“痒”

白领江姗（化名）最近感觉婚姻生活越来越没劲。她与李波（化名）进入围城五年有余，新婚之初的那种如胶似漆的爱恋，如过眼云烟般从他们的婚姻生活中消退了，剩下的只是淡而无味、泛不起一点激情火花的夫妻生活。　　白开水般的性爱　　　　恋爱的时候，常听过来人说“七年之痒”，江姗总是不以为然，现在，他们走进婚姻才五年，就开始“七年之痒”了，这让江姗感觉很是沮丧。　　每天回到家，两个人草草吃完饭便各行其是，江姗到卧

期刊

婚姻生活无味围城激情火花夫妻白领

轻盈的碎片——试论卡尔维诺小说的幻想特征

意大利作家伊塔洛·卡尔维诺，是二十世纪名震世界文坛的一代大师，他在短短62年的生命旅途中创作了10余部小说，虽然产量并不惊人，但其作品以独到的精美构思、深刻隽永的思维方式，对

学位

卡尔维诺小说创作幻想特征意大利文学小说艺术

早期南戏传播受阻原因探析

南戏，是我国最早成熟的戏曲艺术，宋元时期在南方盛行一时，但是由于其在传播和发展过程中遭遇到了非正常的待遇，造成了现存文献资料极为有限，研究困难重重，人们甚至无法看清的它的庐

学位

南戏戏曲艺术剧本创作传播受阻

深松与施氮量对春玉米产量及氮素吸收利用率的影响

以郑单958为供试材料,采用裂区试验,设置深松模式为主区(CK:不深松;T1:隔行深松;T2:行行深松),施氮量为副区(N0:不施氮肥;N1:纯氮112.5 kg/hm2;N2:纯氮225 kg/hm2;N3:纯氮337

期刊

春玉米产量氮素吸收深松氮肥施氮量农学利用率氮肥用量氮素吸收利用率千粒重吸收利用率

男士养阳,这些饮品不可少

我国传统医学主张“春夏养阳”.在炎炎夏日里,最适合养的就是阳气了.下面,让我们一同看看中医专家为广大男士朋友们推荐的几款夏季壮阳饮吧.rn夏季为何要养阳气rn很多男士都

期刊

男士夏季中医专家天人相应春夏养阳壮阳医学误区人体理论

面向信息处理的介词结构“以+X”的边界识别分析

与本文相关的学术论文