基于语料库的中日同形近义词对比分类方法研究

来源 :北京外国语大学 | 被引量 : 2次 | 上传用户:yijixu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中日同形词是语言对比研究和教学研究的一个重要话题。尽管成果不少,但国内以往研究主要服务日语教学,利用词典释义部分的理性义实施汉日词义的对比考察,且多局限在对个别词的举例性分析。本文吸收中日语言学本体研究、语言对比以及语言教学等相关领域的研究成果,综合利用现有词典资源中的词义、词性信息以及基于语料库统计的语法功能与搭配信息,搭建一个多层、全面的对比和分类框架,试图进行中日同形近义词的系统比较,并为解决对日汉语教学中的词汇问题提供帮助。本研究选取《汉语水平词汇与汉字等级大纲》甲级词中的中日同形近义二字词作为考察对象,采用《现代汉语词典》和『スーパー大辞林』作为汉日词语的词条设目、词义及对应关系描述、词性等静态属性的知识源,利用CCL语料库检索系统(网络版)和『現代日本語書き言葉均衡コーパス』作为中日词语的语法功能和搭配分布的统计依据,为中日同形近义二字词的对比和分类体系的建设搭建了一个全面的描写框架。其构建策略是,首先比较中日词典词条设目的数量对应关系,确定一对一、一对多、多对一和多对多等4大类;针对“一对一”类对应词语,按照意义(理性义、色彩义)、词性、句法功能和搭配关系等特征组配模式划分8个次类;再处理划归不同次类的词语,按照词义的交叉和包孕关系及方向性,具体细化为15个小类。本研究结合从母语语料库统计的词语常用性和从HSK动态作文语料库v2.0统计的词语易错性指标,对分类描写框架中不同类别的典型词语实例,采用上述多层分类方法进行了不同层面的详尽刻画。本文主要贡献在于建立“对应关系→意义→词性→句法功能→搭配关系→词义关系”的逐层对比及分类的描写框架。该框架能够对中日同形近义词实施逐层分类、从不同维度对比分析中日同形近义词差异、评估中日同形近义词的差异大小。利用该框架所做的验证性研究表明,不同类别之间有差异,且差异较为显著,这说明此框架是有效的、有意义的。具体来讲,4个大类中一对多的偏误率最高,多对多的偏误率最低;8个次类中差异偏大和偏小的类别更容易产生偏误;15个小类中呈交叉关系的同形词偏误率最高,日包中类的偏误率最低。最后以对日汉语教学工具书编撰为例,提出了基于此框架编写中日同形近义词词典的具体建议。
其他文献
目的观察地榆升白片在放疗所致白细胞下降中的治疗作用。方法90例放疗过程中出现骨髓抑制的恶性肿瘤病人随机分为3组,实验组地榆升白片+重组人粒细胞集落刺激因子(G-CSF);对
如今,互联网金融在我国发展迅速,对国内整个金融产业造成了巨大影响,尤其是银行业,甚至逐渐改变了人们的生活方式。互联网金融操作简单,方便快捷,其优势与传统金融模式产生了
文化教学在对外汉语教学中有重要地位和作用。针对目前安徽省高校对外汉语文化教学的现状,从课程设置、教学大纲、学历教育等方面进行考查。同时在文化教学内容选择的基础上,
目的:益气养阴化瘀通脉方(由黄芪、白芍、山萸肉、茯苓、白术、葛根、生地、玄参、麦冬、当归、川芎、丹参、桃仁、红花、木香组成)具有益气养阴、活血化瘀、通脉止痛的作用
目的:初步评价不同剂量组、不同疗程下注射用红花苷治疗动脉粥样硬化性血栓性脑梗死(中风病恢复期-瘀血阻络证)疗程及安全性方法:本试验遵循随机、阳性药平行对照临床研究方
[目的]在明确艾滋病带状疱疹疾病诊断的基础上,对北京地区34例艾滋病带状疱疹患者开展病例对照的临床试验,以国际通行的临床评价以及视觉模拟疼痛评分作为主要指标评价中药治
膝关节置换术是目前治疗退行性关节疼痛和功能障碍的有效方法。近年来,随着人口老龄化的发展,膝关节置换数量逐年增加。全膝关节置换术后假体周围骨折是一种较少见的并发症,
作为我国古代著名的数学家,杨辉不仅仅在数学算法及教育方法等方面作出了突出的贡献,同时他也将社会经济现象融入算书之中,构成了研究南宋社会经济的重要史料。本文针对杨辉
教师通过自身的有效努力,使每个学生成了他本来应当能够成为的那种人——学生最大限度地发挥了自身的潜能,既得到了社会的承认,也拥有了充实而幸福的人生。这就是教育的成功;
期刊