分词语料库中四字格的切分和识别研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户：hzzaa

【摘要】

：

四字格的能产性和派生性极强，利用四字格模式创造出的新词数量在现代汉语词汇中仍然呈上升趋势，因此对四字格的研究不能仅仅局限于文献和理论。本文将研究的目光投向分词语料库

【作者】

：

徐润华

【机构】

：

南京师范大学

【出处】

：

南京师范大学

【发表日期】

：

2009年期

【关键词】

：

分词语料库四字格切分研究识别研究

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

四字格的能产性和派生性极强，利用四字格模式创造出的新词数量在现代汉语词汇中仍然呈上升趋势，因此对四字格的研究不能仅仅局限于文献和理论。本文将研究的目光投向分词语料库中数量众多的四字格，并针对分词语料库中四字格易被切碎的特点，进行了四字格抽取、四字格切分不一致比较、四字格识别等一系列工作。　　本文首先对分词语料库中的四字分词单位进行提取和筛选，得到四字格抽取结果；并利用四字格抽取结果，进行了分词语料库内部和分词语料库之间的四字格切分不一致比较工作。在四字格识别研究中，通过引入crf 统计模型，并将四字格切分不一致结果作为模型训练语料，本文在有词性标注分词语料库中进行了四字格的识别研究。利用crf模型识别得到的四字格结果，统计四字格用字、词性信息并观察内部结构特点总结规则，本文在无词性标注分词语料库中也进行了四字格的识别研究。识别结果表明，在有词性标注分词语料库和无词性标注分词语料库中，四字格的识别精度都能达到90％左右。

其他文献

基于递归模糊神经网络的PEMFC温度控制研究

质子交换膜燃料电池(PEMFC)的工作温度对其发电性能和电池寿命具有重要影响,但由于PEMFC的非线性和时变特性,传统的控制策略较难获得很好的温度控制性能,以此推荐使用一种具

期刊

质子交换膜燃料电池(PEMFC)热模型递归模糊神经网络(RFNN)温度控制

Ship detection in optical remote sensing image based on visual saliency and AdaBoost classifier

第一，在这份报纸，目标候选人区域被联合最大值提取对称用包围显著察觉算法一细胞的自动机动态进化模型。第二，轮船目标尺寸的一个特徵向量独立人士被把形状特征与面向的坡度(S

期刊

classifierAdaBoosthistogramautomatasymmetricpixelcandidatesimilaritysurr

浅议小学数学学习特点在教学中的影响

在小学的课程中,数学教学占有重要的位置,其内容相对比较抽象,在教学中需要根据数学学习特点进行教学.数学的学习在小学期间就开始打基础,并对学生进行逻辑思维的训练,在教学

期刊

小学数学教学影响教学特点

小画家

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

“虚幻的力”——苏珊·朗格舞蹈美学思想初探

本文依据苏珊·朗格在论述舞蹈艺术时所提出的三个问题分为三章，每一章是对其中一个问题的阐述。第一章讨论了何谓“舞蹈”?从前人对于舞蹈美学的研究谈起，指出这些学说存

学位

苏珊·朗格舞蹈美学艺术幻象理论符号论舞蹈形象

不同氧气浓度和粒径下工业污泥燃烧特性的实验研究

在不同氧气浓度和样品粒径条件下,采用热重分析法对3种不同行业的工业污泥进行了实验研究.结果表明,工业污泥着火和燃烧特性好、着火温度低,但燃烧不剧烈,综合燃烧性能不高.

期刊

工业污泥热重分析燃烧特性氧浓度粒径

小学语文课堂教学效率提高的对策探索

小学语文教学是整个小学教育体系的重中之重,因其不仅是开展其他各科学习的基础,更是培养小学生语言能力的重要阵地。如何提高小学语文课堂效率一直是小学教育工作者研究的重

期刊

明代建阳木刻插图与小说戏曲传播

建阳刻书，规模冠绝天下，至明代，形成无书不图局面。明代建阳小说戏曲文本多采用上图下文版式，区别于其他地区的其他插图版式，富有浓厚的地域特色，彰显了文字“意”和绘画“神”的紧

学位

明代建阳木刻插图小说戏曲文本传播

“三剑客”顾长卫、侯咏、吕乐的电影研究

文章将顾长卫、侯咏、吕乐三位导演划为一个整体进行研究，因其三人都是从电影摄影师转行成为导演，这种转变又几乎是在同一时期开始的，最为重要的是这三人创作的电影在风格上呈现

学位

摄影师顾长卫侯咏吕乐电影风格视觉语言

现代汉语“定语后置”问题的考察与分析

现代汉语是否存在定语后置现象,自《新著国语文法》出版以来一直存在不同看法。本文就此进行全面深入的考察与分析。全文共分七章:　　第一章绪论,介绍选题来源和研究价值,研

学位

现代汉语定语后置汉语语法史语言类型学句法系统

分词语料库中四字格的切分和识别研究

与本文相关的学术论文