基于语料库的离合词研究

被引量 : 34次 | 上传用户：lovechenhua

【摘要】

：

本文通过对大规模语料的考察与分析，得到了离合词作为一种较为特殊的语言形式在文本中的出现情况及其插入成分的规律，对这些规律进行了总结，获得了离合词的组配模式，没有得到组配

【作者】

：

王春霞

【发表日期】

：

2001年01期

【关键词】

：

离合词动语素名语素组配模式规则概率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文通过对大规模语料的考察与分析，得到了离合词作为一种较为特殊的语言形式在文本中的出现情况及其插入成分的规律，对这些规律进行了总结，获得了离合词的组配模式，没有得到组配模式的离合词则人工写出了它们的插入规则。在此基础上，设计了一个规则和统计相结合的算法，对离合词标注进行了封闭测试和开放测试，开放测试的结果：正确率81.74％，召回率98.27％。全文共分六个部分：第一部分：引言。界定了有关离合词的一些概念，确定了该选题的目标和方法，指出本研究的价值和意义，并综述了离合词在语言学界和自然语言信息处理学界的研究现状和地位，以及从中得到的一些启示。说明了本研究所使用的语料。第二部分：离合词标注的难度分析。从语料中我们对离合词的情况有了大致的了解，对语料进行了初步处理，得到离合词的例句，进行了统计分析。根据例句指出了离合词研究中的困难和有利之处。第三部分：离合词插入规则的获得和分析。这一部分是确定算法的基础。我们总结了组配模式，根据模式从大量离合词例句获得了一些有效的规则以及其他数据，也为了弥补数据稀疏的不足，人工总结了一部分离合词的规则。第四部分：基于数据和规则的算法及其在标注中的应用。这一部分是本研究的核心工作，使用前面所获得的数据和规则确定了标注离合词的算法，对算法进行了描述。分别使用训练语料和测试语料进行了封闭测试和开放测试，并在标注过程中对算法做了一些调整。第五部分：标注结果的报告和分析。展示了封闭测试和开放测试的标注结果和部分标注实例，并对标注结果进行了综合分析和对比分析，分析了标注中的典型错误，总结了本项研究的难点。第六部分：结束语。对本研究工作进行了全面的总结，提出了研究工作中的一些不足，提出下一步工作中需要提高的方面。该研究在自然语言信息处理方面有一定的资料价值和算法上的参考价值，实验结果还有提高的可能，以后可以继续研究。

其他文献

论语言的生成性及其在中学俄语教学中的应用

语言的生成性是语言的本质特征之一。而正确认识语言的本质对外语教学十分重要。外语教学原则的制定、教学方法的设计以及教学手段的选择都离不开对语言本质的认识。语言是一

学位

生成性语言教学应用

少数民族干部思想政治教育问题及对策研究

本文通过对我国少数民族干部思想政治教育重要性的阐述,结合当前少数民族干部思想政治教育的现状,揭示了少数民族干部的思想政治教育与民族地区思想政治教育与经济发展的对立

学位

思想政治教育少数民族干部马克思主义政策研究

构建社会主义和谐社会的思想文化基础研究

思想文化是个内涵深刻、外延广泛的概念。在政治学的学科中,它应该属于上层建筑的意识形态,代表着统治阶级的意志,体现着统治阶级的经济和政治要求。先进阶级的思想文化观应

学位

思想文化基础时代精神科学社会主义哲学文化传统文化现代和谐社会的理念

社会主义市场经济条件下公务员道德建设研究

当前，我国正处于进一步深化改革、扩大开放、体制转轨、社会转型的特定历史时期。对于行政体系而言，要保证国家和社会公共事务的顺利展开，就必须对行政行为进行有效的调控和规范

学位

公务员道德市场经济建设

印花税征收管理的做法与建议

<正> 印花税是我国从1988年10月1日起新开征的一个税种,与其它税种比较具有如下特点:一是征收范围广、税源零散,不仅涉及到企、事业单位,而且涉及到书立领受凭证的行政单位和

期刊

印花税票缴款书委托书征收管理

迷笛,中国青年的狂欢节

金秋十月,数万名青年不约而同地从全国各地奔赴北京雕塑公园,参加连续四天有几十支摇滚乐队上演之规模的迷笛音乐节。至今为止,迷笛音乐节已经成功地举办了五届了,越来越多的

期刊

音乐节狂欢节摇滚乐音乐学校中国青年

安徽省农村老年人非正式照顾研究

基于对425位农村老年人的调查,分析了老年人非正式照顾资源的作用及差异。调查显示,在经济供养、生活照料和精神慰藉方面,安徽农村老年人主要依靠家庭予以照顾,配偶、子女是

期刊

安徽省农村老年人非正式照顾

企业思想政治工作与企业文化建设的结合研究

思想政治工作是党的优良传统和重要的政治优势,是一切经济工作的“生命线”。企业思想政治工作是思想政治工作的有机组成部分,是做好企业工作的有力保证,是在我国社会主义市

学位

企业思想政治工作企业文化建设对策

我国高等学校学生评价体系构建的若干思考

随着我国高等教育的发展,高等学校毛入学率保持在较高的水平,在校生人数增幅明显,使得高等学校在校生规模庞大。面对如此规模庞大的在校生群体,对其进行科学、公正的评价,成

期刊

高等学校学生评价评价体系

CPA职业责任保险中的逆向选择与道德风险及应对策略

CPA审计过程中的审计风险是不可避免的,为降低CPA的审计执业风险,CPA职业责任保险应运而生。CPA职业责任保险能够对审计风险成本进行一定程度的合理补偿。但伴随CPA职业责任

期刊

职业责任保险职业风险基金执业风险CPA审计风险成本应对策略

基于语料库的离合词研究

与本文相关的学术论文