面向HSK作文库的连词偏误用法自动识别及其应用研究

被引量 : 0次 | 上传用户:only16666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代汉语中,虚词承担着语法表现和语义辨析的双重任务,对汉语的语法分析和语义理解起着至关重要的作用。用错虚词就可能使句子的本意完全相反或者出现偏误。由于连词是虚词的一种,所以研究由于连词使用不当造成的偏误十分有意义。本文从现代汉语广义连词用法知识库入手,研究了连词偏误用法的自动识别。从现代汉语水平考试的历年试卷中抽取含有连词偏误的语料,整理、归纳形成结构化的连词偏误用法语料库,作为研究对象。分别使用规则的方法、统计的方法以及规则和统计结合的方法试图实现连词偏误用法的自动识别。在基于规则的方法中,参考现代广义连词知识库的规则库实现偏误规则形式化,编写连词偏误用法规则,扩充现代汉语连词用法规则库。根据连词正确用法规则和偏误用法规则进行基于规则的连词偏误用法自动识别。由于规则的编写比较复杂而且受到编写者的知识和经验的影响,接下来使用CRF进行连词偏误自动识别的研究,也就是基于语料的方法即使用统计模型进行连词偏误的自动识别。使用统计的方法能够自动或者半自动地学习连词上下文知识,但是对于分布比较稀疏的连词偏误用法识别效果比较差。结合者两种方法的优缺点,最后又使用了规则和CRF相结合的方法进行连词偏误用法识别的实验。实验结果表明,基于连词用法可以自动发现连词的偏误。对实验结果的进一步横向和纵向对比表明使用规则的方法准确率较其他两种方法高,但是规则和CRF结合的方法有比较高的召回率和F值。在连词偏误用法自动识别的基础上,构建了基于连词偏误用法自动识别的辅助教学系统,供对外汉语教学的教师和留学生参考使用。该系统依托于连词用法语料库和连词用法规则库,实现了辅助留学生和教师学习、教学等功能。在辅助学习模块,通过检索要学习的连词,系统展示其不同用法的正确例句和偏误例句;在偏误用法识别模块,用户可以给出有连词偏误的句子,系统进行分析,给出偏误类型、修改建议等信息供用户参考使用。
其他文献
中国媒介规制始于改革开放之初,目前存在条块分割,画地为牢,事业单位、企业经营双重角色,权力者对传媒规管随意性,媒介规制缺乏规范性和透明性等问题。为此,中国传媒规制的改
碳纤维复合材料产品具有轻质、高强度、高刚度等特点,电子工业广泛采用碳纤维复合材料制造结构件及结构功能件。文中利用3236/T300高性能碳纤维预浸料制造波纹板构件,对碳纤
<正> 中国古代科学技术对人类文明进化作出过杰出贡献,其丰富的科技创造也建构了特有的科技文化。《周礼·考工记》云"知者创物,巧者述之,守之世,谓之工。百工之事,皆圣人之
在介绍图形点阵式液晶显示模块GTG240128的结构和功能的基础上,讨论了其与AT89C55单片机的硬件接口电路和接口软件编程方法,并给出了写指令、写数据、初始化和汉字显示等通用
对一家服务企业而言,唯一的"专利"就是更好的服务品质。携程在9年发展过程中,始终以客户为中心,孜孜不倦地追求高品质旅行服务,不断推出了大量服务创新理念,并付诸于实践,这
随着现代计算机技术的迅速发展,使用EDA(电子设计自动化)软件进行的电路设计与仿真已经成为现代电子技术系统设计的必然趋势。文中应用Proteus软件实现了单片机LED(发光二极
<正>南京金康老年康复医院、南京市鼓楼区金康老年护理中心、鼓楼区残疾人康复中心是经市卫生局、鼓楼区民政局批准的专科老年康复机构。
我国正处在多种转型并行的关键时期,改革发展的同时也面临着各类公共危机日益突出的威胁,近年来由于企业履行社会责任缺失所造成的企业社会责任危机事件频繁发生于衣、食、住、
目的探讨目标导向性液体治疗对老年患者腹部外科手术的影响。方法选取2013年5月~2014年11月行腹部外科手术老年患者44例,随机分成目标导向性液体治疗组(A组)和传统液体治疗组