规则和统计相结合的汉语词类标注方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:angus000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文分析了汉语的多类词现象与汉语词类标注的困难,介绍了汉语词类标注中的规则排歧的和统计排歧的处理策略以及规划和统计相结合的处理思想,按此思路设计的软件系统,对封闭语料和开放语料的标注正确率分别达到了96.06%和95.82%。
其他文献
面向数据的分析技术首先由Scha(1990)年提出。该处理技术具体表达了这样的假设:人类对语言的领司和创造依赖于以往具体的语言经验,而不是依赖于抽象的语法规则。DOP技术框架可以分为:(1)建立包括
根据岩体三场耦合的机理分析,从线性动量守恒、质量守恒和能量守恒出发,理论上推导出以位移、孔隙压力和温度为未知量的THM耦合控制方程组,包括岩块变形场方程、地下水连续性
《现代汉语语法信息词典》是为计算机实现汉语分析和汉语生成而研制的一部电子词典。这部电子词典可以在语言信息处理的广泛领域中得到应用。本词典的详细规格收的初稿制订于
以辽河油田的高升、冷家堡油藏为例,运用数值模拟和油藏工程方法对稠油油藏注CO2吞吐进行了适应性研究.研究表明:原油黏度是影响CO2吞吐效果最敏感的参数,随原油黏度增大,换
随着教学改革的逐渐推进,我们倡导培养更加全面的学生。而就当今的学生发展而言,由于高考带来的压力,他们的体育锻炼时间明显缩短,其身心健康受到了不同程度的影响。俗话说:
在我国的学校教育中,初中阶段无疑是一个极其重要的阶段,这个时候的学生正处于为高中学习生活打基础的阶段,容不得马虎。笔者发现在传统的教学方法中,现在很多中学里的学生无
本文叙述了一个基于改进的“汉字识别特征点方法”的高精度简、繁体印刷体汉字文本识别系统,引入特征点的方向属性,明显地提高了“汉字识别特征点方法”的汉字识别率。文中阐述
在小学阶段,有效的课堂评价作为一项重要教学内容,需要教师充分挖掘教学评价存在的不足,从而才能进一步为促进学生发展,本文基于小学数学教学课堂,充分研究了如何构建高效的
以绘制的Span80/Tween80-煤油-水(丙烯酰胺水溶液)拟三元相图为依据,选择高单体质量分数微乳液体系,在反应温度为40℃,引发剂用量为单体质量0.2%的条件下,通过反相微乳液聚合反应,制得
本文叙述了等线体和圆头体汉字曲线轮廓字形的自动生成系统.该系统从黑体汉字曲线轮廓字形中自动抽取骨架单线体,结合等线体和圆头体汉字构字规则自动生成多种笔划粗细规格的等