现代汉语副词用法的自动识别研究

来源 :第八届中国Rough集与软计算、第二届中国Web智能、第二届中国粒计算联合会议(CRSSC-CWI-CGrC'2 | 被引量 : 0次 | 上传用户:bach88888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
副词用法多样,已有的副词研究大都是面向人用的,很难直接用于自然语言处理的实际应用中.本文从副词的实际用法入手,利用已经构建的副词用法词典,时词典中的副词、副词用法ID和例句进行抽取并对例句进行分词处理构成语料;利用已经构建的副词用法规则对语料进行副词自动识别和用法标注,并对标注的结果进行分析计算出标注的正确率,对标注错误的语料进行抽取,分析错误的原因,对规则或系统进行修改从而提高正确率.目前标注的正确率.如果保留因分词错误而导致标注错误的句子是61.43%,如果排除因分词错误而导致的标注错误,则正确率是74.89%.
其他文献
邻域粗糙集模型可以直接处理连续型数据.邻域模型的属性约简是其重要研究内容之一.求取邻域的时间是影响提高邻域模型属性约简算法效率的一个瓶颈.本文提出了一种新的快速邻
在医学上,没有正确的诊断就没有正确的治疗,而在许多临床诊断中,常出现不能确诊,误诊和漏诊现象.本文针对此提出用排斥Rough sets方法从临床数据中提取诊断规则,通过对数据的
属性约简是粗糙集理论中的重要问题之一.本文将属性划分的思想应用于决策表的约简中,详细地分析了决策表中属性划分的特点与性质,给出了一种基于划分的决策表约简算法DRABP,
考虑到在现实中有用的知识往往具有高精度和高覆盖度的特征,本文将Zarkio变精度粗集模型引入有用知识的获取中,并研究了VPRS模型的动态学习方法,以及精度和覆盖度的变化对有
约简是粗糙集理论中重要的研究内容.本文引入了一个新的约简概念,称为相对于个体的δ-约简,并给出了相对于个体的δ-约简同其它相对于个体约简之间的关系.
患者,男,42岁,某部运输机领航主任,飞行时间2100h,于1993年4月2日从1m高处跳下不慎左踝关节扭伤,当即局部肿痛。航医按软组织扭伤处理,效果不佳。一周后送上级医院会诊,患侧
文本分类是数据挖掘领域长盛不衰的研究课题.传统的分类方法有基于规则的和基于统计机器学习的方法.结合统计机器学习理论及复杂网络分析技术,提出了基于特征网络的文本分类
会议
论述了粗糙集方法性质及特点.从病历样本数据出发,运用基于区分矩阵的计算方法,简化了计算过程,使得医疗信息的处理更为简便有效,从中得出的简明直接、易于理解的产生式分类
文中采用混合统计模型与自动提取规则相结合的方法,实现了中文命名实体识别系统.整个识别过程分成两个步骤:首先,结合隐马尔可夫模型(HMM)和最大熵模型(ME)构成混合统计模型进
会议
汽轮机轴系故障是长期困扰发电厂安全可靠性的重要因素.本文将模糊粗糙集和k-近邻分类方法相结合,开发一种富有语义的故障识别方法.该方法首先利用模糊粗糙集约简故障案例的
会议