基于多分类器加权投票法的越南语组合歧义消歧

来源 :计算机科学 | 被引量 : 0次 | 上传用户:youfei741101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出越南语组合歧义字段库,对越南语语料与越南语组合词词典进行匹配,抽取出越南语组合歧义字段;其次,采用三类分类器引入越南语词频特征和上下文信息,构建三类分类器消解模型,得到三类分类器消解结果;最后,计算出各分类器权值,通过阈值对越南语组合歧义进行最终分类。实验表明,所提方法的正确率达到了83.
其他文献
为了满足多通道激光荧光雷达油污染监测系统的研制需求,基于VC开发了一套应用软件用于实时油污染监测;通过分析软件功能模块,采用模块化软件设计和一些比较成熟的软件技术,降低了
针对循环坐标下降法(Cyclic-Coordinate Descent,CCD)只能处理各关节运动关系相对独立的开链式机械臂控制问题,阐述了一种改进的CCD算法,并研究了约束条件下CCD法的有效性和收
随着电子技术的迅速发展,电路系统的复杂度急剧增加,目前约有60%的芯片同时包含了数字和模拟两种信号,电路测试也因此面临着更大的挑战。为解决数模混合信号系统的测试难题,在IEEE
纯音听力计是进行听觉功能测试的基本声学仪器,而纯音信号发生器是其最重要的组成模块,它决定着可控声源的质量,直接影响测试结果的准确性;文章分析了现有纯音信号发生器存在的问
为满足EAST实验中实验信息交互对象的多样性和实验人员远程控制的需求,提出了基于可扩展消息处理现场协议XMPP的即时通信系统方案;该系统是基于可扩展消息处理现场协议,采用C
介绍了SOPC技术为核心逻辑模块的井喷预测系统,对井喷预兆、原因和相关参量变化规律进行了分析;描绘了系统组成结构,给出了硬件原理框图,并对系统进行了分解;系统应用计算机对钻井
针对脱离弹体后的电子舱无法进行实时数据采集分析的这一问题,提出使用VI和FPGA配合的独立模拟测试平台方案,利用FPGA模拟各类故障检测信号并且使用直接注入至电子舱的方法,用以
为降低静电电位动态测试仪采集波形的失真,提出利用基于RBF(Radial Basic Function)神经网络的系统辨识方法进行波形重建;使用静电高压动态电位标准装置进行试验,将输入的标准方波
概述了企业开展电子商务的必要性和意义,以及企业怎样开展电子商务;并介绍了国外石化公司开展电子商务的情况.
针对普通线性反馈移位寄存器(LFSR)产生的序列的线性复杂度太小,难以经受线性逼近攻击的问题;在详细研究序列密码设计理论的基础上,对常规LFSR进行了改进,提出了基于FPGA的利用