异种语料融合方法:基于统计的中文词法分析应用

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:nancyqi117
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于统计的中文词法分析往往依赖大规模标注语料,语料的规模和质量直接影响词法分析系统的性能。高覆盖率、高质量的语料资源非常有限,而且适用于不同领域的语料往往具有不同的分词和词性标注标准,难以直接混合使用,从而导致既有资源未能充分利用,分词精度下降等问题。针对该问题,该文提出了简单有效的异种语料的自动融合方法,并通过实验验证了提案方法的有效性、较强的实用性以及对多种语料融合的可扩展性。
其他文献
针对传统电力行业光缆故障点定位技术精度低、不能实时感知外界温度和应变的问题,研究了一种基于布里渊散射的全分布式光纤传感系统,该系统在检测电力光纤衰减和断点的同时,
没见马云之前,我十分惊异——这家伙,据称只是“一个普普通通的平民儿子”,“对互联网一窍不通”,怎么能创办出最具影响的商人网站阿里巴巴www.alibaba.com,并且还被全球企业
目的探讨指动脉背侧穿支螺旋桨皮瓣修复手指皮肤缺损的临床疗效及应用价值。方法回顾性分析2015年6月-2016年12月在我院接受手术治疗的手指皮肤缺损患者的临床资料,均采取指动
火车票实名制作为规范铁路运输部门和乘客之间的交易活动的行为规则,在印度已有近百年的历史,在我国曾经有过失败和成功的例子。本文通过分析火车票实名制的制度应求、制度供
通过对丰钩与钩舌以及钩舌销之间间隙的分析,得出在外力的作用下车钩各部受力比较复杂的结论。其中,牵引台未必受牵引,冲击台也不一定能受冲击,多数情况下是钩舌销受力,造成其弯曲
<正>在家禽中鹅属于草食性家禽,其许多生物学特性与鸡和鸭有差别,在繁殖特点方面也有很多不同。近年来,我国鹅业发展非常迅速,养殖规模和产量不断扩大,然而很多养殖场户对种
次贷危机以来,美联储连续四次采取量化宽松货币政策来刺激经济,以求实现经济复苏。虽然量化宽松货币政策实施的效果并没有预期的那样明显,但该政策依然被持续推进,美国逐步将
本文对电力系统安全自动控制和继电保护应用进行的简要的分析,重点介绍其构成以及目前的发展形势,对于相关技术人员有一定的借鉴中作用。
中国农村金融问题的理论研究已经取得较为丰富的成果,也积累了大量的研究文献。将从方法论角度对相关文献加以梳理,旨在对中国农村金融问题研究的发展状况作一个透彻的了解,
在海杂波中检测有用信号,杂波的协方差矩阵需要利用参考数据进行估计,不同的估计方法对信号的检测性能产生不同的影响。首先,给出了几种杂波协方差矩阵估计,即样本协方差矩阵、正