基于字簇的多模型中文分词方法研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:fantasy2204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字标注分词方法是当前中文分词领域中一种较为有效的分词方法,但由于中文汉字本身带有语义信息,不同字在不同语境中其含义与作用不同,导致每个字的构词规律存在差异。针对这一问题,提出了一种基于字簇的多模型中文分词方法,首先对每个字进行建模,然后对学习出的模型参数进行聚类分析形成字簇,最后基于字簇重新训练模型参数。实验结果表明,该方法能够有效地发现具有相同或相近构词规律的字簇,很好地区别了同类特征对不同字的作用程度。
其他文献
确定现金最佳持有量一直是企业流动资产管理研究的重要课题之一。本文在分析了成本分析模式存在不足的基础上,提出了利用回归分析方法改进成本分析模式的建议。
在自然界和现实的工程流体系统中,气-液两相流大气环流和海洋环流是一种很常见的复杂现象ǐ近年来,格子Boltzmann方法(LatticeBoltzmann Method,LBM)提供了一种研究气-液两相
<正> 一八四○年的鸦片战争,标志着中国从封建社会逐步沦为一个半殖民地半封建社会的开始。鸦片战争是新兴的英国资本主义对外侵略扩张势力与衰老的中华封建帝国矛盾激化的产
经过多方调研及改进实践,针对当前我国新建粮仓气密性欠佳的原因,提出从选用合理的仓房结构、选购优质的外购件、严把施工安装质量关等方面入手,落实"提升技术标准、淘汰不达
目的:研究乳腺癌术后患侧上肢分阶段、分级别功能锻炼对上肢功能恢复的影响。方法:设对照组和实验组,两组均在术后1 d和术后1个月测量患侧上肢功能。对照组行常规术后乳腺科
目的:观察身痛逐瘀汤加减治疗腰椎间盘突出症的临床疗效。方法:选取80例腰椎间盘突出症患者作为研究对象,随机将患者分为对照组和实验组各40例。对照组采取常规的西药治疗,实
贫困村的规划建设是脱贫攻坚战的重中之重,也是乡村人居环境整治与发展的关键。2017年,广东省提出“2277个省定贫困村创建社会主义新农村示范村”的重要举措,总投入财政资金3
<正>河南省滑县电业管理公司以客户需求为导向,以服务民生为核心,以整治供电营业厅服务突出问题和提升服务质量为目的,逐步满足客户服务需求,消除供电营业厅服务隐患,健全供