基于词图的最大概率分词方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：wergsdf

【摘要】

：

中文分词的方法主要可分为基于规则和基于统计两大类：前者一般借助于词图的方法，将分词问题转化为最优路径问题，通常切分结果不惟一；后者利用统计模型对语料库进行统计，计算量较大

【作者】

：

刘汉兴朱梅阶刘财兴林旭东

【机构】

：

华南农业大学信息学院

【出处】

：

计算机工程与设计

【发表日期】

：

2008年24期

【关键词】

：

中文分词词图二元语法最大概率最优路径 chinese word segmentation word graph bigram maximum pr

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文分词的方法主要可分为基于规则和基于统计两大类：前者一般借助于词图的方法，将分词问题转化为最优路径问题，通常切分结果不惟一；后者利用统计模型对语料库进行统计，计算量较大，但准确率较高。对词图和N元语法进行了介绍，并结合两者实现了一种中文分词方法。该方法将词图中的最大概率路径作为中文句子分词的结果，其中涉及对语料库进行二元词频统计，设计了一个多级哈希结构的分词词典，实验数据表明该方法能有效地进行自动分词。

其他文献

山东省人民政府令

《山东省工程建设标准化管理办法》已经2017年4月12日省政府第100次常务会议通过，现予公布，自2017年7月1日起施行。

期刊

山东省政府令人民标准化管理工程建设会议通省政府

祝贺《园林》

《园林》陪伴了我走过了几十个春秋，是我成长路上的良师益友。犹记得第一次邂逅《园林》，是在朋友家随手翻阔杂志，不经意间翻到《园林》，彼时对园林还未有什么概念，纯粹只是觉得图

期刊

园林公园期刊编辑工作编读往来

山东省人民政府关于印发山东省生态环境保护“十三五”规划的通知鲁政发[2017]10号

山东省生态环境保护“十三五”规划一、工作进展“十二五”期间，我省坚定不移地贯彻落实党中央、国务院关于加快推进生态文明建设的决策部署，围绕改善环境质量、确保环境安全、

期刊