基于隐马尔科夫模型的中文分词研究

来源 :电脑知识与技术(学术交流) | 被引量 : 0次 | 上传用户:mswangnan098
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来,汉语自动分词是公认的汉语信息处理瓶颈。反思现有汉语自动分词技术,发现均有隐舍两大假设:语言是规律的、词具有确定边界?这与语言的复杂性、组合性、动态性、模糊性特征不符。本文采用一种基于隐马尔科夫模型(HMM)的算法.通过CHMM(层叠形马尔科夫模型)进行分词,再做分层,既增加了分词的;隹确性,又保证了分词的效率。
其他文献
作为细胞内数量最多的细胞器,线粒体不仅是细胞能量合成的重要场所,同时还参与细胞内离子平衡、氨基酸代谢、脂肪酸代谢、凋亡调控等诸多生物学过程。线粒体功能和动态的维持
历史悠久、文化淳朴的古镇近年来一直是旅游的热点,随着旅游开发的不断深入,旅游古镇呈现出的各种问题也越来越多,其中“古镇不古”即是突出问题之一。民俗是传统文化最集中
2012年刑事诉讼法新增的庭前会议制度,在一定程度上可以作为制约法官预断的一种制度设计。庭前会议功能的发挥,有助于减轻法官在庭前阅卷所形成的负面影响,并使得与审判相关
影子银行在2008年金融危机后逐渐进入人们视线中,也引起了各方学者的深入研究,而中国的影子银行也随着国际形势与国情的需要不断发展壮大,突破了金融监管,在为中小企业拓宽融
雕塑艺术,是集雕、刻、塑三种制作方式于一体的一种造型艺术,是包括可以用来进行塑造的材料(有泥、石膏等)或者能雕、能刻的材料(有木头、金属、石头、玉石、玛瑙等),塑造成
口服营养补充(Oral nutritional supplement,ONS)作为一种常见的日常饮食外营养补充手段,目前被广泛应用于各种疾病相关治疗。越来越多的研究证明口服营养补充在临床治疗中的
[目的]建立我国口岸常见蚊虫rDNA-ITS、COI基因数据库,以此实现蚊虫的分子鉴定,并基于各地区尖音库蚊复合组的COI基因建立溯源的分子基础。[方法1于2012年采集我国口岸常见蚊
2012我国颁布了新修改的《刑事诉讼法》。其中,立法者针对刑事审判中出现的问题在充分的总结和借鉴的基础上确立了庭前会议制度,目的是在不牺牲公正的基础之上,提高审判效率
从地域性角度对各地方园林进行研究,是中国古典园林研究的一种深化。浙江传统园林作为江南园林的一部分,有其自身的特点与特色。在论述浙江传统园林概念、类型和生成环境的基
Ⅱ型促代谢型谷氨酸受体(IlmGluRs)是G蛋白偶联受体,包括mGluR2和mGluR3两亚型.在神经系统中,II mGluRs作为突触前自身受体,对谷氨酸的释放发挥负反馈调节。实验表明,II mGlu