中文分词及词性标注一体化模型研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wxc13439460105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文应用N-最短路径法,构造了一种中文自动分词和词性自动标注一体化处理的模型,在分词阶段召回N个最佳结果作为候选集,最终的结果会在未登录词识别和词性标注之后,从这N个最有潜力的候选结果中选优得到,并基于该模型实现了一个中文自动分词和词性自动标注一体化处理的中文词法分析器。初步的开放测试证明,该分析器的分词准确率和词性标注准确率分别达到98.1%和95.07%。
其他文献
种子和农具无疑是发展中国家救灾中重要的农业生产资料。关于种子的分销,有两种不同的方式:直接分配以及种子展销会。近年来,通过农产品贸易实现种子分销已开始发挥重要作用。不
问题分类是问答系统技术处理的基础与核心,它决定答案抽取的范围和方法,进而影响整个系统的性能。本文提出了一个基于贝叶斯理论的问题分类计算模型,并给出其详细算法。研究分析
摘基于模糊数学,本文提出了用模糊数学的评价集方法对学习者进行综合评价,是模糊模式识别的一种新的扩展和应用,为拟人化和情感识别提供了一种新的研究思路。同时本文设计了一个
无线传感器网络集感知、通信、计算功能于一体,在诸多领域有重要应用,因而已经成为计算机领域研究的热点。目前的研究大都主要以节约能源消耗为目标,提出不同的查询处理策略。本
针对粗糙集理论只能处理离散数据的局限,提出了基于决策的剥离式连续属性离散化方法,一改传统的候选断点集合的获取方法,直接通过分析连续属性在各决策类的取值范围和计算属
近年来,基于混沌理论的保密通信和数据保密得到广泛、深入的研究,提出了许多基于混沌理论的混沌加密算法,但这些算法缺乏可靠的安全性和鲁棒性。本文提出一种利用外键控制的密文
利用图像的结构张量表示的局部结构信息,结合Wiener滤波给出了一种图像去噪算法,并采用了加性算子分解格式求解非线性扩散方程以提高计算效率。实验结果表明,该算法在去除噪声的同时很好地保持了图像中的强弱边界等细节特征,去噪后的图像在峰值信噪比和主观视觉效果上都有显著提高。
目的:探讨旋磁场和尼莫地平对小鼠血清、脑组织、心组织和肝组织的一氧化氮(NO)含量的影响. 方法:NO的测定用改良的Griess法. 结果:曝磁给药组小鼠血清NO含量极低于对照组、
本文对信息在生活中的受关注程度进行研究,给出了一种度量信息重要性的标尺——同构化信息温度,并将它与计算机、互联网技术相结合,分别构造了单文本热点挖掘系统、文本数据库热
护理软技能是护士个人基本素质和临床经验积累表达,探讨护理软技能的内涵,提高护理人员在临床工作对护理软技能应用的认识,并通过沟通技巧、礼仪规范、观察思考等方面的培训