基于词性标注与分词消歧的中文分词方法

来源 :广州大学学报:自然科学版 | 被引量 : 0次 | 上传用户:enjoy_flying12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文信息处理的前提和基础.文章综合基于词典的分词方法和统计的分词方法的优点,旨在提出一种基于词性标注与分词消歧的中文分词方法,针对初次分词结果中的歧义集进行对比消歧.利用正向、逆向最大匹配方法以及隐马尔可夫模型进行分词,得到三种分词结果中的歧义集.基于词信息对歧义集进行初次消歧.通过隐马尔可夫模型标注词性,利用Viterbi算法对每种分词结果选取最优词性标注.并基于定义的最优切分评估函数对歧义集进行二次消歧,从而获得最终分词.通过实验对比,证明该方法具有良好的消歧效果.
其他文献
目的:探讨大肠癌近年来的发病情况、病理特点及诊断方法。方法:回顾性分析近4年来136例大肠癌的临床、肠镜及病理资料。结果:136例大肠癌中男75例,女61例,男女之比为1.23∶1。直
地理环境对人类社会的作用是一个古老而又现实的问题,历来受到人们的关注。目前人口、资源、环境、能源、粮食问题是人类面临的五大问题,实际上也是涉及地理环境和人类社会关系
主要对带电绝缘维护技术和带电清洗剂产品的化学、物理、环保性能进行了分析,研究提出了适用于通信设备带电绝缘维护系列清洗产品和施工作业流程,在运营商现网通信设备上进行
电气领域随着科技的发展逐渐趋向自动化,电气工程及其自动化技术也越来越成熟,被应用在更多的生活领域。智能建筑是根据现今时代的需求而发展的一种新型建筑,其使建筑行业向
采用分散聚合法合成聚苯乙烯微球(PS),并在其表面化学镀CuNi,得到PS@CuNi复合微球;以碳纳米管、PS@CuNi复合微球为填料,HDPE为基体,通过模压法制备HDPE/PS@CuNi/CNTs复合材料
近年来,随着鲜活农产品市场的快速发展,鲜活农产品供应链中各主体的市场行为决策及其相互作用影响着鲜活农产品的品质与安全.文章以供方、物流方和需方作为主体建立三方博弈
目的观察并探讨护理不良事件查房在护理安全管理中的应用。方法以2019年2月我院实施不良事件查房制度为界,将2018年8月至2019年1月入院患者设置为对照组,将2019年2月至2019年
目的探讨研究手术室细节护理在确保手术室护理安全中的应用效果。方法选取2016年5月~2018年5月于我院行手术治疗的患者中选取参与研究依从性较好且满足本次研究对象基本要求
期刊