中文分词技术研究综述

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:xia226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】梳理中文分词领域的关键问题、算法和模型,为研究人员提供理论基础和实践指导。【文献范围】使用知网数据库、万方数据知识服务平台和计算机科学文献库DBLP检索中文分词相关文献,共选择109篇代表性文献进行综述。【方法】归纳中文分词的发展历程及关键问题,分类总结中文分词的算法和模型,并详述近期的热点研究问题。【结果】使用多个标注数据集的多准则分词模型是中文分词的研究难点,解决中文分词和自然语言处理其他子任务的多任务联合模型是当前研究的热点。【局限】没有深入对比分析中文分词的无监督学习方法。【结论】虽然现有的中文分词方法能在一定程度上满足诸多应用的需求,但是在大数据环境下多视角、多任务和多准则的联合模型研究仍存在挑战。
其他文献
我国的法定计量检定机构是政府设立的用于对产品能源效率的计量检测机构。《能源计量监督管理办法》的颁布更是为能效标识计量检测提供法律上的支持和保障。计量检测的顺利开
警告信号系统用于对危及飞行安全的故障提供视觉和听觉报警,使空勤人员及时采取必要的纠正措施。本文对飞机警告信号系统进行了简述,并着重对警告信号系统的组成、分类和各警
21世纪,国内许多城市都纷纷将城市的经济开放、市政建设、招商引资、旅游发展、环境改造和建立城市品牌联系在一起。在当今城市化进程加速的大背景下,打造城市品牌已成为有效
在某Fe–Cu基钻头配方中分别配以相同浓度、不同粒度及相同粒度、不同浓度的金刚石制作钻头,对比研究金刚石粒度、浓度对Fe–Cu基胎体钻头钻进性能的影响。结果表明:使用Fe–
2009年,安泽县国税局紧紧围绕省、市局国税工作会议和安泽县三级干部大会及全县财税会议的总体要求,贯穿“一条主线”.以科学发展观为统领,突出“两个重点”,即突出抓好组织收入和
为了提高地震资料各向异性参数谱的精度和分辨能力,基于各向异性介质反射波时距曲线方程,针对各向异性介质中纵波各向异性参数的提取技术,引人选择性相关法,对各向异性参数谱的绘
榆社县地税局在县委、县政府和市局党组的坚强领导下,在以潘涌泓局长为核心的领导班子引领下,以科学发展观为统领,以组织收入为中心,始终坚持"大税收、大服务"工作理念,全面
目的调查上海市某区"两病"(妇科病和乳腺病)筛查实施过程的满意度现况,从筛查供需方(筛查组织方、体检提供方和参检女性)多角度分析满意度的影响因素。方法采用自拟满意度调
各市、县人民政府,省人民政府各委、厅,各直属机构:2010年度全省重点工程建设项目已经省人民政府研究确定,现印发给你们。各地、省直有关部门及承建单位要认真按照我省重点工程管
近年来,我们乡宁县工商局按照省、市工商局和县纪委的部署要求,从乡宁局的实际出发,坚持把廉政风险、监管风险防范管理工作作为适应新形势、加强队伍管理、推进全面工作的抓