全切分相关论文
随着科学技术的快速发展,英语中出现了大量的新增词汇.不可能在一部词典中完全收集所有单词,而语言的计算机处理需要知识许多未登......
该文在目前的书面汉语的分词和分析方法基础上,对基于全切分的分词方法作了进一步的研究.首先系统地讨论了全切分,提出了全切分的......
现有中文自动文摘技术存在原文内容覆盖不全面以及信息冗余的问题。针对上述问题,本文开展了相关的研究工作。结合已有的“统计全......
研究了哈萨克语自动词法分析中的附加成分的切分和词干提取问题,并实现了哈萨克语词法分析系统KazStemmer.系统首先对待切分词使用......
利用统计和规则相结合的算法从互联网的动态信息流中提取网络流行语。在利用全切分算法获取候选词集的基础上,依次对候选词集进行......
文章提出并讨论了一种并行全切分分词方法,给出了该方法在MIMD_SM上的并行分词体系结构模型。经过单CPU机上的模拟实验,证明该模型是......
文章设计新的数据结构对网店商品的原始数据进行加工处理,形成一个存储所有商品信息的词条字典。结合全切分算法,实现对用户输入关键......
交集型歧义是中文分词的一大难题,构建大规模高频最大交集型歧义字段(MOAS)的数据库,对于掌握其分布状况和自动消歧都具有重要意义。本......
研究了哈萨克语自动词法分析中的附加成分的切分和词干提取问题,并实现了哈萨克语词法分析系统KazStemmer。系统首先对待切分词使用......
给出了一个词库维护及检索系统,它采用基于PATRICIA tree的分词词典机制及灵活的词库维护及检索方法,不仅适用于传统的机械切分,更......
提出了一个改进的书面汉语全切分算法,它通过确保每次切分位置的唯一性,克服了全切分中普遍存在的重复切分。实验证明,改进后的全......
提出了一种以姓氏和互信息作为启发式信息探测潜在姓名,对上下文进行局部全切分,最后利用隐马尔科夫模型为工具识别姓名的新方法。......
随着目前网络技术的发展,我国的网络教育已经越来越普及化,而答疑系统与网络教育平台是紧密联系的,它是网络教学中的一个重要支点,......
在分析了现有各种汉语分词算法及其优缺点的基础上,提出以句子覆盖率和分词覆盖率作为评价分词方法的指标,详细介绍了基于网络有向......
文中首先讨论了书面汉语切分研究的问题,然后从一般性研究出发,提出了全切分算法中可能的并发检索。并针对全切分分词算法进行了研......
汉语自动分词是远程教育智能答疑系统的基础,如何根据远程教育智能答疑系统的特点进行相关分词算法的设计是提高答疑系统智能性,促进......
针对交集型歧义这一汉语分词中的难点问题,提出了一种规则和统计相结合的交集型歧义消歧模型。首先,根据标注语料库,通过基于错误驱动......
针对农业垂直搜索中中文分词要求的特殊性,提出-5基于词典和全切分的中文分词算法。该算法首先对经过预处理的网页进行基于词典的......
本文首先讨论了全切分研究的问题,然后从一般性出发提出了全切分的求解公式、切分树、全切分DAG(无环有向)图和全切分的抽象算法模......
随着我国网络技术的发展,计算机技术在各领域也得到了广泛的应用,其中一个重要的应用及典型的实例就是我国网络教育的普及化。而答疑......
学位
中文分词是中文信息处理的一个主要组成部分,也是文本挖掘、机器翻译、信息检索的基础。由于中文分词问题本身的复杂性,准确有效的......
建设高质量的标注语料库是维吾尔语信息处理领域的基础性工程。目前,在机器翻译、信息检索、Web文本挖掘等许多领域对语料库的使用......
歧义消解是中文分词的主要问题之一.提出了一种全切分与统计结合的分词算法,构造出基于统计词典的有向无环词图,利用动态规划算法......
针对书面汉语全切分中普遍存在的重复切分问题进行了研究.首先给出了重复切分的定义,然后分析指出切分歧义是引起重复切分的必然原因......
分词标注是中文信息处理的基础。传统方法的处理步骤大都是首先对文本进行预处理,得到文本的粗分模型,在此基础上对词语进行词性标......