统计分词相关论文
我们已经进入一个信息革命的新时代,这个信息时代的显著特点是计算机在人类生活的各个方面,起着越来越大的作用。自然语言是人们最重......
随着计算机的普及和互联网的飞速发展,互联网上的信息资源数量正呈爆炸性的增长,用户从互联网上获取信息资源也日渐成为主要的信息......
藏文分词是进行藏文文本信息化处理的基础,是一切工作的核心步骤.文中对匹配和统计的藏文分词进行了研究,比较了各种算法的优劣势,......
翻译项目中翻译文档的分词效果的好坏直接决定了翻译的质量.目前存在的统计分词方法如互信息、t-测试度、接续指数等对高频词的提......
探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础。分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义......
在本文中,对自然语言处理的基础性问题中文分词进行了研究。在常见的基于词典的分词算法和基于统计的分词算法的基础之上,提出了一......
本文重点介绍了一个基于字符串匹配与基于统计相结合的中文分词方法,解决了一定条件下的人名,地名,数量词等未登录词以及交集型歧义和......
中文分词是中文信息处理的一个主要组成部分,也是文本挖掘、机器翻译、信息检索的基础。由于中文分词问题本身的复杂性,准确有效的......
本文将基于统计的二元分词方法应用于中文网页分类 ,实现了在事先没有词表的情况下通过统计构造二字词词表 ,从而根据网页中的文本......
歧义消解是中文分词的主要问题之一.提出了一种全切分与统计结合的分词算法,构造出基于统计词典的有向无环词图,利用动态规划算法......
本文阐述了一个中文文本分类系统的设计和实现,对文本分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细介绍,将基于......
中文分词作为搜索引擎以及自然语言处理的重要组成部分,是当前这一领域的研究热点和难点之一。文中首先分析了中文分词的特点,包含......
在综合比较了常用的机械分词方法和统计分词方法基础上.论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机......
本文对信息处理技术中各种分词方法进行了研究,针对目前分词方法无法识别网络中不断出现的新词,设计了一种新的基于统计的分词方法。......