统计分词相关论文
我们已经进入一个信息革命的新时代,这个信息时代的显著特点是计算机在人类生活的各个方面,起着越来越大的作用。自然语言是人们最重......
随着计算机的普及和互联网的飞速发展,互联网上的信息资源数量正呈爆炸性的增长,用户从互联网上获取信息资源也日渐成为主要的信息......
本文设计并实现了面向测试计量技术领域基于统计的分词系模型,并将其应用于产品的设计过程。该模型依托整个领域汉语理解系统实现......
探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础。分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义......
本文重点介绍了一个基于字符串匹配与基于统计相结合的中文分词方法,解决了一定条件下的人名,地名,数量词等未登录词以及交集型歧义和......
中文分词是中文信息处理的一个主要组成部分,也是文本挖掘、机器翻译、信息检索的基础。由于中文分词问题本身的复杂性,准确有效的......
本文将基于统计的二元分词方法应用于中文网页分类 ,实现了在事先没有词表的情况下通过统计构造二字词词表 ,从而根据网页中的文本......
歧义消解是中文分词的主要问题之一.提出了一种全切分与统计结合的分词算法,构造出基于统计词典的有向无环词图,利用动态规划算法......
本文阐述了一个中文文本分类系统的设计和实现,对文本分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细介绍,将基于......
中文分词作为搜索引擎以及自然语言处理的重要组成部分,是当前这一领域的研究热点和难点之一。文中首先分析了中文分词的特点,包含......
在综合比较了常用的机械分词方法和统计分词方法基础上.论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机......
本文对信息处理技术中各种分词方法进行了研究,针对目前分词方法无法识别网络中不断出现的新词,设计了一种新的基于统计的分词方法。......