PAT-Array相关论文
中文分词是中文信息处理的基础,也是其一直存在的基本问题,有着极其广泛的实际应用。可以说,在各类中文信息处理软件(系统)中,中文分词......
阐述了基于后缀树的文本聚类(STC)算法,对其所存在的缺陷进行了分析,并在此基础上提出了采用PAT-array和模糊聚类相结合的方法对其......
随着互联网和社会的飞速发展,新词不断涌现。识别和整理这些新词语,是中文信息处理中的一个重要研究课题。提出一种新词识别方法,......