统计词典相关论文
本文基于条件随机域模型处理中文命名实体中的人名、地名、组织机构名识别,综合利用外部特征,研究了字一级包括外国译名在内的中文......
针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,......
本文就互联网信息挖掘技术和对网络信息挖掘中的关键技术、系统流程进行了阐述....
中文分词是中文信息处理的一个主要组成部分,也是文本挖掘、机器翻译、信息检索的基础。由于中文分词问题本身的复杂性,准确有效的......
命名实体识别(NER)是信息抽取的基础模块,在信息检索、机器翻译、数据挖掘、自动文摘等领域发挥着重要作用。本文以条件随机域模型(......