论文部分内容阅读
本文提出了一个基于XML数据表示的中文自然语言处理框架:语言技术平台(LanguageTechnology Platform,LTP)。LTP包括六个组成部分:基于LTML(Language Technology MarkupLanguage)的数据表示方法、基于LTML的语料库资源、面向中文的语言处理模块、基于动态链接库(DLL)的应用程序接口、可视化工具、以及网络服务WebService。LTP采用了分层的结构,涵盖了词法分析、句法分析以及语义分析等六项语言处理任务。LTP免费向学术界共享,很多研究单位已经在LTP基础上做出了科研成果。