论文部分内容阅读
"互联网用作语料库"是一种把互联网上的文本用作语料资源的新兴方法。互联网并非标准意义的语料库,但因包含庞大数量的文本而有具有不可忽视的实用价值。"互联网用作语料库"方法已广泛服务于语言数据挖掘以及语言学假设检验。目前已有数种专门化检索工具问世,同时直接应用通用型搜索引擎搜集语料是应用最广泛的方法。本文介绍"互联网用作语料库"的发展现状、基础理论、基本原理、应用策略与手段。