论文部分内容阅读
基于上下文的词汇向量空间模型可以用来近似地描述词汇的语义.在此基础上定义的词汇相似关系或聚类关系可以应用于词典编纂、智能搜索引擎的开发等许多领域.本研究基于640万字的唐宋诗语料.在进行多字词计算机辅助提取的基础上,定义了相应的词汇语义的统计表达.建立了词汇相似关系的语义网络.开发了具有词义联想功能的面向概念的唐宋诗搜索引擎.实验表明,达到了接近实用的水平.