论文部分内容阅读
在分析跨语言检索平台建设原理的基础上,综合本人及其它学者相关研究成果,提出基于共现词语义标识的跨语言检索平台(以下简称:平台)建设的方法、模型。以科技论文中英文关键词、主题词作为语料库,通过词共现方式实现同义词、词性及相关语义的标识。由于关键词作为自然语言,具有广泛的表达适应性,作为平台与用户的接口语言;主题词作为控制语言,通过与副主题词的组配使用,可作为平台实现对检索词的逻辑语义表达的理解,实现信息的准确定位,从而使得跨语言检索平台具有良好的翻译与检索能力。